隨著人工智能技術(shù)的飛速發(fā)展,大模型以強(qiáng)大的數(shù)字處理能力和深度學(xué)習(xí)能力,不斷與各領(lǐng)域交叉融合,逐步成為產(chǎn)業(yè)創(chuàng)新的關(guān)鍵抓手和驅(qū)動(dòng)新質(zhì)生產(chǎn)力的關(guān)鍵引擎。大模型如何改變我們的生活,又如何賦能千行百業(yè)?未來的發(fā)展又將走向何方?在近日舉辦的2023中國人工智能產(chǎn)業(yè)年會(huì)上,與會(huì)專家學(xué)者對(duì)此進(jìn)行了深入討論。
擁抱更多應(yīng)用場景
論壇上,北京航空航天大學(xué)教授徐邁用一段國產(chǎn)大模型Kimi生成的演講詞開場:大模型與通用人工智能是一個(gè)充滿活力引領(lǐng)未來的領(lǐng)域……大模型讓交互體驗(yàn)變得更豐富真實(shí),其可以稱之為真正意義上的人工智能。
作為當(dāng)下最強(qiáng)勁的人工智能技術(shù),大模型之“大”,不僅在于其規(guī)?;瘏?shù)眾多,更在于它所蘊(yùn)含的巨大潛力和廣闊應(yīng)用場景。除了常見的內(nèi)容生成外,在自動(dòng)駕駛、智慧醫(yī)療、工業(yè)互聯(lián)網(wǎng)等眾多領(lǐng)域,大模型都展現(xiàn)了優(yōu)勢,真正做到了賦能千行百業(yè)。
中國工程院院士、同濟(jì)大學(xué)校長鄭慶華表示,大模型已成為當(dāng)前人工智能的巔峰,像過去對(duì)蛋白質(zhì)精確結(jié)構(gòu)的預(yù)測可能要幾個(gè)月,還要數(shù)以千計(jì)的人才能完成,如今在大模型分析支持下,僅用幾分鐘就可以生成結(jié)果。
月之暗面Kimi、百度文心一言、科大訊飛星火大模型……通用大模型如雨后春筍般涌現(xiàn),大模型產(chǎn)業(yè)的應(yīng)用落地也進(jìn)一步提速。科大訊飛副總裁、研究院院長劉聰介紹,作為國產(chǎn)通用大模型的代表,星火大模型在賦能產(chǎn)業(yè)方面表現(xiàn)強(qiáng)勁,目前已與奇瑞汽車合作打造了大模型座艙,率先讓國產(chǎn)大模型在智能座艙領(lǐng)域應(yīng)用并產(chǎn)生實(shí)效。
對(duì)特定場景而言,并非所有企業(yè)都需要通用大模型的“全能”,而是更需要模型的精度。深信服科技股份有限公司安全GPT業(yè)務(wù)主管訾然表示,相較于通用大模型,想要更快實(shí)現(xiàn)技術(shù)商業(yè)化運(yùn)營,讓用戶愿意為之買單,垂直大模型在落地上可能更有優(yōu)勢。
作為常年深耕網(wǎng)絡(luò)安全領(lǐng)域的從業(yè)者,訾然認(rèn)為,當(dāng)前的網(wǎng)絡(luò)攻擊者已經(jīng)在利用大模型改進(jìn)他們的攻擊手法,傳統(tǒng)檢測器難以識(shí)別,而安全GPT檢測大模型在惡意代碼理解能力、攻防對(duì)抗理解能力、安全基礎(chǔ)知識(shí)能力等方面都超越通用大模型,且推理成本低,準(zhǔn)確性高,便于落地。目前他所在團(tuán)隊(duì)開發(fā)的垂直大模型已為130余家企業(yè)提供服務(wù)。
環(huán)境污染治理也成為目前垂直大模型落地的主要領(lǐng)域之一。北京工業(yè)大學(xué)副校長喬俊飛帶領(lǐng)的團(tuán)隊(duì)在污染防治過程智能特征建模、自組織控制和多目標(biāo)動(dòng)態(tài)優(yōu)化等方面取得了不少創(chuàng)新成果。喬俊飛表示,過去環(huán)境污染防治難以建立解析模型,主要依靠人工決策,而垂直大模型的落地為環(huán)境污染治理提供了技術(shù)支撐,依托數(shù)據(jù)就能對(duì)污染處理作出更加客觀精準(zhǔn)的判斷,實(shí)現(xiàn)科學(xué)治污、精準(zhǔn)治污。
還需淬煉多重能力
在給生產(chǎn)生活帶來巨大變遷的同時(shí),人工智能大模型在數(shù)據(jù)、算力和算法等方面仍面臨挑戰(zhàn)。
一方面,算力是人工智能大模型的“燃料”。獲得“吳文俊人工智能最高成就獎(jiǎng)”的鵬城實(shí)驗(yàn)室主任、中國工程院院士高文表示,沒有算力就無法做人工智能。如果想要讓用戶像用電一樣方便地使用算力,就需要解決數(shù)據(jù)安全和結(jié)果傳輸?shù)葐栴}。對(duì)此,鵬城實(shí)驗(yàn)室正牽頭推進(jìn)“中國算力網(wǎng)”研發(fā)與建設(shè),由其建設(shè)的“鵬城云腦”在超級(jí)算力節(jié)點(diǎn)方面產(chǎn)生了很好的效果,為后續(xù)國產(chǎn)算力生態(tài)建設(shè)發(fā)揮了重要作用。
另一方面,高價(jià)值數(shù)據(jù)為大模型提供了持續(xù)不斷的“原材料”。模型參數(shù)規(guī)模越大,對(duì)數(shù)據(jù)的規(guī)模和質(zhì)量要求也就越高。鄭慶華表示,高價(jià)值數(shù)據(jù)就如同礦產(chǎn)資源并非取之不盡、用之不竭。有專家預(yù)測到2026年大規(guī)模語料可挖掘價(jià)值將基本消耗殆盡,在大數(shù)據(jù)上再訓(xùn)練出有價(jià)值數(shù)據(jù)的難度較大。另外,目前中文語料庫所占比例不高,有數(shù)據(jù)顯示在ChatGPT訓(xùn)練數(shù)據(jù)中,中文語料比重不足千分之一。
與此同時(shí),大模型的災(zāi)難性遺忘也引發(fā)業(yè)界廣泛關(guān)注。災(zāi)難性遺忘是指在新任務(wù)上訓(xùn)練會(huì)損害之前任務(wù)的性能。在問題求解階段,無法記住處理過的數(shù)據(jù)或場景。例如,在無人駕駛中,人對(duì)道路情況有記憶,但自動(dòng)駕駛無法記憶,每次都要重新計(jì)算,因此消耗了大量算力和電力。
如何更好推動(dòng)人工智能大模型技術(shù)由弱到強(qiáng)?鄭慶華建議,可以從3條技術(shù)路線入手,一是依托大數(shù)據(jù)、大算力和強(qiáng)算法來推動(dòng)大模型發(fā)展,也就是在原本技術(shù)路線上做延長工作;二是用“神經(jīng)+符號(hào)”協(xié)同的方式,將神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)性、普適性與符號(hào)推理的可解釋性、可組合性進(jìn)行結(jié)合;三是人腦記憶啟發(fā)的機(jī)器記憶智能模型,此舉有望破解當(dāng)前大模型存在的一些固有缺陷。
積極探尋發(fā)展路徑
談到大模型未來的發(fā)展趨勢,不少專家都提到與具身智能的結(jié)合,而人形機(jī)器人便是最好的載體之一。到底大模型跟機(jī)器人是什么關(guān)系呢?
劉聰舉了這樣一個(gè)例子:想要去抽屜里拿一包薯片放在桌子上,大模型會(huì)基于對(duì)這件事情的理解做出規(guī)劃,即打開抽屜、拿出薯片,再把抽屜關(guān)上,這更像是一種離身智能。但如果和具身智能結(jié)合,就會(huì)將剛才這個(gè)指令分解,并將每個(gè)指令對(duì)應(yīng)結(jié)合,通過控制機(jī)器人來實(shí)現(xiàn)行動(dòng)。
西北工業(yè)大學(xué)光電與智能研究院研究員趙健表示,當(dāng)前人工智能模型正在不斷拓展到多模態(tài)領(lǐng)域,而具身智能與多模態(tài)大模型相結(jié)合,可以實(shí)現(xiàn)更高層次的感知、理解和決策,使人工智能有效應(yīng)對(duì)現(xiàn)實(shí)世界中存在的各種復(fù)雜情境,為多個(gè)領(lǐng)域帶來廣闊的應(yīng)用前景,成為連接AI和實(shí)際生活的橋梁和紐帶。
今年的《政府工作報(bào)告》提出,深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開展“人工智能+”行動(dòng),打造具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。
針對(duì)“人工智能+”行動(dòng),鄭慶華認(rèn)為,從學(xué)科體系的建設(shè)和人才培養(yǎng)來說,不光要講理念和方法,更重要的是付出實(shí)際行動(dòng)。一是要提出明確的舉措,將人工智能賦能作為推動(dòng)創(chuàng)新發(fā)展、實(shí)現(xiàn)新質(zhì)生產(chǎn)力的重要手段。通過改造傳統(tǒng)的培養(yǎng)方案課程體系,讓人工智能技術(shù)成為一種基本能力。二是改造傳統(tǒng)實(shí)驗(yàn)平臺(tái)和實(shí)驗(yàn)方式,能夠真正動(dòng)手去研究算法,體驗(yàn)人工智能從設(shè)計(jì)、開發(fā)到應(yīng)用的全過程。
從行業(yè)發(fā)展的角度看,訾然表示,各行各業(yè)的從業(yè)者應(yīng)該盡可能多地去學(xué)習(xí)和擁抱大模型,探尋發(fā)展路徑,讓大模型更好賦能千行百業(yè)發(fā)展。
鄭慶華表示,大模型在走向認(rèn)知智能的過程中,很多理論和技術(shù)問題依然有待突破。未來通過不斷的研究,希望能研制出一種新的基于人腦記憶啟發(fā)的機(jī)器模型,最終突破大模型的能力上限,實(shí)現(xiàn)自立自強(qiáng),也為我們打造自主知識(shí)產(chǎn)權(quán)的人工智能底座和模型作出新的貢獻(xiàn)。