人工智能的現(xiàn)狀:局部有精彩,整體很無奈
對(duì)照“人類智能”的概念和規(guī)律,可以更好地認(rèn)識(shí)人工智能研究的現(xiàn)狀,也可以更好地找到解決這些問題、實(shí)現(xiàn)突破和創(chuàng)新的辦法。
迄今,人工智能存在三種不同的研究路徑:1943年發(fā)端的模擬人類大腦皮層生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)研究(稱為結(jié)構(gòu)主義研究路徑)(McCulloch and Pitts, 2021; Rosenblatt, 1958; Hopfield, 1982; Rumelhart and McClelland, 1986),1956年興起的模擬人類邏輯思維功能的物理符號(hào)系統(tǒng)/專家系統(tǒng)研究(稱為功能主義研究路徑)(Newell, 1980; Turing, 1963; Newell and Simon, 1963; Nilsson, 1982),1990年加盟的模擬智能生物行為的感知?jiǎng)幼飨到y(tǒng)研究(稱為行為主義研究路徑)(Brooks, 1991; 1990),形成了人工智能研究的三個(gè)學(xué)術(shù)信仰各異故一直分道揚(yáng)鑣的學(xué)派。
到目前為止,三大學(xué)派各自都取得了不少精彩的局部進(jìn)展。其中,結(jié)構(gòu)主義的人工神經(jīng)網(wǎng)絡(luò)研究取得的典型成果,包括:比人類識(shí)別得更為精準(zhǔn)的模式識(shí)別(人臉識(shí)別、語音識(shí)別、圖像識(shí)別等)系統(tǒng),具有很強(qiáng)學(xué)習(xí)能力的各種深層神經(jīng)
網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)Deep Learning,自然語言處理的GPT系列等。功能主義的專家系統(tǒng)研究取得的典型成果,包括:戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫的Deep Blue系統(tǒng),擊敗兩位全美問題搶答冠軍的Watson系統(tǒng),擊敗李世石和柯潔等61位國際圍棋頂尖高手的基于深度學(xué)習(xí)的AlphaGo系統(tǒng)等。行為主義的感知?jiǎng)幼飨到y(tǒng)研究取得的典型成果,包括:自然語言人機(jī)對(duì)話的機(jī)器人Sophia,能在復(fù)雜環(huán)境中奔跑行進(jìn)和跳躍翻滾的波斯頓Dynamic機(jī)器人系列,能夠主持文娛晚會(huì)、在醫(yī)院陪護(hù)照料病人的服務(wù)機(jī)器人等。
這些精彩的人工智能進(jìn)展,加上一些人工智能科幻小說和科幻電影的渲染,使人們對(duì)人工智能取得的進(jìn)展大為訝異,甚至感到驚駭和恐懼,認(rèn)為人工智能機(jī)器的能力實(shí)在太厲害了,似乎很快就要達(dá)到超越人類能力的“奇點(diǎn)”并開始淘汰人類了。然而從全局的情況看,人工智能的研究其實(shí)面臨著十分嚴(yán)峻的挑戰(zhàn)和非常深刻的危機(jī)。具體的表現(xiàn)如下。
第一,由于人工智能三大學(xué)派“各自為戰(zhàn)”互不相容,因此,它們的所有進(jìn)展都是個(gè)案性、局部性和碎片性的應(yīng)用,難以移植,缺乏通用性,就連一些人們甚感驚嘆的效果表現(xiàn)也只是自然語言(圖形圖像也可以被理解為一種自然語言)處理領(lǐng)域的專用系統(tǒng),而不是通用系統(tǒng),更遑論統(tǒng)一的理論了。顯然,這對(duì)人工智能的普遍應(yīng)用和可持續(xù)發(fā)展十分不利。
第二,由于堅(jiān)持應(yīng)用“分而治之”和“純粹形式化”的研究方法,完全閹割了信息、知識(shí)和智能的內(nèi)涵(它們的價(jià)值因素和內(nèi)容因素),使得人工智能系統(tǒng)的智能成為了一種“空心的智能”“純形式的智能”,而非真正意義上的可以被理解的智能。它們的結(jié)果不可解釋,因而也不可信賴。正是因?yàn)榇嬖谶@種缺陷,人們戲稱“人工智能不智能”。
第三,更為嚴(yán)重的問題是,長期以來,人工智能研究形成了三大學(xué)派“各自為戰(zhàn)”的格局,無法形成合力,使人工智能的整體理論研究始終沒有取得明顯的進(jìn)展,而且這一狀況至今沒能得到解決。雖然在20世紀(jì)與21世紀(jì)之交出現(xiàn)了一批試圖建立通用人工智能理論的巨著(Nilsson,2006;羅素、諾維格,2006),但都沒有取得預(yù)期的成功。事實(shí)上,“整體被肢解,內(nèi)涵被閹割”成為了世界人工智能研究所遭受的最大傷痛。
因此,總的來說,人工智能研究的現(xiàn)狀是:局部有精彩,整體很無奈。
系統(tǒng)學(xué)原理表明:有機(jī)系統(tǒng)的整體不等于它所有的部分之簡單和,或者說,所有部分的簡單和,不可能構(gòu)成相應(yīng)的有機(jī)整體。顯然,整體的作用也遠(yuǎn)遠(yuǎn)大于各個(gè)部分作用之和。這就表明,如果繼續(xù)沿著三大學(xué)派“各自為戰(zhàn)”的研究路徑走下去,那么,無論它們將來各自取得怎樣豐富多彩的個(gè)案性、局部性、淺層性應(yīng)用成果,都不可能指望通過這些成果的“簡單和”就使“局部精彩”轉(zhuǎn)化為“整體精彩”,換言之,不可能指望通過這些成果的“簡單和”實(shí)現(xiàn)人工智能基礎(chǔ)理論的重大突破。
至此,不能不對(duì)ChatGPT和GPT-4的表現(xiàn)略加評(píng)述。許多人都對(duì)GPT系列作出了非常正面的評(píng)價(jià),認(rèn)為沿著這個(gè)方向發(fā)展下去,具有自主意識(shí)而且全面超越人類能力的通用人工智能出現(xiàn)就指日可待。更有甚者,有些人開始宣稱:GPT系列已經(jīng)通過了圖靈測試,人類要接受這些“有意識(shí)”“有生命”的強(qiáng)大的“新物種”,要學(xué)會(huì)與它們共處。
這是莫大的誤解。如上所說,無論是GPT系列,還是其他人工智能系統(tǒng),它們所利用的信息全都是形式化的“空心信息”。直覺告訴我們,沒有價(jià)值沒有內(nèi)容的純形式化的信息是無法理解的(除非這些信息是已知的舊信息)。然而,人工智能系統(tǒng)又不能不去理解它們,于是只能采取“統(tǒng)計(jì)方法”。他們?cè)O(shè)想,只要擁有足夠大(統(tǒng)計(jì)方法要求必須滿足樣本的遍歷性)的同類樣本,利用超高速的計(jì)算機(jī)就可以在這個(gè)超大樣本庫里搜索到與當(dāng)前面對(duì)的“問話樣本(關(guān)鍵詞組)”最相關(guān)(統(tǒng)計(jì)相關(guān)性最大)的樣本作為“答案”。因此,GPT系列必須擁有超大規(guī)模的預(yù)訓(xùn)練樣本庫,必須擁有超高速的計(jì)算系統(tǒng),才能及時(shí)找到與“問話(關(guān)鍵詞組)”統(tǒng)計(jì)相關(guān)性最大的“答案”,才能使問話者感到系統(tǒng)的回答是足夠合理的,系統(tǒng)是有智能的。
問題就在這里發(fā)生了:就算GPT系統(tǒng)找到了與“問話(關(guān)鍵詞組)”統(tǒng)計(jì)相關(guān)性最大的“答案”,絲毫也不表示系統(tǒng)就“理解了答案”,因?yàn)樗皇前凑战y(tǒng)計(jì)相關(guān)性的大小來挑選“答案”,并不真正理解這個(gè)答案是什么意思。這在某種程度上就像人們訓(xùn)練鸚鵡說話的情形。主人訓(xùn)練鸚鵡:當(dāng)有客人進(jìn)來的時(shí)候就高喊“歡迎光臨”。這種預(yù)訓(xùn)練是可以成功的:當(dāng)鸚鵡看到客人(在形態(tài)上與家人不同的人)進(jìn)來的時(shí)候,它就會(huì)高聲喊出:“歡迎光臨!”但這并不能說鸚鵡理解它喊出的是什么意思。
所以,GPT系統(tǒng)能夠與人們交談,而且有問必答,對(duì)答如流,但其實(shí)它并不知道其中含義。即GPT系統(tǒng)只具有統(tǒng)計(jì)相關(guān)性的計(jì)算能力,而沒有對(duì)概念的理解能力,當(dāng)然也就沒有解釋能力,因此,它不可信賴。
有人爭辯說:GPT系統(tǒng)通過了圖靈測試,難道還不能證明它有智能嗎?是的,通過了圖靈測試也不見得真有智能。其實(shí),圖靈測試本身存在許多問題。只看表面的效果,不問過程的實(shí)質(zhì),是圖靈測試的最大問題之一。因此,除了在游戲類領(lǐng)域之外,在那些需要對(duì)結(jié)果“較真兒”的大部分實(shí)際領(lǐng)域,圖靈測試方法不可應(yīng)用。
由于現(xiàn)有人工智能的研究堅(jiān)持了“純形式化”的方法,閹割了信息、知識(shí)、智能的內(nèi)涵,因此走上了“通過統(tǒng)計(jì)方法來實(shí)現(xiàn)認(rèn)知”的道路。然而,“統(tǒng)計(jì)方法”本身卻不是一個(gè)高明的認(rèn)知方法,不是一種高等的認(rèn)知途徑,因?yàn)檫@種認(rèn)知方法和道路不可能達(dá)到“理解”的目的。而“理解”則是“智能”的必要前提。
實(shí)際上,人類實(shí)現(xiàn)認(rèn)知的方式主要有三大類型,依次是:(1)嬰幼兒時(shí)期的“強(qiáng)記認(rèn)知”方式;(2)青少年時(shí)期的“從眾認(rèn)知”方式;(3)成年人時(shí)期的“理解認(rèn)知”方式。它們代表了人類認(rèn)知方式的進(jìn)步與成長歷程。
具體來說,“強(qiáng)記認(rèn)知”也稱為“盲從認(rèn)知”,這是嬰幼兒時(shí)期的認(rèn)知方式,也是人類的最初級(jí)認(rèn)知方式。嬰幼兒的活動(dòng)范圍局限于家庭,父母長者天然地成為嬰幼兒認(rèn)知的絕對(duì)權(quán)威。因此,父母長者說什么,他們就記住什么,基本上是死記硬背,幾乎沒有理解的成分。強(qiáng)記是一種最初級(jí)的認(rèn)知方式,但是,對(duì)一張白紙般的嬰幼兒來說卻是一種不可或缺的認(rèn)知方式。計(jì)算機(jī)的灌輸,就是“強(qiáng)記認(rèn)知”的技術(shù)版。
“從眾認(rèn)知”是青少年時(shí)期的認(rèn)知方式,相較于“強(qiáng)記認(rèn)知”進(jìn)了一步。青少年的活動(dòng)范圍突破了家庭限制,走進(jìn)了社會(huì)和學(xué)校,“公眾(包括媒體、書本、教師等社會(huì)知識(shí)傳播主體)”成為了青少年認(rèn)知的權(quán)威。因此,它的準(zhǔn)則是“多者為真”:只要是多數(shù)人認(rèn)可的,即使自己不理解也會(huì)被認(rèn)可、被接受。統(tǒng)計(jì)技術(shù),就是“從眾認(rèn)知”方式的學(xué)術(shù)版。統(tǒng)計(jì),對(duì)于處理隨機(jī)事件來說是一個(gè)科學(xué)的方法;可是作為一種認(rèn)知方式卻只算是一種“二流”的方式。
顯然,最高級(jí)的認(rèn)知方式是理解認(rèn)知:無論什么問題,只有自己理解了,才會(huì)被接受,才會(huì)被認(rèn)可。在這里,所謂“理解”了某個(gè)事物,就是既懂得了這個(gè)事物的外部“形態(tài)”,尤其懂得了這個(gè)事物對(duì)于自己所追求的“目標(biāo)”而言究竟是有利還是有害、利害幾何,因而懂得這個(gè)事物的內(nèi)涵。所以,在理解的基礎(chǔ)上去做決策,決策會(huì)更明智合理、有智能水平。這是成年人特別是接受了高等教育的成年人的自主認(rèn)知方式。
由此可見,現(xiàn)有人工智能理論和系統(tǒng)的認(rèn)知方式只是基于形式信息和形式知識(shí)的“從眾認(rèn)知”,也就是統(tǒng)計(jì)認(rèn)知,它們“認(rèn)可”的結(jié)論“很可能是對(duì)的(但也可能是錯(cuò)的)”,但卻沒有“理解”的保障:統(tǒng)計(jì)的結(jié)果“最好”,不等于現(xiàn)實(shí)的“最好”。這就是為什么人們總在不斷追究和質(zhì)疑現(xiàn)有人工智能的“理解能力”、“可解釋性”和“可信賴性”的原因。
對(duì)照前文分析的“人類智能”的基本概念和基本原理可以看到,當(dāng)今“局部有精彩,整體很無奈”的人工智能研究現(xiàn)狀與“人類智能”的原型榜樣之間確實(shí)存在巨大的差異。于是,人們便不能不嚴(yán)肅地思考:為什么人工智能的研究存在這么嚴(yán)重的問題?這些問題的根源是什么?人工智能基礎(chǔ)理論的重大突破與創(chuàng)新,究竟路在何方?
人工智能現(xiàn)狀的根源:學(xué)科范式“張冠李戴”
作為學(xué)科的源頭而且影響學(xué)科全局的學(xué)科研究范式(科學(xué)觀和方法論)在人工智能的研究中發(fā)生了偏差。在《科學(xué)革命的結(jié)構(gòu)》一書中,庫恩把“范式”主要理解為世界觀和行為方式(庫恩,1980)。在科學(xué)研究領(lǐng)域,世界觀就是科學(xué)觀,行為方式就是科學(xué)研究的方法論。科學(xué)觀在宏觀上闡明“這個(gè)學(xué)科的本質(zhì)是什么”;方法論在宏觀上闡明“應(yīng)當(dāng)怎樣研究這個(gè)學(xué)科”。于是,作為科學(xué)觀和方法論有機(jī)整體的范式,就在宏觀上規(guī)范了這個(gè)學(xué)科應(yīng)當(dāng)遵循的研究方式。
盡管庫恩也曾經(jīng)把“范式”解釋為模式、模型、典范、范例、案例等,同時(shí),“范式”這一詞語也常常被用來表達(dá)更為具體的“工作方式”,如實(shí)驗(yàn)的范式、計(jì)算的范式、編程的范式等,但是更為嚴(yán)謹(jǐn)?shù)睦斫飧嬖V我們,學(xué)科“范式”更為準(zhǔn)確的理解應(yīng)當(dāng)是“學(xué)科的科學(xué)觀和方法論的統(tǒng)稱”。這是因?yàn)?,具體的模式、模型、典范、范例、案例,具體的編程范式、計(jì)算范式、實(shí)驗(yàn)范式等,只能描述和表征一些具體的局部的工作程式,它們都不足以成為“學(xué)科是否要革命”的最高判據(jù),只有學(xué)科的科學(xué)觀和方法論才具備這種表征能力。
事實(shí)上,科學(xué)研究的活動(dòng)存在井然有序的層次體系,從低到高依次是:(1)研究的具體問題、與問題相關(guān)的數(shù)據(jù)、研究問題所需要的目的要求等屬于“研究的原始資源層次”;(2)開展研究活動(dòng)所需要的編程語言、算法工具、算力工具、測量工具、記錄工具等屬于“研究的工具層次”;(3)支持研究活動(dòng)的學(xué)科理論、分析方法、研究模型等屬于“研究的理論層次”;(4)在全局上和整體上引領(lǐng)和規(guī)范研究活動(dòng)的科學(xué)觀和方法論屬于“研究的指導(dǎo)思想層次”。
可見,一個(gè)學(xué)科的科學(xué)觀和方法論是指導(dǎo)、引領(lǐng)和規(guī)范這個(gè)學(xué)科的整體研究活動(dòng)的最高力量,是“看不見”然而又時(shí)時(shí)刻刻、實(shí)實(shí)在在發(fā)揮著指導(dǎo)作用的“指揮棒”。因此,只有科學(xué)觀和方法論才能成為“學(xué)科是否要發(fā)生革命”的關(guān)鍵判據(jù)。
這樣,就可以用一個(gè)表達(dá)式來定義學(xué)科的范式:
P=Int(V,M)
其中,P代表學(xué)科的范式,V代表與學(xué)科性質(zhì)相符的科學(xué)觀,M代表學(xué)科應(yīng)當(dāng)遵循的方法論,Int代表科學(xué)觀與方法論的整體作用。
為了
追根尋源查明造成人工智能現(xiàn)狀的根本原因,最重要的是要站在學(xué)科研究的制高點(diǎn)——“范式”的高度上深入考察學(xué)科發(fā)展的情況,以便從中找到問題的根源,并從根源上解決問題。這是一切原創(chuàng)性科學(xué)研究所不能回避的原則。
表1用直觀清晰的列表方式,描述了學(xué)科的“范式”在學(xué)科的科學(xué)研究活動(dòng)(包括學(xué)科的自下而上摸索和自上而下建構(gòu))體系中所處的地位和作用。
表1說明,學(xué)科的發(fā)展一般都要經(jīng)歷前后相繼的兩個(gè)基本階段,即首先是自下而上摸索范式的初級(jí)階段,接著是自上而下貫徹范式有序建構(gòu)的高級(jí)階段。這兩個(gè)階段是辯證統(tǒng)一的,既不可或缺,也不可顛倒。
初級(jí)階段的任務(wù)是要摸索:(1)這個(gè)學(xué)科的本質(zhì)是什么;(2)應(yīng)當(dāng)怎樣來研究和發(fā)展這個(gè)學(xué)科。顯然,前者就是關(guān)于這個(gè)學(xué)科的科學(xué)觀,后者就是研究這個(gè)學(xué)科所需要遵循的方法論。如上所述,科學(xué)觀和方法論的統(tǒng)稱就是范式。可見,初級(jí)階段的任務(wù)就是要明確學(xué)科的范式,也就是明確學(xué)科的定義。而一旦明確了學(xué)科的定義,就具備了必要的條件可以轉(zhuǎn)入學(xué)科研究與發(fā)展的高級(jí)階段,即學(xué)科的有序建構(gòu)階段。
需要特別指出的是,自下而上的摸索階段是最為困難的工作階段,需要經(jīng)過特別漫長的試探、摸索、失敗、停頓、反思、再摸索、局部成功、局部的檢驗(yàn)、盲人摸象式的爭論、逐步總結(jié)等痛苦的過程,因此往往經(jīng)歷很長(大約是世紀(jì)級(jí))的時(shí)間。
高級(jí)階段的任務(wù)是要自上而下地完成:(1)根據(jù)自下而上摸索總結(jié)出來的范式(學(xué)科的定義)來落實(shí)學(xué)科的定位(建立學(xué)科框架,包括構(gòu)筑學(xué)科全局模型和確立學(xué)科研究路徑);(2)基于學(xué)科的定義和定位確立學(xué)科的精確定格(闡明學(xué)科的規(guī)格,包括學(xué)科內(nèi)涵結(jié)構(gòu)的規(guī)格和學(xué)科數(shù)理基礎(chǔ)的規(guī)格);(3)根據(jù)學(xué)科的定義、定位和定格,實(shí)現(xiàn)學(xué)科內(nèi)容的完整定論(形成學(xué)科的理論,包括學(xué)科的基本概念和基本原理),完成學(xué)科理論的整體建構(gòu)。
可見,學(xué)科的建構(gòu)就是要由宏觀的定義(范式),到整體的定位(框架),再到精準(zhǔn)的定格(規(guī)格),最后到內(nèi)容的定論(理論),一步一步地走向具體、走向落實(shí)。于是,作為學(xué)科宏觀定義的范式,是整個(gè)學(xué)科研究與發(fā)展的源頭和根本,影響著整個(gè)學(xué)科建構(gòu)的全程。
由此可以作出明確的判斷:造成人工智能理論現(xiàn)狀的根本原因,必定是作為學(xué)科的源頭而且影響學(xué)科全局的學(xué)科研究范式(科學(xué)觀和方法論)發(fā)生了偏差,而不會(huì)僅僅是某些中低層次(如資源層次、工具層次、理論層次)的缺陷??傊?,“整體很無奈”的根源必定在范式,這就是結(jié)論。
人工智能研究所實(shí)際遵循的范式,并不是信息學(xué)科的范式,而是傳統(tǒng)物質(zhì)學(xué)科的范式。人工智能是開放、復(fù)雜、高級(jí)的信息系統(tǒng),是信息科學(xué)的高級(jí)篇章。表2所列出的信息技術(shù)演進(jìn)歷史有力地證實(shí)了這個(gè)判斷。
信息學(xué)科的定義也支持了這個(gè)判斷。這個(gè)定義指出:信息學(xué)科的研究對(duì)象是信息及其生態(tài)過程,研究內(nèi)容是信息的性質(zhì)及其信息生態(tài)規(guī)律,研究方法是信息生態(tài)方法論,研究目標(biāo)是擴(kuò)展“作為人類全部信息功能有機(jī)整體”的智能功能。
可見,擴(kuò)展信息獲取、信息傳遞、信息處理、信息執(zhí)行等信息功能以及這些信息的復(fù)合功能只是信息科學(xué)的初等研究目標(biāo);擴(kuò)展人類的智能功能才是信息科學(xué)的長遠(yuǎn)研究目標(biāo)。
按照學(xué)科范式的定義,具有不同研究對(duì)象的各個(gè)學(xué)科大類,都應(yīng)當(dāng)擁有自己的科學(xué)觀和方法論,遵循自己的研究范式。既然人工智能是信息學(xué)科的高級(jí)篇章,人工智能學(xué)科的研究與發(fā)展就應(yīng)當(dāng)遵循信息學(xué)科的范式。
然而一個(gè)令人驚訝的發(fā)現(xiàn)卻是(鐘義信,2021a):數(shù)十年來,人工智能研究所實(shí)際遵循的范式,并不是信息學(xué)科的范式,而是傳統(tǒng)物質(zhì)學(xué)科的范式(見表3)。
表3說明,現(xiàn)行人工智能的研究范式犯了“張冠李戴”的大忌:它實(shí)際所遵循的科學(xué)觀基本是“物質(zhì)學(xué)科范式的科學(xué)觀”,而它所遵循的方法論是完全的“物質(zhì)學(xué)科范式的機(jī)械還原方法論”。