(1)在論文「On computable numbers with an application to the Entscheldungs problems」(1936)中,圖靈提出了「圖靈機」,奠定了其「計算機之父」的地位。在這篇論文中,圖靈指出,圖靈可計算和一般遞歸函數(shù)等價,通過暴力計算可以逼近無限。
(2)在論文「What is Life? The Physical Aspect of the Living Cell」(1943)中,薛定諤提出了其對活細胞的物理觀。他指出,生命賴負熵為生,機器賴秩序為生,機器可作為認知的載體。
(3)論文「Cybernetics, or Control and communication in the animal and the machine」(1948)告訴我們,控制和交互可以實現(xiàn)具身智能。
(4)在論文「Computing Machinery and Intelligence」(1950)中,圖靈仔細闡述了通過機器產(chǎn)生「思維」的方法,指出可以從教育「兒童程序」開始,用對話做圖靈測試。奠定了其「人工智能之父」的地位。
(5)在論文「The Human Use of Human Beings: Cybernetics and Society」(1950)中,維納指出,機器和人類分別有各自的智能,應該交互認知、迭代發(fā)展。
「迭代」的英文單詞為「Iteration」,「交互」的英文單詞為「Interaction」,他們具有意義相近的詞根。我們不妨思考迭代與交互、交互與輸入輸出、迭代與進化的關系,從而幫助我們理解上述五篇論文。

如上圖所示,如果我們將李白的《靜夜思》翻譯為英文,再翻譯回中文,并將這一過程重復兩次,最后得到的中文輸出與原詩的意思出入很大,這種語義發(fā)散的現(xiàn)象體現(xiàn)了自然語言翻譯系統(tǒng)逐漸積累的不確定性。這里的翻譯過程是一個「輸入-輸出」過程,每一步之間存在延遲。而在交互過程中,交互雙方應該同時工作。下一代人工智能研究需要更加注重交互和迭代關系。
在這里,我們需要明晰「迭代」和「遞歸」的關系。迭代是往前走,是形而上的。迭代是循環(huán)的活動,某次迭代的結果會作為下次迭代的初值,不斷更新,累積發(fā)展。例如,人腦中知識的長期記憶,就是這樣自我復用,迭代成長的,又例如人類社會中的科學和技術也是迭代發(fā)展的。
遞歸則是往回找,是形而下的。遞歸是指在函數(shù)的定義中使用函數(shù)自身,每一次回溯稱為一次遞歸,需要用到前一次的值。例如,斐波那契數(shù)就是通過遞歸求得的,又例如智能機器中的程序常常是遞歸執(zhí)行的,我們需要通過編譯系統(tǒng)將高級語言編譯為機器語言。
機器通過時序和交互來維持負熵。達爾文的物種進化理論為我們探究生命本源和物種進化提供了基礎的理論。薛定諤、克里克、坎德爾這三位諾貝爾獎獲得者對進化論的進一步發(fā)展也做出了巨大貢獻。就機器的生命觀而言,我們需要從進化論(物種多樣性)、遺傳學(基因工程,機器的遺傳信息傳遞)、細胞學(認知神經(jīng)生物學,尤其是學習和記憶)等角度展開討論。李德毅院士指出,農耕時代和工業(yè)時代的機器并不能算是生命。農耕時代的工具通常由「實體物質」和「虛體結構」這兩個要素組成,結構直接寄生在物質上,形成「硬構體」。例如:輪子、大刀、長矛。當我們將樹干鋸開成樹墩,兩個平面就變成了切菜板,此時它可以完成一定的功能,并不是單純的物質。工業(yè)時代的機器則由「物質」、「結構」、「能量」這三個要素組成,結構寄生在物質和能量上,形成硬構體。在智能時代,機器(例如,自動駕駛汽車)具備四個要素:物質、能量、結構和時間。物質和能量是物理層面的真實存在,結構和時間是認知層面的抽象思維,用結構思考物質在空間的拓撲幾何關系,用時間思考物質的運動變化,以及能量的流動轉化。結構和時間寄生在物質和能量上稱為硬構體(例如,車底盤、集成電路芯片),機器里的信息是大量的「軟構體」(例如,駕駛腦程序、地圖、交通規(guī)則),體現(xiàn)精神,它們寄生在硬構體或者已有的其它軟構體之上,可以自我復用,機器的秩序顯示出維持自身和產(chǎn)生有序事件的能力,體現(xiàn)在認知和行為兩個方面。
如上圖所示,結構和時間存在于認知空間中,而能量與物質存在于物理空間中。結構和時間構成軟構體,軟構體是信息的基礎,他們寄生在物質和能量上構成硬構體。能量和物質的關系遵循質能方程。
概念、消息、信息和知識都是軟構體,用軟構體思維體現(xiàn)人的想象力和創(chuàng)造力,體現(xiàn)精神世界,是物理世界在人之空間的鏡像,是虛擬的現(xiàn)實。而硬構體填補了物質能量和信息之間的鴻溝,使得信息和物質難舍難分。既不是單純的物質能量也不是單純的信息,好比「薛定諤的貓」。當前的集成電路芯片就是硬構體的「爆品」,稱為人工智能「卡脖子」技術的代表。舉例而言,作曲家創(chuàng)作的樂曲是軟構體,表達的是信、情感、藝術技巧和人文風格。同一首樂譜可以在不同的硬構體(樂器)上表現(xiàn)出來,無論用哪種硬構體支撐,表現(xiàn)的都是同一首樂曲。樂譜是精神的、非物質的,人們聽到的樂曲是客觀存在的聲音藝術,蘊含了物質、能量、結構和時間,體現(xiàn)美,也體現(xiàn)知行合一。智能在認知空間里是精神的,在物理空間里是物質的、具身的。
硬構體可以局部軟化成軟構體,例如:虛擬機器人;軟構體也可以局部固化為硬構體,如可交互、會學習、自成長的輪式機器人。物質和精神不同,但不是軟件定義一切。
從活細胞的物理觀來看,生命是「機器」;從機器的生命觀來看,機器是「生命」。具體而言,「物理層-物質」、「生化層-能量和時鐘」、「生理層-電子電路和機器指令」、「心理層-操作系統(tǒng)和中間件」、「認知層-高層軟件和數(shù)據(jù)」相對應。時間是機器認知的奠基石。機器里有物質、能量、結構和時間,時鐘依賴能量,時間依賴時鐘,秩序依賴時間。軟構體寄生在硬構體上,機器自舉實現(xiàn)思維自動化,自我復用實現(xiàn)認知自成長,機器運行靠程序,程序靠時序,軟件靠交互,時序和交互產(chǎn)生負熵,機器賴負熵為生。時鐘不停,與外界交互不息,思維和認知不息。人的想象力和創(chuàng)造力提高了軟構體的質量和數(shù)量,體現(xiàn)為語言和心理。要追蹤圖靈 24 歲之后的學術思想,了解他如何從「計算機之父」走向「人工智能之父」,尤其要讀圖靈全集的第三卷「機器智能」、第四卷「數(shù)學生物學」(第一卷為數(shù)學、第二卷為邏輯學)。自然進化的人類借助簡單的工具,計算圓周率 π 的小數(shù)位十分艱難。而 1950 年 ENIAC 誕生之后,就將計算出了 π 的 2037 個小數(shù)位,1954 年 NORC 用 13 分鐘計算出了 π 的 3089 個小數(shù)位。到 2011 年,超級計算機已經(jīng)計算出了 π 小數(shù)點后萬億位。歷史告訴我們,依靠人力計算 π 值,小數(shù)點精度提高 1 個位數(shù)需要用 1700 年,再提高 4 位需要 800 年;依靠圖靈機計算,軟構體復用,如果機器的時鐘精度足夠高,機器執(zhí)行硬指令的時間周期足夠小,π 的小數(shù)點精度提高到 10^12 位,僅用了 70 年。如果每個人一秒鐘完成一次「乘加」的人力計算,那么全球 70 億人需要花費 4 年時間才能完成超級計算機一秒鐘的計算量。人們討論生物自然進化現(xiàn)象,常用的時間尺度是「萬年」;討論人類文明生態(tài)現(xiàn)象和體外智能,常用的時間尺度是「千年」;討論人類思維和認知的進步,即科學技術的發(fā)展,常用的尺度是「百年」甚至「十年」。如果說,人類的生物進化出的本能是相對穩(wěn)定的,科學技術和機器智能的發(fā)展卻是天翻地覆的,這種迭代的智能導致的幾何級數(shù)增長的認知進步和知識爆炸成就了人類,科學技術成為人類社會發(fā)展的第一生產(chǎn)力。隨著計算機時鐘精度巨大提升,CPU 的工作頻率同步提升,相當于幼兒機器語言指令(無論是復雜指令集還是精簡指令集)的執(zhí)行周期大大縮短,算力暴漲,當今機器圍棋程序和蛋白質折疊結構預測超過人腦,不足為怪,更重要的是可以反過來促進人腦的智力發(fā)展。圖靈在他 38 歲發(fā)表的歷史文獻《計算機械與智能》中,開宗明義地要大家思考「機器能否思維」,他分析并駁斥了 9 種對思維機器的反對意見:(4)機器不僅能創(chuàng)作,還要能意識到自己是在創(chuàng)作;(5)機器該不該出錯?機器可以成為自己思維的主體嗎?圖靈主張教機器學習,只要機器在語言行為(對話)上和人沒有明顯差別,就是能思維或有智能了,這就是后人所稱的「圖靈測試」。他認為,可以編制一個「兒童程序」,它是一種寄生在硬構體「幼兒認知核」上的軟構體。然后對其進行教育(指導學習、自主學習),從而達到成人的智力水平。從幼兒認知核的角度來看,目前學術界關注的神經(jīng)網(wǎng)絡系統(tǒng)對應人腦的大腦皮層系統(tǒng),包括前頭葉、頭頂葉、側頭葉、后頭葉四大塊。然而,人腦十分豐富,還包含腦干、腦髓、胸髓、中樞神經(jīng)等部分。幼兒認知核將智能基因移植過來,體現(xiàn)大腦新皮質學習的本能,可自舉,可自我復用,可成長。
進化論告訴我們,意識、情感、欲望和性格比新皮質早了幾億年,不在同一條起跑線上。人的智能體現(xiàn)在 300 萬年來大腦皮層的進化上。目前,研究人工智能還不能一蹴而就地同時研究上述五個層面,可以先排除意識、情感、欲望和性格,單獨將智能抽離出來。如上圖所示,紅色部分為 2 億多年前爬行動物的烙印,黃色部分為 1 億多年前哺乳動物的烙印。學習是「感知-認知-行為」的循環(huán)過程。認知不可能獨立于感知和行為,因此需要克服圖靈機的兩個局限:(1)孤立了認知,忽視了機器具身與環(huán)境的交互;從生命科學的角度來講,學習、記憶、教育十分重要。學習是一個交互的過程,包含指導學習和自主學習。此外,瞬時記憶、工作記憶、長期記憶的分工是人類進化的重要標志,才產(chǎn)生了歷史和人類文明。同一主體的豐富軟構體大致自洽,是弱統(tǒng)一體;靠記憶形成邊界來約束思維。記憶先于計算、優(yōu)于計算。各智其智、智人之智、智智與共、多元認知、兼容并包才是常態(tài)。將智能等同于計算的觀點相對狹隘。計算是智能的一部分,但智能不僅僅是計算。李德毅院士指出,智能是培養(yǎng)和傳承解釋解決預設問題的學習能力,以及解釋解決現(xiàn)實問題的能力。預設問題通常來自現(xiàn)實問題,并已經(jīng)被證明有了行之有效的解決方案,學習是把未知變?yōu)榭芍墙忉尳鉀Q新問題的基礎,解釋解決現(xiàn)實問題是學習的目的,兩者相互促進,學習的結果是修飾、修剪或重塑記憶,所謂「學而不思則罔,思而不學則殆」。愛因斯坦認為,智能是學習知識或使用知識的能力。李德毅院士認為,智能還應該包含創(chuàng)造知識的能力。人類的智能包含計算智能、記憶智能、行為智能、感知智能。其中,計算智能和記憶智能存在于認知空間,是認知思維能力,分別解決為什么、是什么的問題。感知智能(觀察能力,例如:時空識別、目標識別、模式識別)和行為智能(運動能力)存在于物理空間,分別解決在哪里、怎么做的問題。其中,模式識別需要用到記憶,更需要用到人類在進化過程中發(fā)展出的對視覺知覺的判斷。學習包含指導學習和自主學習。而教育作為人類最偉大的發(fā)明之一,將進化的進行時變成了學習的現(xiàn)在完成時。維納說,交互和控制非常重要,要對被控制對象進行負反饋。他認為,如果我們使用一臺機器來實現(xiàn)我們的目標,但又不能有效干預其運作方式,那么我們最好能確定輸入給機器的目標是我們真正所預期的。麥卡錫則認為:「人工智能本應該叫控制論,是智能的自動化」。控制就是追求熵減,通過負反饋,確保機器具身行為智能的穩(wěn)定性。自動控制是強化學習的發(fā)源地,任何獎罰函數(shù),可以與偏差為零的反饋控制等價。機器的使命和行為是由人賦予的。機器能夠通過與人的有效溝通來完成預設的任務,人要和機器交互,逐漸地教會機器理解人設定的任務目標。這個任務目標逐漸統(tǒng)一的過程可稱為使命對齊。當今的深度學習等屬于感知智能,缺乏對人賦予使命的認知理解。只有當機器通過人機交互,讀懂了人賦予的使命,靠使命驅動,才算是實現(xiàn)自主智能,更好地服務于人類。
楊樂昆在其未來工作設想中,構建了一個由世界模型、感知、配置程序、成本函數(shù)、效應器等部分組成的系統(tǒng)。這一系統(tǒng)與李德毅院士提出的「駕駛腦」概念有很多不謀而合的地方。駕駛腦包含感知、認知、行為等部分,涉及瞬時記憶、工作記憶、長期記憶,需要學習車輛動力學控制車體行為。深度學習想要真正進一步發(fā)揮作用,應該在迭代和交互的過程中實現(xiàn),而不僅僅是使用預訓練。機器有感知、有認知、有行為,可交互、會學習、自成長,教機器讀書做題也好、開車也好,就是在交互的環(huán)境里,由軟構體里的算法規(guī)定的一組帶有獎勵和懲罰函數(shù)在內的、周而復始的復雜動作,通過迭代和交互完成在瞬時記憶區(qū)、工作記憶區(qū)、長期記憶區(qū)狀態(tài)的改變,通過自動控制體現(xiàn)具身智能。這種強化學習,是人賦予機器使命的重要方法。機器學習和機器作業(yè)中的交互和協(xié)同
具體而言,交互智能是通過跨模態(tài)感知,實現(xiàn)行為的外循環(huán),包含感知、認知、控制、反饋四個部分。感知要體現(xiàn)瞬時記憶的豐富性、復雜性、精確性。在短記憶中完成態(tài)勢生成和標注,彌補人類的注意力對豐富數(shù)據(jù)理解的簡化能力。
記憶智能是異構、并行的瞬時、短時和中長期記憶之間的協(xié)同。每一次學習都會激活中長期記憶的一部分用來指導當下的學習,每一次學習都會利用短時記憶對中長期記憶進行微重構。記憶和計算應該協(xié)同,構成多元智能。瞬時記憶的完成由以數(shù)據(jù)驅動單元為主,短時記憶的完成由 TPU 和 GPU 為主,中長期記憶由搜索引擎、知識庫機為主。計算工作以 CPU 為主,還需要 FPGA。新一代人工智能一定是異構、超異構的架構。從薛定諤、圖靈、維納談開去——迭代的智能:從學習到創(chuàng)造
機器思維離不開語言,孤立的機器自然語言處理,不與人實時交互是走不通的。自然語言的任意性,普遍反映在使用的不確定性,即多樣性。不唯一性引發(fā)歧義、多義或含蓄,同樣的一句話可以有不同的含義,不同人或不同語境下也都可以有不同的理解,這正是自然語言的魅力。
未來,機器的智能會在多樣化和常態(tài)化的「圖靈測試」中迭代成長。當前由人賦予機器特定的語境和語用,讓機器寫作,生成三字經(jīng)、百家姓、千字文、開幕詞閉幕詞、新聞稿等文案已經(jīng)屢見不鮮,機器寫作的專業(yè)論文已經(jīng)有被會議收錄發(fā)表,機器作畫、批改作業(yè)和試卷,在線評估和指導學生日常學習等活動已經(jīng)常態(tài)化,圖靈測試有可能區(qū)分不出來哪些行為是機器所為。
唐詩宋詞對應于機器寫作圖靈測試;數(shù)學語言對應于定理證明圖靈測試;物理學預言對應于無人駕駛圖靈測試;法律語言對應于機器律師咨詢圖靈測試。實際上,自然語言是所有機器語言的元語言。語言能力是機器智能的杰出表現(xiàn),機器用語言思維先要把語言形式化,只有形式化才可以機械化,而后自動化,一旦自動化,思維的深度就會超越人。可交互、會學習、自成長的機器人作業(yè)流程如圖所示。在認知空間中,機器的通過感知情景形成瞬時記憶;將感知結果聚焦并通過計算記憶形成工作記憶,工作記憶可以從提取長期記憶,用過去的經(jīng)驗反饋當前態(tài)勢下的應對策略,也可以修飾長期記憶;工作記憶可以被用于行為決策。在物理空間中,通過工作記憶得到的行為決策被用于控制,而被控制的對象為機器具身。該系統(tǒng)通過具身行為反饋、注意力選擇、傳感器感知環(huán)境反饋進行學習。自然選擇并沒有「過分」地進化人類這個物種,人類變得智能不是進化的必然,知識給了人類出生后認知二次擴張的潛力,正如同機器可以終身學習。
人使用自熱語言思維,機器使用形式化語言思維并被機械地執(zhí)行;人思維有多樣性和活躍性,機器思維有必然性和統(tǒng)一性;人類思維速度受限于生命的生化參數(shù)基線,而物理的機器則可暴力計算和暴力思維;人有豐富的想象力和創(chuàng)造力,機器有一以貫之的執(zhí)著??傆幸惶斐霈F(xiàn)機器工程師創(chuàng)造出新材料的配方,機器科學家提出新的假設,驅動產(chǎn)生新的科學發(fā)現(xiàn)。
人工智能成為人類文明生態(tài),使得人與機器可多通道、跨模態(tài)交互認知,讓人發(fā)揮人的智慧,機器發(fā)揮機器的智能,形成迭代的智能。
綜合考慮圖靈和薛定諤的理論,我們可以得出「機器是生命,生命是機器」的論斷;圖靈和維納的理論則指出了「智能自動化,行為可控制」的研究目標。
人類本應抑惡揚善,如果人就是攪局者,當然機會也會幫忙造假,工具從來都是雙刃劍。把機器人格化,責備機器人存在倫理問題,只是在逃避人的責任。