現(xiàn)在的人工智能是否走上了數(shù)學(xué)的極端?
點(diǎn)擊上方“視學(xué)算法”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
導(dǎo)讀
?數(shù)字電路、集成電路的高速發(fā)展讓計(jì)算機(jī)的計(jì)算和存儲(chǔ)能力達(dá)到了新的高度,我們開始實(shí)現(xiàn)一些從前不可能的事情,人工智能也因此得到快速的發(fā)展。但目前的人工智能好像都是基于邏輯和結(jié)構(gòu)的基礎(chǔ)上尋找答案,那么還存在所謂的智能嗎?現(xiàn)在的人工智能是否走上了數(shù)學(xué)的極端呢??
原問題:人工智能在當(dāng)下如火如荼,有一個(gè)很重要的原因是計(jì)算機(jī)的計(jì)算和存儲(chǔ)能力達(dá)到了一個(gè)新的高度,讓原來不敢想的事情成為可能。但是,這種計(jì)算能力的高度是基于數(shù)字電路、集成電路的高速發(fā)展帶來的。
目前我所了解的人工智能領(lǐng)域,包括機(jī)器視覺,包括語義分析知識(shí)圖譜等,都是基于邏輯和結(jié)構(gòu)的基礎(chǔ)上去找答案,去找特征,去組織關(guān)系,是數(shù)字的結(jié)構(gòu)的。但最大的問題就在這里,當(dāng)開發(fā)者依據(jù)個(gè)人的傾向去組織數(shù)據(jù)確定邏輯和結(jié)構(gòu)的時(shí)候,已經(jīng)不存在所謂的智能了,就已經(jīng)將核心固化了。
所以,我理解智能應(yīng)該是存在很大程度上的巧合的,也存在很大程度上的隨機(jī),憑借數(shù)學(xué)公式是不能實(shí)現(xiàn)的。所以,我想,在數(shù)字技術(shù)之上的模擬技術(shù)是否才是這個(gè)問題的答案?有么有類似的案例?結(jié)果怎么樣?
-------------------------------------------------------------------------
這是一個(gè)很有價(jià)值的問題,對(duì)于初學(xué)者尤其重要。從題主的補(bǔ)充說明中,可以看出題主進(jìn)行過深入的思考。只是題主或許不太熟悉人工智能的早期發(fā)展歷史,同時(shí)稍微混淆了幾個(gè)概念。下面,我嘗試提供一些觀點(diǎn)。
按照普遍的認(rèn)知,現(xiàn)代意義上的人工智能,正式提出于1956年的達(dá)特茅斯會(huì)議。相比于古早時(shí)期的幻想(如中國(guó)戰(zhàn)國(guó)時(shí)期的偃師和西方中世紀(jì)煉金術(shù)中的Homunculus),1956年的定義明確了“智能可以獨(dú)立于肉體存在” ,然而站在今天的視角看,當(dāng)時(shí)人們對(duì)于人工智能的定義仍然很不清晰。從當(dāng)年proposal的首頁(yè)截圖中,可以看到他們提出的前兩個(gè)問題是“自動(dòng)化的計(jì)算機(jī)”和“如何編寫程序讓計(jì)算機(jī)學(xué)會(huì)使用語言”。前者顯然是非常模糊的說法;而后者(也許是受到了圖靈測(cè)試[1]的影響)看似跟今天的自然語言處理非常相似,可細(xì)看描述就會(huì)發(fā)現(xiàn),先驅(qū)們并沒有把具體任務(wù)形式化地定義下來。也許是這些不明確的定義給了人們莫名的信心,當(dāng)時(shí)的10個(gè)參與者提出了“兩個(gè)月內(nèi)解決人工智能基礎(chǔ)問題” 的豪言壯語,讓今天的人們?nèi)炭〔唤?。后來的事情大家是知道的:這些基礎(chǔ)問題直到今天也沒有解決(甚至接近解決),但是這10位先驅(qū)中有5人先后榮獲圖靈獎(jiǎng)。所以挖坑早是多么重要?。ㄗ詈笠痪鋭澋簦?/p>
達(dá)特茅斯暑期研究計(jì)劃的proposal首頁(yè)如果對(duì)人工智能早期歷史感興趣,可以瀏覽維基百科的人工智能史頁(yè)面,也可以開2倍速聽下我的講解(第1課第2部分):
謝凌曦:第1課 人工智能綜述:https://zhuanlan.zhihu.com/p/452444873
回到正題上來。無論早期人工智能的定義多么幼稚,有一個(gè)事實(shí)是確定的:現(xiàn)代人工智能,脫胎于數(shù)學(xué)、神經(jīng)科學(xué)和當(dāng)時(shí)尚在襁褓中的計(jì)算機(jī)科學(xué)。我們?cè)倏淳S基百科對(duì)于人工智能的定義:
人工智能(英語:artificial intelligence,縮寫為AI)亦稱智械、機(jī)器智能,指由人制造出來的機(jī)器所表現(xiàn)出來的智能。通常人工智能是指通過普通計(jì)算機(jī)程序來呈現(xiàn)人類智能的技術(shù)。
也就是說,現(xiàn)代人工智能的共同特點(diǎn),就是通過高速計(jì)算機(jī)來實(shí)現(xiàn)(有時(shí)候甚至可以說復(fù)現(xiàn))人類行為。以此可以回應(yīng)題主的第一段話:確實(shí),如果未來人類沒有造出仿生機(jī)器,那么人工智能只能通過數(shù)字集成電路來實(shí)現(xiàn)。 一個(gè)有趣的例子是,科學(xué)家們通過把電極插入老鼠和猴子的大腦,可以記錄它們對(duì)于各種外界刺激的反應(yīng)。如果我們將這個(gè)系統(tǒng)理解為一個(gè)機(jī)器,那么它確實(shí)在一定程度上不依靠數(shù)學(xué)實(shí)現(xiàn)了智能(或許應(yīng)該叫做鼠工智能或者猴工智能)。當(dāng)然,出于倫理的考慮,我們是絕無可能把人腦當(dāng)成機(jī)器來使用的(雖然有各種類似的研究)。
再回到主線上來。題主第二段說,“目前我所了解的人工智能領(lǐng)域,……,都是基于邏輯和結(jié)構(gòu)的基礎(chǔ)上去找答案,去找特征,去組織關(guān)系,是數(shù)字的結(jié)構(gòu)的”。正是通過這句話,我判斷題主不太熟悉早期人工智能史。事實(shí)上,從1950年代開始,人工智能就存在著三個(gè)彼此競(jìng)爭(zhēng)的流派:邏輯演繹、歸納統(tǒng)計(jì)、類腦計(jì)算。直至今日,也沒有人從理論上論證三個(gè)流派孰優(yōu)孰劣,雖然歸納統(tǒng)計(jì)在今天占據(jù)了壓倒性的優(yōu)勢(shì)(包括機(jī)器學(xué)習(xí)和從中發(fā)展出的深度學(xué)習(xí))。這其中,類腦計(jì)算的思想很終極也很容易理解:搞清楚人腦是如何工作的,然后用數(shù)學(xué)模型去復(fù)現(xiàn)它;可惜的是,雖然21世紀(jì)是生命科學(xué)的世紀(jì)(大霧),腦科學(xué)的進(jìn)展還是沒能滿足人工智能的需求。
除了高冷的類腦計(jì)算派,邏輯演繹派和歸納統(tǒng)計(jì)派也進(jìn)行了長(zhǎng)達(dá)數(shù)十年的競(jìng)爭(zhēng)。它們的本質(zhì)分歧在于:邏輯演繹派希望能對(duì)任何任務(wù)建立起規(guī)則,并且通過嚴(yán)謹(jǐn)?shù)倪壿嬐评韥斫鉀Q問題;而歸納統(tǒng)計(jì)派則認(rèn)為,嚴(yán)格建模即不現(xiàn)實(shí)也不必要,“這個(gè)世界就是描述它自己最好的模型”[2]。1970年代,邏輯演繹派在符號(hào)人工智能的框架下搞出了專家系統(tǒng)[3],一舉帶來人工智能的第二次繁榮期;但是很快,人們就發(fā)現(xiàn)專家系統(tǒng)的使用場(chǎng)景過于受限,同時(shí)維護(hù)規(guī)則庫(kù)的開銷太大,人工智能進(jìn)入第二次低谷期。帶領(lǐng)業(yè)界走出第二次低谷期的,正是歸納統(tǒng)計(jì)派,包括后來被歸為亞符號(hào)人工智能的統(tǒng)計(jì)學(xué)習(xí)理論[4]。再后來,手工設(shè)計(jì)模型遇到瓶頸,而1950年代就存在的連接主義(人工神經(jīng)網(wǎng)絡(luò))在大數(shù)據(jù)的驅(qū)動(dòng)下,進(jìn)化為深度學(xué)習(xí)理論,基本上統(tǒng)治了人工智能領(lǐng)域,直至今日。
因此對(duì)于第二個(gè)問題的回答是:人工智能里存在其他學(xué)派,但是它們目前還沒有跟歸納統(tǒng)計(jì)派抗衡的能力。但是,統(tǒng)計(jì)學(xué)習(xí)方法的缺陷是非常明顯的(這正是題主的觀點(diǎn),也是業(yè)界普遍的擔(dān)憂)。從我個(gè)人的觀點(diǎn)看,我不相信統(tǒng)計(jì)學(xué)習(xí)能夠?qū)崿F(xiàn)真正的人工智能,但是它確實(shí)是當(dāng)前人類掌握的最有力工具。特別是在深度學(xué)習(xí)出現(xiàn)以后,統(tǒng)計(jì)學(xué)習(xí)方法能夠解決很多受限場(chǎng)景下的實(shí)際問題,因而形成了正向循環(huán),獲取了政府和工業(yè)界的大量投資。因而,從觀感上,有一種“人工智能只剩下統(tǒng)計(jì)學(xué)習(xí)”的錯(cuò)覺,但我相信其他流派也還在努力,等待翻身的一天。
最后,我不太能夠從數(shù)學(xué)上理解“智能存在很大程度上的隨機(jī)”的含義。不知道是否有生物學(xué)或者遺傳學(xué)專家,能夠從物種進(jìn)化的角度來分析。不過針對(duì)第三段所說的“數(shù)字技術(shù)之上的模擬技術(shù)”,我相信前面的介紹已經(jīng)多少回答了這個(gè)問題:類腦計(jì)算就是希望模擬人腦,但是當(dāng)前還不能在實(shí)際問題中看到應(yīng)用。這里必須澄清:雖然人腦也是分區(qū)分層的,不過我向來反對(duì)將深度神經(jīng)網(wǎng)絡(luò)看做類腦計(jì)算(brain-like computing),它最多只能算做腦啟發(fā)的計(jì)算(brain-inspired computing)。許多年前,我聽過一個(gè)有趣的哲學(xué)辯論:人類的大腦,是否能夠理解大腦本身?可惜我現(xiàn)在找不到相關(guān)材料了。
總之,人工智能的范疇很廣,價(jià)值也很大。許多我們能夠想到的問題,之前都已經(jīng)有人做過各種各樣的思維實(shí)驗(yàn)。我強(qiáng)烈建議初學(xué)者們,不要僅僅局限在深度學(xué)習(xí)的框架內(nèi),有空可以看看早期各種有趣的故事,至少要搞清楚業(yè)界是怎樣一步步走到深度學(xué)習(xí)的,這對(duì)于形成完整的人工智能世界觀大有裨益。 最后的最后,說到未來,那一定是“道阻且長(zhǎng)”,只有保持永恒的探索欲,才有可能突破當(dāng)前瓶頸,找到新的道路。
參考
1.^Turing A M. Computing machinery and intelligence[M]//Parsing the turing test. Springer, Dordrecht, 2009: 23-65.
2.^Brooks R A. Elephants don't play chess[J]. Robotics and autonomous systems, 1990, 6(1-2): 3-15.
3.^Shortliffe E H, Buchanan B G. A model of inexact reasoning in medicine[J]. Mathematical biosciences, 1975, 23(3-4): 351-379.
4.^Vapnik V. The nature of statistical learning theory[M]. Springer science & business media, 1999.

點(diǎn)個(gè)在看 paper不斷!
