??新智元報道??

編輯：袁榭好困

【新智元導讀】對英語文本做完形填空，是折磨數代中國學生的噩夢。現在DeepMind宣布，他們的AI連兩千年前的古希臘文完形填空都能做出70分以上的成績，簡直吊打了幾億人類。

最近，Nature的常客DeepMind似乎有些「不務正業(yè)」？

2月才剛學會如何控制核聚變，這次又制霸了古希臘文，還順便上了封面。

DeepMind表示，學都學了，不如論文也用古希臘文寫算了？

古希臘文版本：https://t.ly/ZKYW

看到這里，當年試圖拿洛布叢書（Loeb Classical）自學古希臘語、從入門到放棄的中年編輯一聲長嘆：真是人不如AI啊……

不如改天試試至今都無人能夠解讀的「斐斯托斯圓盤」？

「伊薩卡」AI復原佚文

2500多年前，希臘人開始在石頭、陶器和金屬上書寫，以記錄從租契、法律到日歷、神諭的所有內容，這是歷史學家詳細了解泛地中海區(qū)域歷史的根基。

由于年代久遠，這些記錄多數都遭到了損壞，內容并不完整。

更不幸的是，當代史學界的文本修復技術，與18世紀的技術核心幾乎沒差別：用目標文本材料比對其他更詳盡、可解讀的傳世記錄材料，用近于偵探推理的思路來推測殘斷文本。

修復的銘文記錄了一個雅典衛(wèi)城在公元前485或484年頒布的法令

DeepMind與威尼斯大學人文系、牛津大學古典學院和雅典經濟大學信息學系合作，探索機器學習如何幫助歷史學家更好地解讀這些殘佚文本，從而讓人們更深入地了解古代歷史，并釋放AI與歷史學家之間的合作潛力。

在發(fā)表于《自然》雜志上的論文中，這些機構共同推出了名為「伊薩卡」（Ithaca）的AI，這是第一個可以恢復受損銘文缺失文本、識別其原始位置并確定其書寫時間的深度神經網絡AI。

論文鏈接：https://www.nature.com/articles/s41586-022-04448-z

「伊薩卡」以史詩《奧德賽》中的希臘島嶼命名，基于DeepMind在2019年提出的「皮媞亞」（Pythia）文字修復系統(tǒng)，并在性能上有了史詩級的提升。

目前，DeepMind已將「伊薩卡」的代碼、訓練前的模型等全部開源。

項目鏈接：https://github.com/deepmind/ithaca#restoring-and-attributing-ancient-texts-using-deep-neural-networks

修復準確率加成47%

「伊薩卡」是一種基于Transformer的人工神經網絡。

其數據訓練集是帕卡德人文學院的希臘銘文文本數碼庫，這是世界上最大的古希臘銘文數據庫，其中包含大約78,608條已解讀好的古希臘銘文。

根據評估，「伊薩卡」的頭20條預測表現比前任「皮媞亞」優(yōu)化了1.5倍。

在單獨恢復受損文本方面，「伊薩卡」的字符錯誤率為26.3%、比單獨人工預測的結果好2.2倍，最確定預測結果的準確率達到了61.8%。

「伊薩卡」在識別銘文原始位置方面的準確率達到了70.8%，并且可以將文本的書寫時間確定在其真實時間區(qū)間的平均值差異29.3年、中位值差異3年的范圍內。而人工確定時間的精度是在真實時間區(qū)間的平均值差異144.4年、中位值差異94.5年的范圍內。

伊薩卡的架構

測試中，DeepMind將短語「δ?μο το αθηνα?ων」（雅典的人民）中的「δημ」被隱去。伊薩卡不僅修復了文本，而且還預測了寫作的時間和地點。

此外，「伊薩卡」也顯示出了人機合作在推進歷史解釋、確定歷史事件的相對年代、甚至為當前的歷史方法論探討做出貢獻的潛力。

歷史專家在單獨修復古代文本時達到了25%的準確率。但當使用「伊薩卡」時，字符錯誤率降低到18.3%、準確率提高到71.7%，在字符錯誤率上改善了3.2倍、在預測準確率上改善了2.8倍，超過了模型或個人各自的單獨表現。

在測試集上對文本修復、地理（地區(qū)）和時間歸屬（日期）進行了評估

AI當助手，歷史學得好

自然語言處理模型通常使用單詞進行訓練，因為它們在句子中出現的順序、以及它們之間的關系提供了額外的上下文背景和含義。

例如，「很久很久之前」（once upon a time）的意思遠不是這個短語中的每個單字的意涵加總。

然而，歷史學家想分析的許多銘文都已損壞，其中大塊的文字佚失。

研究團隊為了確保AI模型在解讀這種缺損銘文時仍有效，就要用單詞/詞組和單個字母同時輸入，對AI進行訓練。

伊薩卡的輸出

(a) 對雅典銘文中6個缺失字符的修復預測，綠色表示正確的預測結果（συμμαχ?α，「聯盟」）。

注意這些字眼的預測輸出（?κκλησ?α，「公民大會」；προξεν?α，「城邦與異邦人之間的條約」），被AI自動用紅色標出。

這些字眼常會出現在雅典的政治諭令中，AI特別注意到這些字符，體現了伊薩卡對文本背景的理解能力。

(b) 來自阿摩爾戈斯的銘文的地域歸屬。伊薩卡的頭一個預測是正確的，其他最接近的預測也在鄰近地區(qū)。

(d) 「伊薩卡」AI將銘文句子中的個人姓名(Νικ?α?，「尼基亞斯」)和個人頭銜(στρατεγο??，「將軍」)自動變色標出。尼基亞斯對西西里島的遠征是古典雅典史大事，這佐證了「伊薩卡」判讀句子的準確性。

為了最大限度地發(fā)揮「伊薩卡」作為研究工具的價值，DeepMind還創(chuàng)建了視覺輔助工具，以確保「伊薩卡」的研究結果易于被歷史學家解讀：

恢復假說：「伊薩卡」為文本恢復任務生成了幾個預測假說，供歷史學家利用他們的專業(yè)知識進一步精選。

地域歸屬：「伊薩卡」通過為歷史學家提供所有可能預測的概率分布，來顯示其判讀結果的不確定性，而非輸出單一的篤定結論。因此，它給出銘文可能出現的84個不同古代地區(qū)的概率分布，并在數字地圖上將這些結果可視化，以闡明古代世界可能存在的潛在地理聯系。

年代歸屬：在對文本進行時代估測時，「伊薩卡」會生成從公元前800年-公元800年間的所有可能時點的分布。這可以使歷史學家調整特定日期范圍的置信度。

顯著性映射：為了將結果更好地傳達給歷史學家，「伊薩卡」使用計算機視覺的常用技術，來識別哪些輸入序列對預測的貢獻最大。然后在輸出結果時，以不同顏色顯示出讓伊薩卡預測缺失文本、位置和日期的關鍵線索單詞。

圖中處理的古希臘文書記錄，是公元前361年雅典城邦與色薩利城邦間結盟的記錄。使用顯著性映射方法，DeepMind開發(fā)者讓「伊薩卡」AI在輸出佚失的「盟約」字樣時自動對「雅典人」和「色薩利人」字眼改變顏色。

銘文為古希臘的思想、語言和社會發(fā)展提供了第一手的證據

為了更加深入地測試伊薩卡的性能，DeepMind用一個不包含指向精確時間的字符的銘文數據集上對AI進行了重新訓練，然后提交了包含早期字符的文本讓「伊薩卡」再進行分析。

結果，「伊薩卡」對法令文本的平均預測日期是公元前421年，這與最新的史學界研究突破相一致，展示了機器學習如何為圍繞古希臘史上最重要時刻之一的研究發(fā)揮助益。

「伊薩卡」AI對處理的古希臘銘文的年代估測值、帕卡德人文學院的舊有銘文年代估計值、與歷史學界最新的銘文年代精確估計值對比

學界舊有估測與最新成果之間差了平均27年，而AI估測與學界最新成果之間只差平均5年。

為何選擇古希臘？

DeepMind選用古希臘銘文開發(fā)「伊薩卡」AI，是因為殘斷的古希臘銘文材料在種類與文字量上都足夠變化多樣，有測試AI的空間。并且古希臘字母與文本的今存語料數據也足夠詳實，方便用作AI的基礎訓練集。

與此同時，古希臘史在人類理解地中海世界方面有重大意。

目前的歷史學界對一系列重要的雅典法令的確切頒布日期存在分歧，這些法令是在蘇格拉底、伯里克利等名人生活的時代制定的。

長期以來，這些法令一直被認為是在公元前446/445年之前制定的，而最新的證據表明真實的日期其實為公元前420年代。

雖然這些時間看起來差異很小，但精確日期對于學界理解古典雅典的政治演變關鍵至為重要。

如果簡體中文讀者要更容易理解，不如想象微信公眾號走紅的日期是1991年、2001年、2011年還是2015年，對于百代后的傳媒史研究的意義如何。

除此之外，古希臘史只是廣闊的全球文明圖景的一部分。

DeepMind表示，目前正在研究使用其他古代語言訓練不同版本的「伊薩卡」，歷史學家已經能在當前架構中使用多種數據集來研究其他古代語言，從阿卡德語到古埃及語民書體、從希伯來語到瑪雅語，都包括在其中。

而「伊薩卡」，只是一個開始。

參考資料：

https://deepmind.com/blog/article/Predicting-the-past-with-Ithaca

https://www.nature.com/articles/s41586-022-04448-z

DeepMind再登Nature封面！2000年前殘斷古希臘文，完形填空七成準

??新智元報道??

【新智元導讀】對英語文本做完形填空，是折磨數代中國學生的噩夢。現在DeepMind宣布，他們的AI連兩千年前的古希臘文完形填空都能做出70分以上的成績，簡直吊打了幾億人類。

修復準確率加成47%

AI當助手，歷史學得好