<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          DeepMind再登Nature封面!2000年前殘斷古希臘文,完形填空七成準

          共 3763字,需瀏覽 8分鐘

           ·

          2022-03-10 14:24



          ??新智元報道??

          編輯:袁榭 好困

          【新智元導讀】對英語文本做完形填空,是折磨數代中國學生的噩夢。現在DeepMind宣布,他們的AI連兩千年前的古希臘文完形填空都能做出70分以上的成績,簡直吊打了幾億人類。
          ?

          最近,Nature的常客DeepMind似乎有些「不務正業(yè)」?

          ?

          2月才剛學會如何控制核聚變,這次又制霸了古希臘文,還順便上了封面。

          ?

          ?
          DeepMind表示,學都學了,不如論文也用古希臘文寫算了?
          ?

          古希臘文版本:https://t.ly/ZKYW

          ?
          看到這里,當年試圖拿洛布叢書(Loeb Classical)自學古希臘語、從入門到放棄的中年編輯一聲長嘆:真是人不如AI啊……

          不如改天試試至今都無人能夠解讀的「斐斯托斯圓盤」?
          ?
          ?

          「伊薩卡」AI復原佚文


          2500多年前,希臘人開始在石頭、陶器和金屬上書寫,以記錄從租契、法律到日歷、神諭的所有內容,這是歷史學家詳細了解泛地中海區(qū)域歷史的根基。


          由于年代久遠,這些記錄多數都遭到了損壞,內容并不完整。

          ?

          更不幸的是,當代史學界的文本修復技術,與18世紀的技術核心幾乎沒差別:用目標文本材料比對其他更詳盡、可解讀的傳世記錄材料,用近于偵探推理的思路來推測殘斷文本。

          ?

          修復的銘文記錄了一個雅典衛(wèi)城在公元前485或484年頒布的法令

          ?

          DeepMind與威尼斯大學人文系、牛津大學古典學院和雅典經濟大學信息學系合作,探索機器學習如何幫助歷史學家更好地解讀這些殘佚文本,從而讓人們更深入地了解古代歷史,并釋放AI與歷史學家之間的合作潛力。

          ?

          在發(fā)表于《自然》雜志上的論文中,這些機構共同推出了名為「伊薩卡」(Ithaca)的AI,這是第一個可以恢復受損銘文缺失文本、識別其原始位置并確定其書寫時間的深度神經網絡AI。

          ?

          論文鏈接:https://www.nature.com/articles/s41586-022-04448-z

          ?

          「伊薩卡」以史詩《奧德賽》中的希臘島嶼命名,基于DeepMind在2019年提出的「皮媞亞」(Pythia)文字修復系統(tǒng),并在性能上有了史詩級的提升。

          ?

          目前,DeepMind已將「伊薩卡」的代碼、訓練前的模型等全部開源。

          ?

          項目鏈接:https://github.com/deepmind/ithaca#restoring-and-attributing-ancient-texts-using-deep-neural-networks

          ?

          修復準確率加成47%

          ?

          「伊薩卡」是一種基于Transformer的人工神經網絡。


          其數據訓練集是帕卡德人文學院的希臘銘文文本數碼庫,這是世界上最大的古希臘銘文數據庫,其中包含大約78,608條已解讀好的古希臘銘文。

          ?

          根據評估,「伊薩卡」的頭20條預測表現比前任「皮媞亞」優(yōu)化了1.5倍。

          ?

          在單獨恢復受損文本方面,「伊薩卡」的字符錯誤率為26.3%、比單獨人工預測的結果好2.2倍,最確定預測結果的準確率達到了61.8%。

          ?

          「伊薩卡」在識別銘文原始位置方面的準確率達到了70.8%,并且可以將文本的書寫時間確定在其真實時間區(qū)間的平均值差異29.3年、中位值差異3年的范圍內。而人工確定時間的精度是在真實時間區(qū)間的平均值差異144.4年、中位值差異94.5年的范圍內。

          ?

          伊薩卡的架構

          ?

          測試中,DeepMind將短語「δ?μο το αθηνα?ων」(雅典的人民)中的「δημ」被隱去。伊薩卡不僅修復了文本,而且還預測了寫作的時間和地點。

          ?

          此外,「伊薩卡」也顯示出了人機合作在推進歷史解釋、確定歷史事件的相對年代、甚至為當前的歷史方法論探討做出貢獻的潛力。

          ?

          歷史專家在單獨修復古代文本時達到了25%的準確率。但當使用「伊薩卡」時,字符錯誤率降低到18.3%、準確率提高到71.7%,在字符錯誤率上改善了3.2倍、在預測準確率上改善了2.8倍,超過了模型或個人各自的單獨表現。

          ?

          在測試集上對文本修復、地理(地區(qū))和時間歸屬(日期)進行了評估

          ?

          AI當助手,歷史學得好

          ?

          自然語言處理模型通常使用單詞進行訓練,因為它們在句子中出現的順序、以及它們之間的關系提供了額外的上下文背景和含義。


          例如,「很久很久之前」(once upon a time)的意思遠不是這個短語中的每個單字的意涵加總。


          然而,歷史學家想分析的許多銘文都已損壞,其中大塊的文字佚失。


          研究團隊為了確保AI模型在解讀這種缺損銘文時仍有效,就要用單詞/詞組和單個字母同時輸入,對AI進行訓練。


          伊薩卡的輸出

          ?

          (a) 對雅典銘文中6個缺失字符的修復預測,綠色表示正確的預測結果(συμμαχ?α,「聯盟」)。

          ?

          注意這些字眼的預測輸出(?κκλησ?α,「公民大會」;προξεν?α,「城邦與異邦人之間的條約」),被AI自動用紅色標出。

          ?

          這些字眼常會出現在雅典的政治諭令中,AI特別注意到這些字符,體現了伊薩卡對文本背景的理解能力。

          ?

          (b) 來自阿摩爾戈斯的銘文的地域歸屬。伊薩卡的頭一個預測是正確的,其他最接近的預測也在鄰近地區(qū)。

          ?

          (c) 德洛斯島銘文的日期分布。公元前300-250年的真實日期區(qū)間為灰色;伊薩卡的預測分布為黃色,其平均值為公元前273年(綠色)。

          ?

          (d) 「伊薩卡」AI將銘文句子中的個人姓名(Νικ?α?,「尼基亞斯」)和個人頭銜(στρατεγο??,「將軍」)自動變色標出。尼基亞斯對西西里島的遠征是古典雅典史大事,這佐證了「伊薩卡」判讀句子的準確性。

          ?


          為了最大限度地發(fā)揮「伊薩卡」作為研究工具的價值,DeepMind還創(chuàng)建了視覺輔助工具,以確保「伊薩卡」的研究結果易于被歷史學家解讀:

          ?

          • 恢復假說:「伊薩卡」為文本恢復任務生成了幾個預測假說,供歷史學家利用他們的專業(yè)知識進一步精選。

          ?

          • 地域歸屬:「伊薩卡」通過為歷史學家提供所有可能預測的概率分布,來顯示其判讀結果的不確定性,而非輸出單一的篤定結論。因此,它給出銘文可能出現的84個不同古代地區(qū)的概率分布,并在數字地圖上將這些結果可視化,以闡明古代世界可能存在的潛在地理聯系。

          ?

          • 年代歸屬:在對文本進行時代估測時,「伊薩卡」會生成從公元前800年-公元800年間的所有可能時點的分布。這可以使歷史學家調整特定日期范圍的置信度。

          ?

          • 顯著性映射:為了將結果更好地傳達給歷史學家,「伊薩卡」使用計算機視覺的常用技術,來識別哪些輸入序列對預測的貢獻最大。然后在輸出結果時,以不同顏色顯示出讓伊薩卡預測缺失文本、位置和日期的關鍵線索單詞。

          ?

          ?

          圖中處理的古希臘文書記錄,是公元前361年雅典城邦與色薩利城邦間結盟的記錄。使用顯著性映射方法,DeepMind開發(fā)者讓「伊薩卡」AI在輸出佚失的「盟約」字樣時自動對「雅典人」和「色薩利人」字眼改變顏色。

          ?

          銘文為古希臘的思想、語言和社會發(fā)展提供了第一手的證據


          為了更加深入地測試伊薩卡的性能,DeepMind用一個不包含指向精確時間的字符的銘文數據集上對AI進行了重新訓練,然后提交了包含早期字符的文本讓「伊薩卡」再進行分析。

          ?

          結果,「伊薩卡」對法令文本的平均預測日期是公元前421年,這與最新的史學界研究突破相一致,展示了機器學習如何為圍繞古希臘史上最重要時刻之一的研究發(fā)揮助益。

          ?

          「伊薩卡」AI對處理的古希臘銘文的年代估測值、帕卡德人文學院的舊有銘文年代估計值、與歷史學界最新的銘文年代精確估計值對比

          ?

          學界舊有估測與最新成果之間差了平均27年,而AI估測與學界最新成果之間只差平均5年。


          為何選擇古希臘?


          DeepMind選用古希臘銘文開發(fā)「伊薩卡」AI,是因為殘斷的古希臘銘文材料在種類與文字量上都足夠變化多樣,有測試AI的空間。并且古希臘字母與文本的今存語料數據也足夠詳實,方便用作AI的基礎訓練集。


          與此同時,古希臘史在人類理解地中海世界方面有重大意。


          目前的歷史學界對一系列重要的雅典法令的確切頒布日期存在分歧,這些法令是在蘇格拉底、伯里克利等名人生活的時代制定的。

          ?

          長期以來,這些法令一直被認為是在公元前446/445年之前制定的,而最新的證據表明真實的日期其實為公元前420年代。


          雖然這些時間看起來差異很小,但精確日期對于學界理解古典雅典的政治演變關鍵至為重要。

          ?


          如果簡體中文讀者要更容易理解,不如想象微信公眾號走紅的日期是1991年、2001年、2011年還是2015年,對于百代后的傳媒史研究的意義如何。


          除此之外,古希臘史只是廣闊的全球文明圖景的一部分。

          ?

          DeepMind表示,目前正在研究使用其他古代語言訓練不同版本的「伊薩卡」,歷史學家已經能在當前架構中使用多種數據集來研究其他古代語言,從阿卡德語到古埃及語民書體、從希伯來語到瑪雅語,都包括在其中。

          ?


          而「伊薩卡」,只是一個開始。


          參考資料:

          https://deepmind.com/blog/article/Predicting-the-past-with-Ithaca

          https://www.nature.com/articles/s41586-022-04448-z



          瀏覽 69
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚州国产精品三级片 | 国产美女肏逼 | 亚洲第一免费 | 俺也要俺也去 | 亚洲成人蜜芽在线 |