<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          盤點4個典型的知識圖譜項目

          共 2945字,需瀏覽 6分鐘

           ·

          2021-09-27 08:47

          導讀:本文將列舉幾個典型的知識圖譜項目。


          作者:邵浩 張凱 李方圓 張云柯 戴錫強
          來源:大數(shù)據(jù)DT(ID:hzdashuju)



          圖1-6給出了具有代表性的知識圖譜項目的發(fā)展歷史。


          ▲圖1-6 知識圖譜發(fā)展歷史


          從20世紀80年代開始的CYC項目,到Google 2012年提出的知識圖譜,再到現(xiàn)在不同語種、不同領域的知識圖譜項目大量涌現(xiàn),知識圖譜已經(jīng)被深入研究并廣泛應用于各個行業(yè)。


          例如,WordNet是典型的詞典知識庫,BabelNet也是類似于WordNet的多語言詞典知識庫,YAGO集成了Wikipedia、WordNet、GeoNames三個源的數(shù)據(jù),NELL則持續(xù)不斷從互聯(lián)網(wǎng)上自動抽取三元組知識。


          由于這些項目的相關資料較為豐富,本文僅挑選若干具有代表性的知識圖譜項目加以介紹。



          01 CYC


          https://cyc.com/


          CYC項目開始于1984年,最初目標是建立人類最大的常識知識庫,將上百萬條知識編碼成機器可用的形式。根據(jù)維基百科數(shù)據(jù),CYC包含320萬條人類定義的斷言,涉及30萬個概念和15000個謂詞。


          1986年,Douglas Lenat推斷要構建這樣龐大的知識庫需設計25萬條規(guī)則,同時需要350個人年才能完成。這個看似瘋狂的計劃之所以能夠推進,和當時的歷史背景是不可分開的。


          在CYC中,大部分工作是以知識工程為基礎,且大部分事實都是通過手動添加到知識庫上的。CYC主要由兩部分構成,第一部分是作為數(shù)據(jù)載體的多語境知識庫,第二部分是系統(tǒng)本身的推理引擎。


          比如,通過“每棵樹都是植物”和“植物最終都會死亡”的知識,推理引擎可以推斷出“樹會死亡”的結論。1994年圖靈獎獲得者愛德華·費根鮑姆曾稱:“CYC是世界上最大的知識庫,也是技術論的最佳代表。”



          02 ConceptNet


          https://www.conceptnet.io/


          ConceptNet是一個利用眾包構建的常識知識圖譜,起源于麻省理工大學媒體實驗室的Open Mind Common Sense(OMCS)項目,它免費開放并且具有多語言版本。其英文版本自1999年發(fā)布以來,由15000個貢獻者積累了超過100多萬個事實。


          ConceptNet的一大特點是它的知識描述是非形式化的,更加貼近自然語言的描述。圖1-7給出了ConceptNet的一個組織架構。這里列舉了一些更為具體的描述,例如:“企鵝是一種鳥”“企鵝出現(xiàn)在動物園”“企鵝想要有足夠的食物”等。


          ▲圖1-7 ConceptNet的組織架構示例



          03 DBpedia


          https://www.dbpedia.org/


          DBpedia是指數(shù)據(jù)庫版本的Wikipedia,是從Wikipedia中的信息框抽取出的鏈接數(shù)據(jù)庫。英文版本的DBpedia包含600萬實體,其中510萬個實體可以鏈接到本體上。并且,DBpedia還和Freebase、OpenCYC、Bio2RDF等多個數(shù)據(jù)集建立了數(shù)據(jù)鏈接。


          截至目前,DBpedia是鏈接開放數(shù)據(jù)(LOD)中最大的具有代表性的開放鏈接數(shù)據(jù)庫之一。



          04 LOD


          https://lod-cloud.net/


          上文提到,LOD的初衷是實現(xiàn)Tim有關鏈接數(shù)據(jù)作為語義網(wǎng)的一種實現(xiàn)的設想。


          其遵循四個原則:


          • 使用URI進行標識;

          • 使用HTTP URI,以便用戶可以像訪問網(wǎng)頁一樣查看事物的描述;

          • 使用RDF和SPARQL標準;

          • 為事物添加與其他事物的URI鏈接,建立數(shù)據(jù)關聯(lián)。


          截至2020年7月,LOD有1260個知識圖譜,包含16187個鏈接。圖1-8給出了LOD統(tǒng)計的知識圖譜的示意圖,它按照不同的顏色將知識圖譜分為9個大類,其中社交媒體、政府、出版和生命科學四個領域的數(shù)據(jù)占比之和超過 90%。


          ▲圖1-8 LOD知識圖譜概覽


          關于作者:邵浩資深人工智能技術專家,vivo技術總監(jiān)。曾任狗尾草智能科技AI研究院院長,帶領團隊打造了虛擬生命產(chǎn)品的交互引擎。上海市靜安區(qū)首屆優(yōu)秀人才,上海市人才發(fā)展基金獲得者,杭州市高層次人才。中國中文信息學會青年工作委員會委員,語言與知識計算專委會委員,中國計算機學會語音對話與聽覺專委會委員,自然語言處理專委會委員。
          張凱,資深AI算法工程師,主要研究方向包括知識圖譜、對話系統(tǒng)、推薦系統(tǒng)、機器翻譯等,擁有多年算法落地經(jīng)驗。主導構建了開放通用知識圖譜七律,參與了《知識圖譜評測標準》和《知識圖譜白皮書》的編寫。聊天機器人專業(yè)書籍作者之一。
          李方圓,資深AI算法工程師,主要研究方向包括機器翻譯、知識圖譜和問答系統(tǒng),具有多年實戰(zhàn)項目經(jīng)驗,現(xiàn)任vivo機器翻譯團隊負責人,主導從零構建機器翻譯能力。
          張云柯,資深AI算法工程師,中文信息學會會員,碩士畢業(yè)于加拿大Queen’s University,曾任職于奇虎360。主要研究方向包括自然語言處理與知識圖譜,曾于領域內(nèi)知名會議發(fā)表相關論文,擁有豐富的算法落地經(jīng)驗。
          戴錫強,資深AI算法工程師,主要研究方向為知識圖譜、對話系統(tǒng)等,參與構建了百科知識圖譜,醫(yī)藥領域知識圖譜,基于知識圖譜的問答系統(tǒng)等,具有豐富的知識圖譜落地經(jīng)驗。

          本文摘編自《從零構建知識圖譜:技術、方法與案例》,經(jīng)出版方授權發(fā)布。

          延伸閱讀從零構建知識圖譜:技術、方法與案例
          點擊上圖了解及購買
          轉(zhuǎn)載請聯(lián)系微信:DoctorData

          推薦語:這是一本能讓讀者快速從零開始構建工業(yè)級知識圖譜的著作。本書不僅詳細講解了知識圖譜的技術原理和構建工具,而且還循序漸進地講解了知識圖譜的構建方法、步驟和行業(yè)應用。配有大量實戰(zhàn)案例,并且開放了源代碼,確保讀者能學會并落地。作者是知識圖譜和自然語言處理領域的專家,本書得到了OpenKG聯(lián)合創(chuàng)始人王昊奮、清華大學教授李涓子等學界和業(yè)界知識圖譜扛旗人的一致好評和推薦。


          劃重點??


          干貨直達??


          更多精彩??

          在公眾號對話框輸入以下關鍵詞
          查看更多優(yōu)質(zhì)內(nèi)容!

          讀書 | 書單 | 干貨 | 講明白 | 神操作 | 手把手
          大數(shù)據(jù) | 云計算 | 數(shù)據(jù)庫 | Python | 爬蟲 | 可視化
          AI | 人工智能 | 機器學習 | 深度學習 | NLP
          5G | 中臺 | 用戶畫像 數(shù)學 | 算法 數(shù)字孿生

          據(jù)統(tǒng)計,99%的大咖都關注了這個公眾號
          ??
          瀏覽 11
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久操热 | 淫色淫香网站 | 撸撸撸在线观看 | 久久久久久91亚洲精品中文字幕 | 久久中文字幕7区 |