終于有人把知識圖譜講明白了
導讀:知識圖譜的概念誕生于2012年,由Google公司首先提出。知識圖譜的提出是為了準確地闡述人、事、物之間的關(guān)系,最早應用于搜索引擎。知識圖譜是為了描述文本語義,在自然界建立實體關(guān)系的知識數(shù)據(jù)庫。一般情況下,我們可以使用關(guān)系圖來表示知識圖譜。
-
在Web視角下,知識圖譜如同簡單文本之間的超鏈接一樣,通過建立數(shù)據(jù)之間的語義鏈接,支持語義搜索。 -
在自然語言處理視角下,知識圖譜就是從文本中抽取語義和結(jié)構(gòu)化的數(shù)據(jù)。 -
在知識表示視角下,知識圖譜是采用計算機符號表示和處理知識的方法。 -
在人工智能視角下,知識圖譜是利用知識庫來輔助理解人類語言的工具。 -
在數(shù)據(jù)庫視角下,知識圖譜是利用圖的方式去存儲知識的方法。
-
實體:又叫作本體(Ontology),指客觀存在并可相互區(qū)別的事物,可以是具體的人、事、物,也可以是抽象的概念或聯(lián)系。實體是知識圖譜中最基本的元素。 -
關(guān)系:在知識圖譜中,邊表示知識圖譜中的關(guān)系,用來表示不同實體間的某種聯(lián)系。如圖3-1所示,圖靈和人工智能之間的關(guān)系,知識圖譜和谷歌之間的關(guān)系,谷歌和深度學習之間的關(guān)系。 -
屬性:知識圖譜中的實體和關(guān)系都可以有各自的屬性,如圖3-2所示。
-
知識源:包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。 -
信息抽?。?/span>就是從各種類型的數(shù)據(jù)源中提取實體、屬性以及實體間的相互關(guān)系,在此基礎(chǔ)上形成本體的知識表述。知識圖譜的構(gòu)建過程中存在大量的非結(jié)構(gòu)化或者是半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在知識圖譜的構(gòu)建過程中需要通過自然語言處理的方法進行信息抽取。從這些數(shù)據(jù)中,我們可以提取出實體、關(guān)系和屬性。 -
知識融合:主要工作是把結(jié)構(gòu)化的數(shù)據(jù)以及信息抽取提煉到的實體信息,甚至第三方知識庫進行實體對齊和實體消歧。這一階段的輸出應該是從各個數(shù)據(jù)源融合的各種本體信息。 -
知識加工:知識加工階段如圖3-6所示,其中知識推理中重要的工作就是知識圖譜的補全。常用的知識圖譜的補全方法包括:基于本體推理的補全方法、相關(guān)的推理機制實現(xiàn)以及基于圖結(jié)構(gòu)和關(guān)系路徑特征的補全方法。

評論
圖片
表情
