Akutan分布式知識(shí)圖譜存儲(chǔ)
Akutan(曾用名:Beam)是一種知識(shí)圖譜存儲(chǔ),也可稱為 RDF 存儲(chǔ)或三元組存儲(chǔ),由 eBay 開(kāi)源。知識(shí)圖譜適合建模世界知識(shí)百科這樣通過(guò)復(fù)雜關(guān)系高度互聯(lián)的數(shù)據(jù)。例如,Wikidata 是一種以結(jié)構(gòu)化數(shù)據(jù)和關(guān)系表示維基百科的數(shù)據(jù)集,非常適合于知識(shí)圖譜表示。知識(shí)圖譜存儲(chǔ)支持對(duì)數(shù)據(jù)執(zhí)行多樣性查詢,提供實(shí)時(shí)數(shù)據(jù)接口、輔助機(jī)器學(xué)習(xí)應(yīng)用,以及基于現(xiàn)有知識(shí)理解非結(jié)構(gòu)化的新信息。
Akutan 實(shí)現(xiàn)為分布式存儲(chǔ),在設(shè)計(jì)上支持無(wú)法被單一服務(wù)器有效存儲(chǔ)的大規(guī)模圖。Akutan 可通過(guò)水平擴(kuò)展支持高性能查詢和大規(guī)模數(shù)據(jù)集。雖然 Akutan 的寫(xiě)入速度無(wú)法擴(kuò)展,但其部署通??芍С置棵霐?shù)萬(wàn)次數(shù)據(jù)更改。eBay 已運(yùn)行由 20 臺(tái)服務(wù)器組成的 Akutan 部署和離線用例近一年時(shí)間,通常情況下已經(jīng)加載了 25 億條事實(shí)數(shù)據(jù)。此外,Akutan 使用類似于 RDF 的數(shù)據(jù)表示,支持類 SPARQL 查詢語(yǔ)言。
注:在知識(shí)圖譜中,數(shù)據(jù)以單一表模式表示事實(shí)。每個(gè)事實(shí)條目包括主體(Subject)、謂詞(Predicate)和客體(Object)三個(gè)元素。這種事實(shí)條目表示方式,支持存儲(chǔ)根據(jù)復(fù)雜查詢靈活組織數(shù)據(jù),并通過(guò)推理提高數(shù)據(jù)的抽象層級(jí)。下表列出了小部分知識(shí)圖譜的表示:
| 主體 | 謂詞 | 客體 |
|---|---|---|
| <John_Scalzi> | <born> |
<Fairfield> |
| <John_Scalzi> | <lives> |
<Bradford> |
| <John_Scalzi> | <wrote> |
<Old_Mans_War> |
