Apache Druid高性能實(shí)時(shí)分析數(shù)據(jù)庫
Druid 是一個(gè)高性能實(shí)時(shí)分析數(shù)據(jù)庫。它是為大型數(shù)據(jù)集上實(shí)時(shí)探索查詢的引擎,提供專為 OLAP 設(shè)計(jì)的開源分析數(shù)據(jù)存儲系統(tǒng),它的設(shè)計(jì)意圖是在面對代碼部署、機(jī)器故障以及其他產(chǎn)品系統(tǒng)遇到不測時(shí)能保持100%正常運(yùn)行。它也可以用于后臺用例,但設(shè)計(jì)決策明確定位線上服務(wù)。
數(shù)據(jù)流:
集群架構(gòu):
主要特性:
-
為分析而設(shè)計(jì)——Druid 是為 OLAP 工作流的探索性分析而構(gòu)建。它支持各種 filter、aggregator 和查詢類型,并為添加新功能提供了一個(gè)框架。用戶已經(jīng)利用 Druid 的基礎(chǔ)設(shè)施開發(fā)了高級K查詢和直方圖功能。
-
交互式查詢——Druid 的低延遲數(shù)據(jù)攝取架構(gòu)允許事件在它們創(chuàng)建后毫秒內(nèi)查詢,因?yàn)?Druid 的查詢延時(shí)通過只讀取和掃描優(yōu)必要的元素被優(yōu)化。Aggregate 和 filter 沒有坐等結(jié)果。
-
高可用性——Druid 是用來支持需要一直在線的 SaaS 的實(shí)現(xiàn)。你的數(shù)據(jù)在系統(tǒng)更新時(shí)依然可用、可查詢。規(guī)模的擴(kuò)大和縮小不會造成數(shù)據(jù)丟失。
-
可伸縮——現(xiàn)有的 Druid 部署每天處理數(shù)十億事件和 TB 級數(shù)據(jù)。Druid 被設(shè)計(jì)成 PB 級別。
