Apache Tajo分布式數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)
Tajo 是一個(gè)分布式數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),基于 Hadoop 實(shí)現(xiàn),特點(diǎn)是低延遲、高可伸縮,提供專用查詢和 ETL 工具
特點(diǎn):
-
可伸縮性和低延遲
-
完全分布式的 SQL 查詢處理,基于存儲(chǔ)雨 HDFS 的大數(shù)據(jù)集
-
超低響應(yīng)時(shí)間(約100毫秒),在合理數(shù)據(jù)范圍內(nèi)的簡(jiǎn)單查詢
-
-
支持長(zhǎng)時(shí)間運(yùn)行的查詢
-
容錯(cuò)支持,避免某些任務(wù)失敗后的查詢重啟
-
動(dòng)態(tài)調(diào)度,處理和異構(gòu)集群節(jié)點(diǎn)故障
-
-
ETL
-
ETL 可實(shí)現(xiàn)不同數(shù)據(jù)格式之間的轉(zhuǎn)換
-
支持多種文件格式,如 CSV、RCFile 和 RowFile
-
-
擴(kuò)展性
-
支持用戶自定義函數(shù)
-
提供自定義文件格式的 Scanner/Appender 接口
-
-
兼容性
-
遵循 ANSI/ISO SQL 標(biāo)準(zhǔn),非標(biāo)準(zhǔn)方面遵循 PostgreSQL 規(guī)范
-
支持 HiveQL 模式
-
在 HCatalog 和 Hive MetaStore 實(shí)現(xiàn)表訪問(wèn)
-
支持 JDBC 驅(qū)動(dòng)
-
-
簡(jiǎn)單
-
提供交互式 Shell 來(lái)提交 SQL 查詢到 Tajo 集群
-
提供備份和恢復(fù)工具
-
異步/同步 Java API 來(lái)提交 SQL 查詢到 Tajo 集群
-
評(píng)論
圖片
表情
