Apache ImpalaApache Hadoop 的本機(jī)分析數(shù)據(jù)庫
Apache Impala 是 Apache Hadoop 的開源本機(jī)分析數(shù)據(jù)庫。
- Impala 為Hadoop上的BI/分析查詢提供了低延遲和高并發(fā)性(Apache Hive等批處理框架無法提供)。Impala還可以線性擴(kuò)展,即使在多租戶環(huán)境中也是如此。
- 利用與你的Hadoop部署相同的文件和數(shù)據(jù)格式以及元數(shù)據(jù)、安全和資源管理框架--沒有冗余的基礎(chǔ)設(shè)施或數(shù)據(jù)轉(zhuǎn)換/重復(fù)。
- 對(duì)于Apache Hive用戶來說,Impala利用了相同的元數(shù)據(jù)和ODBC驅(qū)動(dòng)。與Hive一樣,Impala支持SQL,所以你不必?fù)?dān)心重新發(fā)明實(shí)現(xiàn)輪子。
- Impala集成了本地Hadoop安全和Kerberos認(rèn)證,通過Sentry模塊,你可以確保正確的用戶和應(yīng)用程序被授權(quán)使用正確的數(shù)據(jù)。
- 有了Impala,更多的用戶,無論是使用SQL查詢還是BI應(yīng)用,都可以通過一個(gè)單一的存儲(chǔ)庫和元數(shù)據(jù)存儲(chǔ),從源頭到分析,與更多的數(shù)據(jù)進(jìn)行互動(dòng)。
評(píng)論
圖片
表情
