Cloudera Impala基于Hadoop的實(shí)時(shí)查詢
Cloudera 發(fā)布實(shí)時(shí)查詢開源項(xiàng)目 Impala (黑斑羚)!多款產(chǎn)品實(shí)測(cè)表明,比原來基于MapReduce的Hive SQL查詢速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于藍(lán)勝于藍(lán)。
Impala采用與Hive相同的元數(shù)據(jù)、SQL語法、ODBC驅(qū)動(dòng)程序和用戶接口(Hue Beeswax),這樣在使用CDH產(chǎn)品時(shí),批處理和實(shí)時(shí)查詢的平臺(tái)是統(tǒng)一的。目前支持的文件格式是文本文件和SequenceFiles(可以壓縮為Snappy、GZIP和BZIP,前者性能最好)。其他格式如Avro, RCFile, LZO文本和Doug Cutting的Trevni將在正式版中支持。
評(píng)論
圖片
表情
