Apache Fluo大規(guī)模數(shù)據(jù)集增量處理系統(tǒng)
Apache Fluo 是 Google Percolator(搜索索引)的開源實現(xiàn),允許用戶對存儲在 Apache Accumulo 中的大型數(shù)據(jù)集進行增量更新,而無需重新處理所有的數(shù)據(jù)。與批處理和流處理框架不同的是,F(xiàn)luo 提供了更低的延遲,并且可以在極大的數(shù)據(jù)集上運行。
在將新數(shù)據(jù)與現(xiàn)有數(shù)據(jù)相結(jié)合時,與批處理框架(例如 Spark,MapReduce)相比,F(xiàn)luo 可明顯減少延遲。其增量更新是使用事務實現(xiàn)的,允許數(shù)千個更新同時發(fā)生而不會破壞數(shù)據(jù)。
Fluo 已于 2017 年 7 月孵化成功,畢業(yè)成為 Apache 頂級項目。
評論
圖片
表情
