Apache Kafka分布式發(fā)布訂閱消息系統(tǒng)
kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),她有如下特性:
-
通過O(1)的磁盤數(shù)據(jù)結(jié)構(gòu)提供消息的持久化,這種結(jié)構(gòu)對于即使數(shù)以TB的消息存儲也能夠保持長時間的穩(wěn)定性能。
-
高吞吐量:即使是非常普通的硬件kafka也可以支持每秒數(shù)十萬的消息。
-
支持通過kafka服務(wù)器和消費機集群來分區(qū)消息。
-
支持Hadoop并行數(shù)據(jù)加載。
卡夫卡的目的是提供一個發(fā)布訂閱解決方案,它可以處理消費者規(guī)模的網(wǎng)站中的所有動作流數(shù)據(jù)。 這種動作(網(wǎng)頁瀏覽,搜索和其他用戶的行動)是在現(xiàn)代網(wǎng)絡(luò)上的許多社會功能的一個關(guān)鍵因素。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。 對于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng),但又要求實時處理的限制,這是一個可行的解決方案。kafka的目的是通過Hadoop的并行加載機制來統(tǒng)一線上和離線的消息處理,也是為了通過集群機來提供實時的消費。
Git 地址:
http://git-wip-us.apache.org/repos/asf/kafka.git
評論
圖片
表情
