圖解 Kafka,畫(huà)得太好了!
點(diǎn)擊上方“程序員大白”,選擇“星標(biāo)”公眾號(hào)
重磅干貨,第一時(shí)間送達(dá)

Kafka 是主流的消息流系統(tǒng),其中的概念還是比較多的,下面通過(guò)圖示的方式來(lái)梳理一下 Kafka 的核心概念,以便在我們的頭腦中有一個(gè)清晰的認(rèn)識(shí)。
基礎(chǔ)
Kafka 是一套流處理系統(tǒng),可以讓后端服務(wù)輕松的相互溝通,是微服務(wù)架構(gòu)中常用的組件。

生產(chǎn)者消費(fèi)者
生產(chǎn)者服務(wù) Producer 向 Kafka 發(fā)送消息,消費(fèi)者服務(wù) Consumer 監(jiān)聽(tīng) Kafka 接收消息。

一個(gè)服務(wù)可以同時(shí)為生產(chǎn)者和消費(fèi)者。

Topics 主題
Topic 是生產(chǎn)者發(fā)送消息的目標(biāo)地址,是消費(fèi)者的監(jiān)聽(tīng)目標(biāo)。

一個(gè)服務(wù)可以監(jiān)聽(tīng)、發(fā)送多個(gè) Topics。

Kafka 中有一個(gè)【consumer-group(消費(fèi)者組)】的概念。
這是一組服務(wù),扮演一個(gè)消費(fèi)者。

如果是消費(fèi)者組接收消息,Kafka 會(huì)把一條消息路由到組中的某一個(gè)服務(wù)。

這樣有助于消息的負(fù)載均衡,也方便擴(kuò)展消費(fèi)者。
Topic 扮演一個(gè)消息的隊(duì)列。
首先,一條消息發(fā)送了。

然后,這條消息被記錄和存儲(chǔ)在這個(gè)隊(duì)列中,不允許被修改。

接下來(lái),消息會(huì)被發(fā)送給此 Topic 的消費(fèi)者。
但是,這條消息并不會(huì)被刪除,會(huì)繼續(xù)保留在隊(duì)列中。

繼續(xù)發(fā)送消息。另外,關(guān)注公眾號(hào)Java技術(shù)棧,在后臺(tái)回復(fù):面試,可以獲取我整理的 Java 系列面試題和答案,非常齊全。

像之前一樣,這條消息會(huì)發(fā)送給消費(fèi)者、不允許被改動(dòng)、一直呆在隊(duì)列中。
(消息在隊(duì)列中能呆多久,可以修改 Kafka 的配置)


Partitions 分區(qū)
上面 Topic 的描述中,把 Topic 看做了一個(gè)隊(duì)列,實(shí)際上,一個(gè) Topic 是由多個(gè)隊(duì)列組成的,被稱為【Partition(分區(qū))】。
這樣可以便于 Topic 的擴(kuò)展。

生產(chǎn)者發(fā)送消息的時(shí)候,這條消息會(huì)被路由到此 Topic 中的某一個(gè) Partition。

消費(fèi)者監(jiān)聽(tīng)的是所有分區(qū)。

生產(chǎn)者發(fā)送消息時(shí),默認(rèn)是面向 Topic 的,由 Topic 決定放在哪個(gè) Partition,默認(rèn)使用輪詢策略。

也可以配置 Topic,讓同類(lèi)型的消息都在同一個(gè) Partition。
例如,處理用戶消息,可以讓某一個(gè)用戶所有消息都在一個(gè) Partition。
例如,用戶1發(fā)送了3條消息:A、B、C,默認(rèn)情況下,這3條消息是在不同的 Partition 中(如 P1、P2、P3)。
在配置之后,可以確保用戶1的所有消息都發(fā)到同一個(gè)分區(qū)中(如 P1)。

這個(gè)功能有什么用呢?
這是為了提供消息的【有序性】。
消息在不同的 Partition 是不能保證有序的,只有一個(gè) Partition 內(nèi)的消息是有序的。


架構(gòu)
Kafka 是集群架構(gòu)的,ZooKeeper是重要組件。

ZooKeeper 管理者所有的 Topic 和 Partition。
Topic 和 Partition 存儲(chǔ)在 Node 物理節(jié)點(diǎn)中,ZooKeeper負(fù)責(zé)維護(hù)這些 Node。

例如,有2個(gè) Topic,各自有2個(gè) Partition。

這是邏輯上的形式,但在 Kafka 集群中的實(shí)際存儲(chǔ)可能是這樣的:

Topic A 的 Partition #1 有3份,分布在各個(gè) Node 上。
這樣可以增加 Kafka 的可靠性和系統(tǒng)彈性。
3個(gè) Partition #1 中,ZooKeeper 會(huì)指定一個(gè) Leader,負(fù)責(zé)接收生產(chǎn)者發(fā)來(lái)的消息。

其他2個(gè) Partition #1 會(huì)作為 Follower,Leader 接收到的消息會(huì)復(fù)制給 Follower。

這樣,每個(gè) Partition 都含有了全量消息數(shù)據(jù)。

即使某個(gè) Node 節(jié)點(diǎn)出現(xiàn)了故障,也不用擔(dān)心消息的損壞。
Topic A 和 Topic B 的所有 Partition 分布可能就是這樣的:

感謝閱讀,希望對(duì)你有所幫助 :)翻譯整理自:https://timothystepro.medium.com/visualizing-kafka-20bc384803e7
譯文:https://blog.csdn.net/duysh/article/details/116355977
推薦閱讀
國(guó)產(chǎn)小眾瀏覽器因屏蔽視頻廣告,被索賠100萬(wàn)(后續(xù))
年輕人“不講武德”:因看黃片上癮,把網(wǎng)站和786名女主播起訴了
關(guān)于程序員大白
程序員大白是一群哈工大,東北大學(xué),西湖大學(xué)和上海交通大學(xué)的碩士博士運(yùn)營(yíng)維護(hù)的號(hào),大家樂(lè)于分享高質(zhì)量文章,喜歡總結(jié)知識(shí),歡迎關(guān)注[程序員大白],大家一起學(xué)習(xí)進(jìn)步!

