詳解今日頭條技術(shù)架構(gòu)分析

- 背景 -
5億注冊(cè)用戶;
2014年5月1.5億,2015年5月3億,2016年5月份為5億。幾乎為成倍增長(zhǎng)。
日活4800萬(wàn)用戶;
2014年為1000萬(wàn)日活,2015年為3000萬(wàn)日活。
日均5億PV;
5億文章瀏覽,視頻為1億。頁(yè)面請(qǐng)求量超過(guò)30億次。
用戶停留時(shí)長(zhǎng)超過(guò)65分鐘以上。

- 文章抓取與分析 -

- 用戶建模 -

- 新用戶的冷啟動(dòng) -

- 推薦系統(tǒng) -


- 數(shù)據(jù)存儲(chǔ) -

- 消息推送 -

- 今日頭條系統(tǒng)架構(gòu) -





- 頭條微服務(wù)架構(gòu) -


- 頭條的虛擬化 PaaS 平臺(tái)規(guī)劃 -


- 總結(jié) -
數(shù)據(jù)生成與采集; 數(shù)據(jù)傳輸:Kafka做消息總線連接在線和離線系統(tǒng); 數(shù)據(jù)入庫(kù):數(shù)據(jù)倉(cāng)庫(kù)、ETL(抽取轉(zhuǎn)換加載); 數(shù)據(jù)計(jì)算:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)表如何能被高效的查詢很關(guān)鍵,因?yàn)檫@會(huì)直接關(guān)系到數(shù)據(jù)分析的效率。常見(jiàn)的查詢引擎可以歸到三個(gè)模式中,Batch 類、MPP 類、Cube 類,頭條在 3 種模式上都有所應(yīng)用。
參考資料: 今日頭條的核心架構(gòu)解析 Go – 今日頭條架構(gòu) 從無(wú)到有、從小到大,今日頭條大數(shù)據(jù)平臺(tái)實(shí)踐經(jīng)歷的那些坑 今日頭條推薦系統(tǒng)架構(gòu)設(shè)計(jì)實(shí)踐
作者:鐘鎮(zhèn)剛
來(lái)源:blog.csdn.net/mucaoyx/article/details/84498468
關(guān)注公眾號(hào),回復(fù):抽獎(jiǎng)。抽獎(jiǎng)一個(gè)iPad獎(jiǎng)品!
評(píng)論
圖片
表情
