TikTok 風(fēng)靡美國,還是推薦算法牛!
轉(zhuǎn)眼就開工了,7 天的假期,刷刷抖音,說走就走了。
說到抖音(在美國叫TikTok),就不得不提它的推薦系統(tǒng),太 NB 了。刷了啥,立刻記住你的偏好,推薦相似內(nèi)容,一不小心 2 小時(shí)就過去了,讓人欲罷不能,要么日活 6 億呢。
其實(shí)“推薦系統(tǒng)”從沒像現(xiàn)在這樣,影響著我們的生活。除了抖音、快手這類短視頻,還有網(wǎng)購時(shí),天貓、京東會(huì)為你推薦商品;想看看資訊,頭條、知乎會(huì)為你準(zhǔn)備感興趣的新聞等等。
而驅(qū)動(dòng)這些巨頭進(jìn)行推薦服務(wù)的,都是基于深度學(xué)習(xí)的推薦模型。
想起 2019 年阿里的千人千面系統(tǒng),促成了天貓“雙 11” 2684 億成交額。假設(shè)通過改進(jìn)商品推薦功能,使平臺(tái)整體的轉(zhuǎn)化率提升 1%,就能在 2684 億成交額的基礎(chǔ)上,再增加 26.84 億。這就是推薦工程師的最牛的地方,也是為啥人能拿百萬年薪的原因。
但在一個(gè)成熟的推薦系統(tǒng)上,找到提升的突破點(diǎn)并不容易——不能滿足于協(xié)同過濾、矩陣分解這類傳統(tǒng)方法,而要建立起完整的“深度學(xué)習(xí)推薦系統(tǒng)”知識(shí)體系,加深對(duì)深度學(xué)習(xí)模型的理解,以及大數(shù)據(jù)平臺(tái)的熟悉程度,才能實(shí)現(xiàn)整體效果上的優(yōu)化。
所以春節(jié)假期除了刷抖音,我又重新看了看《深度學(xué)習(xí)推薦系統(tǒng)》這個(gè)專欄,2 刷有不少新的啟發(fā)。作者王喆,Roku 推薦系統(tǒng)架構(gòu)負(fù)責(zé)人,也是咱圈里的大佬,一直深耕在推薦系統(tǒng)、計(jì)算廣告領(lǐng)域,經(jīng)驗(yàn)非常豐富。他之前出過同名的書,豆瓣評(píng)分 9.3,相當(dāng)高。
當(dāng)年我看書的時(shí)候,就感覺實(shí)踐太少,偏模型原理。所以在聽說王喆開了個(gè)實(shí)踐專欄時(shí),第一時(shí)間就訂閱了,跟著學(xué)下來,受益匪淺。讓我完整地把推薦系統(tǒng)的原理捋了一遍。下面王喆總結(jié)的「核心知識(shí)圖譜」,建議收藏。

最重要的是,實(shí)操性特別強(qiáng)。王喆特地為了這個(gè)專欄,開發(fā)了一個(gè)開源項(xiàng)目「 SparrowRecsys」,能讓你親手嘗試,搭建一套完整的深度學(xué)習(xí)推薦系統(tǒng)(下面有詳細(xì)介紹,賊有意思)。可以說是書的實(shí)踐版本,里面加入了更多技術(shù)細(xì)節(jié)的實(shí)現(xiàn)和討論。
毫不夸張的說,這個(gè)專欄讓我對(duì)深度學(xué)習(xí)推薦系統(tǒng)的認(rèn)知,提升到了一個(gè)新高度,所以很想把它推薦給你。這個(gè)專欄明晚 24:00 要漲價(jià)到 ¥129 了,現(xiàn)在到手僅 ¥69 ,一定別錯(cuò)過了,掃碼免費(fèi)試讀??
秒殺+口令「shendu666」
到手僅 ¥69 ,明晚 24:00 漲至 ¥129
王喆這課,為啥值得買?
先來說說這個(gè) SparrowRecsys 推薦系統(tǒng)。王喆把它叫做“麻雀推薦系統(tǒng)”,取“麻雀雖小、五臟俱全”之意,它利用了開源的 movielens 數(shù)據(jù)集,搭建起了包括:
Spark、Flink 特征工程
TensorFlow 深度學(xué)習(xí)模型訓(xùn)練
TensorFlow Serving 模型服務(wù)
Redis 在線特征數(shù)據(jù)庫
Jetty Server 推薦服務(wù)器
JS 前端實(shí)現(xiàn)
以上這些在內(nèi)的,一整套深度學(xué)習(xí)推薦系統(tǒng)。不說它能支撐起一個(gè)中大型公司的推薦系統(tǒng),但是毫無疑問,它可以成為一個(gè)工業(yè)級(jí)推薦系統(tǒng)的種子項(xiàng)目。而這一切,都能在課程里,一步步嘗試搭建起來。
最后你實(shí)現(xiàn)的推薦系統(tǒng)會(huì)是這個(gè)樣子??

SparrowRecSys的首頁

SparrowRecSys的相似電影推薦頁
在這些前端頁面的背后,是你能實(shí)現(xiàn)的一個(gè)又一個(gè)深度學(xué)習(xí)模型:
對(duì)于電影的相似推薦功能,王喆會(huì)使用各種 Embedding based 的方法,比如 item2vec,graph embedding 等等。
對(duì)于推薦功能,會(huì)基于 TensorFlow 實(shí)現(xiàn)Embedding MLP,Wide&Deep,NerualCF,Two Towers,DeepFM,DIN 等等深度學(xué)習(xí)模型,然后使用 TensorFlow serving 去進(jìn)行模型服務(wù)。
對(duì)于召回層、排序?qū)舆@些推薦邏輯,也會(huì)全盤在基于 Jetty 的推薦服務(wù)器中實(shí)現(xiàn)。
整個(gè)項(xiàng)目整體的技術(shù)架構(gòu)是下面這個(gè)樣子的:
SparrowRecSys的技術(shù)架構(gòu)
是不是感覺很牛。其次,專欄本計(jì)劃是 30 講,生生寫到 43 講,補(bǔ)充討論了很多熱門的問題。在這里貼 15 個(gè)專欄里討論的問題,看專欄留言區(qū)的討論,感覺收獲更大。

最后說說,他是怎樣講解這門課程的?
整體遵循了經(jīng)典推薦系統(tǒng)的框架,分為 6 部分,學(xué)懂了,實(shí)現(xiàn)一個(gè)工業(yè)級(jí)的深度學(xué)習(xí)推薦系統(tǒng),不成問題,簡單介紹下:
基礎(chǔ)架構(gòu)篇:講要從 0 開始實(shí)現(xiàn)的推薦系統(tǒng), Sparrow RecSys 的主要功能和技術(shù)架構(gòu),也會(huì)用到 Spark、Flink、TensorFlow 等業(yè)界最流行的機(jī)器學(xué)習(xí)和大數(shù)據(jù)框架。
特征工程篇:討論推薦系統(tǒng)會(huì)用到的特征,以及主要的特征處理方式,并將其實(shí)踐在 Spark 上。此外,還有深度學(xué)習(xí)中非常流行的 Embedding、Graph Embedding 技術(shù),并帶你實(shí)現(xiàn) Sparrow Recsys 中的相似電影推薦功能。
線上服務(wù)篇:帶你搭建一個(gè)推薦服務(wù)器,包括服務(wù)器、存儲(chǔ)、緩存、模型服務(wù)等模塊和相關(guān)知識(shí),涉及 Jetty Server, Spark、Redis 的使用。
推薦模型篇:深度學(xué)習(xí)推薦模型的原理和實(shí)現(xiàn)方法,包括 Embedding+MLP ,Wide&Deep,PNN 等深度學(xué)習(xí)模型的架構(gòu)和 TensorFlow 實(shí)現(xiàn),以及注意力機(jī)制、序列模型、增強(qiáng)學(xué)習(xí)等相關(guān)領(lǐng)域的前沿進(jìn)展。
效果評(píng)估篇:效果評(píng)估的主要方法和指標(biāo),建立起包括線下評(píng)估、線上 AB 測(cè)試、評(píng)估反饋閉環(huán)等整套的評(píng)估體系,真正能夠用業(yè)界的方法,而不是實(shí)驗(yàn)室的指標(biāo)來評(píng)價(jià)一個(gè)推薦系統(tǒng)。
前沿拓展篇:講 YouTube、阿里巴巴、微軟、Pinterest 等一線公司的深度學(xué)習(xí)應(yīng)用,幫你追蹤業(yè)界發(fā)展的最新趨勢(shì)。
可以說,王喆老師的書也好,課也好,從未叫人失望過,而且他人也特別 nice,經(jīng)常在專欄下面跟讀者留言互動(dòng),這種耐心和責(zé)任心,真不是一般人有的。
好了,再強(qiáng)調(diào)一遍
專欄原價(jià) ¥99,秒殺 ¥79
疊加優(yōu)惠口令「shendu666」
到手 ¥69,相當(dāng)于半價(jià)了
明晚 24:00 就漲到 ¥129 啦
??掃碼免費(fèi)試讀
沒計(jì)劃的學(xué)習(xí),都只是作秀。與其花時(shí)間找一堆資料,還不如有計(jì)劃的消化一個(gè)系統(tǒng)的課,更值。
??點(diǎn)擊「閱讀原文」,記得用口令「shendu666」,到手僅¥69,明晚 24:00 漲價(jià)到 ¥129 了。
