<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          網(wǎng)易云音樂推薦中的用戶行為序列深度建模

          共 7701字,需瀏覽 16分鐘

           ·

          2020-11-28 00:51

          導(dǎo)讀:近年來,網(wǎng)易云音樂作為一匹黑馬迅速在移動(dòng)音樂APP占據(jù)市場(chǎng),2016年用戶量就突破了2億,而這與它優(yōu)質(zhì)的推薦系統(tǒng)必不可分。網(wǎng)易云音樂推薦系統(tǒng)致力于通過AI算法的落地,實(shí)現(xiàn)千人千面的個(gè)性化音樂推薦系統(tǒng)。本文將重點(diǎn)介紹推薦系統(tǒng)在云音樂的落地實(shí)踐,以及在音樂推薦系統(tǒng)中遇到的挑戰(zhàn)和解決方案。使大家了解音樂場(chǎng)景下的多行為域的序列建模,包括用戶多興趣點(diǎn)挖掘、多空間長(zhǎng)短期興趣建模,以及音樂場(chǎng)景下的用戶興趣演化網(wǎng)絡(luò)建模。主要內(nèi)容包括:

          • 網(wǎng)易云音樂簡(jiǎn)介

          • 召回體系探索

          • 精排模型演化歷程

          • 音樂推薦場(chǎng)景AI思考

          01

          網(wǎng)易云音樂簡(jiǎn)介

          1. 關(guān)于網(wǎng)易云音樂

          網(wǎng)易云音樂是專注于發(fā)現(xiàn)與分享的音樂產(chǎn)品,依托專業(yè)的音樂人、好友推薦、算法推薦,以及社交功能,為用戶打造全新的音樂生活方式。網(wǎng)易云音樂有一個(gè)非常受用戶喜愛的樂評(píng)社區(qū),加深了人和人之間的聯(lián)系,用戶會(huì)經(jīng)常分享與歌曲有關(guān)的想法,形成了一個(gè)比較溫暖的社區(qū)。另一個(gè)受用戶好評(píng)的是云音樂精準(zhǔn)推薦功能,它有很多推薦場(chǎng)景供用戶進(jìn)行選擇,可以幫助用戶快速發(fā)現(xiàn)更多更優(yōu)質(zhì)的歌曲,讓我們千萬的曲庫(kù),能夠分發(fā)到每一個(gè)屬于他的用戶。同時(shí),為了音樂產(chǎn)業(yè)的發(fā)展,我們對(duì)音樂人進(jìn)行了大力支持。目前我們音樂內(nèi)已經(jīng)入駐了10萬+的音樂人,每年可以產(chǎn)出2萬多首原創(chuàng)歌曲,給音樂人創(chuàng)造了良好的音樂環(huán)境。

          以UGC用戶創(chuàng)建歌單,使云音樂打破了傳統(tǒng)專輯歌手分類組織的方式。以歌單為核心的播放模式,可以以社交化的分享和個(gè)性化的推薦來解決用戶發(fā)現(xiàn)尋找音樂的需求。19年,推出了MGC的歌單式,通過算法來動(dòng)態(tài)生成各種主題的歌單,這種全新的形式給用戶帶來了全新的體驗(yàn)。使我們可以有更多優(yōu)質(zhì)的歌曲在歌單中得到有效的曝光。同時(shí),我們還推出了MLOG,一種圖片音樂文字相結(jié)合的產(chǎn)品,讓音樂不僅可以聽,還可以看和玩。

          2. 多形式推薦場(chǎng)景

          回到我們最關(guān)注的音樂推薦算法:在云音樂內(nèi)有非常多形式的推薦場(chǎng)景,供用戶自行選擇。

          • 每日推薦:以列表形式展示,該場(chǎng)景會(huì)比較關(guān)注用戶長(zhǎng)期的偏好,讓用戶每天在這個(gè)場(chǎng)景中獲得他喜歡的歌曲。

          • 私人FM:一種流式推薦方式,能根據(jù)用戶實(shí)時(shí)播放行為去分析用戶對(duì)之前對(duì)推薦歌曲的反饋,從而去影響后續(xù)要給他推薦的內(nèi)容。對(duì)于那些想要尋找一些新奇新穎歌曲的用戶,這種方式會(huì)是很不錯(cuò)的場(chǎng)景。

          • 歌單推薦:同時(shí)對(duì)于歌單這種特有的播放形式,在首頁(yè)和歌單廣場(chǎng)上,也會(huì)進(jìn)行豐富的推薦。

          3.?音樂推薦?VS?電商推薦

          大家可能對(duì)電商領(lǐng)域的推薦系統(tǒng)更了解,并且有很多團(tuán)隊(duì)做出了比較優(yōu)秀的工作。所以,我們?cè)谝魳奉I(lǐng)域內(nèi)想要完成一個(gè)推薦系統(tǒng),與電商推薦系統(tǒng)有哪些不同?又有哪些差異?

          兩種推薦系統(tǒng)的相同點(diǎn):

          • 都是幫助用戶去更快速的獲取他們想要的資源

          • 都是以用戶使用體驗(yàn)為導(dǎo)向

          但是這里的資源在電商領(lǐng)域是商品,而商品具有特定的功能和用途。所以對(duì)用戶來說,有一個(gè)特定的現(xiàn)實(shí)作用。而對(duì)于音樂領(lǐng)域,一首歌曲,該怎么去理解?每個(gè)用戶對(duì)歌曲的理解是千差萬別的,如何把握住用戶對(duì)音樂的感受是我們非常關(guān)注的。

          其次一個(gè)非常大的不同點(diǎn)在于:商品是不可重復(fù)消費(fèi)的。例如用戶購(gòu)買了一臺(tái)電視機(jī),可能在較長(zhǎng)的一段時(shí)間之內(nèi),用戶沒有電視機(jī)的需求了。但是對(duì)于音樂來說,完全可以重復(fù)消費(fèi)。比如一周之前聽過的歌曲,可能今天還在聽;昨天聽過的歌曲,今天還可以單曲循環(huán);甚至一個(gè)月之前一年前的那些老歌,都能拿來反復(fù)的進(jìn)行播放。這一點(diǎn)就是非常大的不同。

          同時(shí),消費(fèi)一首歌曲的時(shí)間成本是遠(yuǎn)高于點(diǎn)擊商品的??赡軒酌腌娭畠?nèi)就曝光了非常多的商品,并且可以通過瀏覽商品的圖片查看商品的標(biāo)題。用戶就能在短時(shí)間之內(nèi)大致的了解到這些商品。但是歌曲就不一樣,用戶可能會(huì)對(duì)歌手有一定的了解。但是在很多情況下,演唱者對(duì)用戶是陌生的。只有真正的去播放這首歌曲,甚至是需要播放到中間的副歌部分,才能真正感受到這首歌曲,對(duì)他的感覺,這就需要1~2分鐘的消費(fèi)時(shí)間。所以很多時(shí)候,用戶歷史的歌曲消費(fèi)行為,包含著非常多的信息。如何把其中的關(guān)聯(lián)關(guān)系挖掘出來,是我們研究的一個(gè)重點(diǎn)方向。

          02
          召回體系探索

          接下來介紹下,我們?cè)谡倩伢w系中做的一些探索和想法。

          云音樂召回系統(tǒng)簡(jiǎn)化框架:

          我們會(huì)從數(shù)據(jù)庫(kù)中清洗、抽取用戶行為序列,對(duì)用戶進(jìn)行偏好分析,對(duì)歌曲進(jìn)行理解,以及對(duì)行為訓(xùn)練的深度建模。我們會(huì)從多個(gè)角度來進(jìn)行歌曲的召回。之前云音樂做的部分召回算法,主要以CF協(xié)同過濾為主,我們?cè)趨f(xié)同過濾算法中,也做了非常多的創(chuàng)新和優(yōu)化,并取得了顯著的效果。但是我們也非常想從用戶自身行為中挖掘到隱式的信息。

          問題思考:

          所以在準(zhǔn)備建立我們?nèi)抡倩伢w系時(shí),我們帶著兩個(gè)思考。

          用戶的興趣點(diǎn)在哪里能夠體現(xiàn)出來?用戶的興趣是單一不變的嗎?

          對(duì)于這兩個(gè)問題,我們進(jìn)行了比較多的調(diào)研和數(shù)據(jù)分析。最終,我們找到了兩個(gè)方向:

          • 一個(gè)是從用戶的聽歌記錄中挖掘用戶的興趣點(diǎn),就像前面說所說的音樂消費(fèi)時(shí)間成本,從聽歌記錄中抓住用戶的偏好

          • 其次用戶對(duì)音樂的感受是非常多樣化的,并且會(huì)隨著時(shí)間和用戶的興趣產(chǎn)生偏移

          基于這兩點(diǎn),為大家介紹云音樂結(jié)合音樂相關(guān)知識(shí)的一些召回算法,并且其中的一些召回算法成功的在云音樂上線了。

          1.?實(shí)時(shí)興趣向量建模

          首先介紹實(shí)時(shí)興趣向量召回模型。這個(gè)模型大家應(yīng)該比較熟悉,原型就是youtube提出的視頻召回模型。這個(gè)模型會(huì)將用戶和歌曲映射到同一個(gè)低維度的向量空間中,計(jì)算用戶和歌曲的相似值,取top-k作為最終的結(jié)果。這個(gè)模型首先會(huì)對(duì)性能有個(gè)比較大的要求,因?yàn)橥扑]的歌曲池比較大,所以要有一個(gè)比較高效的向量檢索引擎。云音樂自研了n-search系統(tǒng),給這些向量召回的模型提供了技術(shù)上的支持。

          在這個(gè)模型上,我們做了一些優(yōu)化:

          其中一個(gè)優(yōu)化是使用了self-attention來代替原有的average-pooling。因?yàn)樵谠埔魳防锩?,歌曲?jīng)常是以列表形式播放的,所以我們更需要關(guān)注的是列表中歌曲之間的關(guān)系。因此,我們使用了self-attention的網(wǎng)絡(luò)結(jié)構(gòu)來挖掘內(nèi)部間的聯(lián)系。

          另一個(gè)優(yōu)化是對(duì)于原有的搜索序列,我們會(huì)用點(diǎn)擊的序列代替。因?yàn)槲覀冏铋_始發(fā)現(xiàn)搜索這個(gè)序列,因?yàn)橛衠uery先驗(yàn)的信息,最終召回結(jié)果會(huì)非常依賴這個(gè)序列數(shù)據(jù),很容易造成過擬合。所以我們轉(zhuǎn)向了用戶的另外一種主動(dòng)形式,選擇了用戶點(diǎn)擊歌曲的序列。因?yàn)閺臄?shù)據(jù)上會(huì)發(fā)現(xiàn)經(jīng)常有些用戶會(huì)將音樂一直播放著,成為一種背景音樂的形式,或者像是商場(chǎng)之類的公共場(chǎng)所,會(huì)不停地循環(huán)播放。但是,如果用戶有點(diǎn)擊,說明當(dāng)前點(diǎn)擊的歌曲是在用戶主動(dòng)意識(shí)下的一個(gè)行為,提高了置信度。

          在這兩點(diǎn)優(yōu)化下,最后召回模型的效果比之前表現(xiàn)的會(huì)更加優(yōu)異。例如,用戶實(shí)時(shí)點(diǎn)擊并播放了一個(gè)電子歌單,我們能及時(shí)給用戶召回這個(gè)電子風(fēng)格的歌曲。在模型中我們還對(duì)樣本做了一些處理。比如說剛剛提到的商場(chǎng)播放歌曲,可以看作一種機(jī)器人行為。網(wǎng)易云音樂有為數(shù)眾多的用戶,他們的行為會(huì)非常的活躍,所以我們避免這些活躍的用戶和機(jī)器人的行為影響最后的訓(xùn)練,我們會(huì)對(duì)每個(gè)用戶限制樣本的數(shù)據(jù),避免負(fù)向影響。同時(shí),我們?cè)谟脩魝?cè)引入了非常豐富的用戶畫像信息,對(duì)于沒有行為序列的用戶,也可以觸發(fā)這個(gè)召回模式,為這些用戶召回歌曲。

          2. 動(dòng)態(tài)多興趣建模

          動(dòng)態(tài)多興趣挖掘模型:這個(gè)模型中,會(huì)將用戶的行為序列作為輸入,通過信息膠囊網(wǎng)絡(luò)抽離出用戶信息向量,也就是上圖中間的網(wǎng)絡(luò)結(jié)構(gòu)。因?yàn)橛脩袈牳栌涗浧鋵?shí)是多樣豐富的。比如說用戶會(huì)在早上會(huì)聽一些節(jié)奏比較歡快的歌曲,下午工作時(shí)可能會(huì)聽一些舒緩的慢歌,周末可能會(huì)聽一些搖滾的歌曲。所以我們需要通過建模,把用戶內(nèi)部的多個(gè)興趣點(diǎn)挖掘出來。如果用戶行為序列并沒有那么豐富的話,可能它內(nèi)部隱含的信息就相對(duì)比較少。此時(shí),會(huì)選擇動(dòng)態(tài)的興趣數(shù),根據(jù)序列的長(zhǎng)度來進(jìn)行自適應(yīng)的選擇。這個(gè)模型在訓(xùn)練的過程中會(huì)使用attention的方式,把target信息利用起來。而在serving階段,我們是沒有target信息的。所以在這里對(duì)于用戶的每個(gè)用戶的興趣向量,我們都將進(jìn)行topk的召回。這個(gè)模型對(duì)于口味豐富的用戶來說,能夠訓(xùn)練出比較多的興趣點(diǎn),像粵語類的歌曲、英文的搖滾,歐美電子這一類的風(fēng)格。

          3. 音樂知識(shí)圖譜

          利用知識(shí)圖譜的召回。我們的知識(shí)圖譜,建立了音樂數(shù)據(jù)中不同實(shí)體之間的關(guān)系。這里面每一條知識(shí)表示主謂賓的三元組,比如說某一首歌曲是屬于某張專輯的,而這張專輯又是某一個(gè)電視劇的原聲音樂,這時(shí)我們會(huì)通曲庫(kù)內(nèi)部和外部的信息挖掘,逐步地把整個(gè)音樂知識(shí)圖譜建立起來,可以得到不同實(shí)體之間一步兩步甚至多步的關(guān)系,比如表面上看起來可能毫不相干的兩個(gè)藝人,因?yàn)檫@兩位藝人同時(shí)給同一個(gè)電視劇演唱的關(guān)系,就形成了一個(gè)關(guān)聯(lián)關(guān)系?;蛘呦褚粋€(gè)綜藝節(jié)目,例如我是歌手,參與不同季的歌手也可以形成關(guān)聯(lián)關(guān)系。我們可以通過用戶歷史行為,關(guān)聯(lián)到其他不同的實(shí)體歌曲,從而進(jìn)行召回。而且音樂知識(shí)圖譜中,不僅包含了歌曲這種實(shí)體。還包含視頻、MV、MLOG這些不同實(shí)體的信息,這些對(duì)于其他實(shí)體的推薦提供了有力的支持。

          4.?長(zhǎng)短期興趣挖掘

          長(zhǎng)短期興趣挖掘模型:我們基于SDM模型進(jìn)行了非常多的改進(jìn),在原始的SDM模式中,會(huì)通過一個(gè)門結(jié)構(gòu)來進(jìn)行長(zhǎng)短期興趣向量的加權(quán)。但在我們真實(shí)的實(shí)踐中,發(fā)現(xiàn)了一個(gè)問題,我們把這個(gè)門結(jié)構(gòu)中的權(quán)重打印出來,發(fā)現(xiàn)長(zhǎng)期興趣的權(quán)重非常小,最終用戶加權(quán)的向量表示基本只包含了短期的興趣,而對(duì)長(zhǎng)期的興趣影響非常小。這和我們最開始想要挖掘長(zhǎng)期興趣的目的是不符的。

          經(jīng)過非常多的嘗試后,我們最終將用戶的性質(zhì)分為長(zhǎng)短兩個(gè)興趣空間。在長(zhǎng)期興趣空間和短期興趣空間中,分別計(jì)算它的loss,解決了我們最開始的問題。由于我們建了兩個(gè)空間,我們?cè)趕ide information上做了比較多的嘗試,擴(kuò)充了非常多的wide類的特征。在整個(gè)建模過程中,我們對(duì)feature的輸入也會(huì)進(jìn)行一些優(yōu)化。用戶對(duì)一首歌曲,如果是具有重復(fù)播放的偏愛,他可能是因?yàn)橄矚g演唱這首歌曲的歌手,或者喜歡這個(gè)歌曲的風(fēng)格,或者語種是他非常感興趣的。上層的信息一直影響用戶感受,所以對(duì)于長(zhǎng)期的信息建模過程中,我們將歌曲的信息進(jìn)行了一個(gè)上浮,把歌曲的畫像進(jìn)行了詳細(xì)的建模。這個(gè)模型,也是融入了云音樂算法團(tuán)隊(duì)很多的思考和對(duì)音樂本身的理解,最后有效的權(quán)衡了音樂傳感器的興趣。

          5. 為什么需要多路融合召回?

          除了以上介紹的召回模型,我們還有非常多的其他的召回方式。為什么音樂推薦需要多路融合召回?答案是我們算法對(duì)音樂的理解,因?yàn)橐魳返谋举|(zhì)是情感的寄托。可能這句話會(huì)比較抽象,從歌曲和用戶兩個(gè)角度來具體解釋下:

          歌曲會(huì)有非常多的標(biāo)簽,像常見的語種、風(fēng)格,就有非常多的類別。而場(chǎng)景情感主題這些標(biāo)簽,是基于用戶對(duì)這些歌曲的感受來分類的。而且同一首歌不同的用戶也會(huì)聽出不一樣的感受,所以這就需要我們將歌曲的不同維度、用戶的偏好來進(jìn)行充分挖掘,精準(zhǔn)的找到用戶喜歡這首歌的點(diǎn)在哪。然后我們也可以從歌曲的評(píng)論區(qū)中,發(fā)現(xiàn)很多用戶評(píng)論表達(dá)的一些情感,比如這里有用戶說:"這首歌曲他聽了非常多年,還是一直很喜歡"。所以說用戶的情感是一直存在的,算法要做的就是對(duì)這些情感進(jìn)行喚起,來加強(qiáng)用戶對(duì)于情感的表達(dá)。

          03
          精排模型演化歷程

          下面分享云音樂在精排系統(tǒng)中關(guān)于用戶行為序列的一些深度建模經(jīng)驗(yàn):

          行為鏈路:

          在具體介紹精排模型之前,簡(jiǎn)單介紹下用戶在云音樂中的行為鏈路。我們以每日推薦場(chǎng)景來做具體的介紹。用戶進(jìn)入日推,首先歌曲會(huì)得到曝光。用戶可能會(huì)點(diǎn)擊某些歌曲,也可能直接進(jìn)行了播放。在播放的過程中或者結(jié)束時(shí),用戶會(huì)進(jìn)行顯隱式的反饋。比如進(jìn)行收藏行為或者是切歌的行為,甚至可以將歌曲標(biāo)注為不感興趣,當(dāng)然也可以什么都不做,繼續(xù)播放下一首。在用戶整個(gè)行為里面,可以看到收藏、點(diǎn)擊、完整播放,這些action是屬于用戶正向的反饋;而曝光不播放或者是曝光時(shí)間非常短,不感興趣的,都是一些負(fù)反饋。對(duì)用戶這些行為進(jìn)行累積,我們可以對(duì)他之前的語種偏好、風(fēng)格偏好、藝人、年代熱度等等,進(jìn)行重新調(diào)整,從而更好的進(jìn)行下一次推薦。

          云音樂精排模型迭代歷程:

          云音樂精模型的迭代歷程,時(shí)間跨度比較久。最開始從最簡(jiǎn)單的線性模型開始,有比較強(qiáng)的解釋性,并且符合當(dāng)時(shí)快速迭代的需求。但是它的缺點(diǎn)還是比較明顯的:表達(dá)能力非常有限。所以在此基礎(chǔ)上我們逐漸在這個(gè)方向進(jìn)行優(yōu)化。對(duì)于模型的擬合能力,希望有更進(jìn)一步的加強(qiáng)。在后期,也逐漸的引入了外部的特征,我們做了比較多的特征交叉,使我們的特征維度達(dá)到了很高的級(jí)別。最后,利用參數(shù)服務(wù)器成功將FTRL模型在云音樂中得到了一個(gè)上限,模型記憶類的特征使得整個(gè)模型的刻畫能力得到了非常大的加強(qiáng),但因?yàn)樘卣骶S度過大,計(jì)算的復(fù)雜度很高,逐漸向深度神經(jīng)網(wǎng)絡(luò)進(jìn)行發(fā)展。全連接網(wǎng)絡(luò)和一些cross的操作使得模型的表達(dá)能力變更強(qiáng)。我們慢慢將用戶的行為序列考慮了進(jìn)來,學(xué)習(xí)用戶行為序列中隱藏的關(guān)系。

          整個(gè)過程中,也是我們對(duì)業(yè)務(wù)理解逐漸加深的過程,所以模型也會(huì)復(fù)雜化。后面要分享的是我們?cè)谏疃葧r(shí)序網(wǎng)絡(luò)階段中,結(jié)合用戶相關(guān)的行為數(shù)據(jù),做的一些創(chuàng)新和優(yōu)化。

          1. 用戶行為序列建模

          首先嘗試的是深度興趣網(wǎng)絡(luò)模型,這個(gè)模型和之前所嘗試的模型,一個(gè)比較大的突破,是在用戶行為序列數(shù)據(jù)上的處理。之前會(huì)將用戶序列行為的embedding向量進(jìn)行sum pooling操作。這種壓縮方式,會(huì)造成一些程度上的信息丟失。對(duì)于相當(dāng)重要的embedding向量,可能就沒有辦法完全突出自己的信息。所以我們?cè)诮5倪^程中引入了attention機(jī)制,attention機(jī)制的本質(zhì)可以認(rèn)為是一個(gè)加強(qiáng)的求和,可以讓模型更加關(guān)注到它認(rèn)為有用的信息,著重的影響本次推薦的行為。每一首在行為序列中的歌曲,我們也會(huì)刻畫的比較豐富。對(duì)于歌曲畫像,我們會(huì)包含歌曲的embedding向量、風(fēng)格、語種、藝人信息、專輯信息等等。豐富的歌曲畫像,可以讓模型更好的關(guān)注到用戶本次點(diǎn)擊的興趣點(diǎn)在哪里。

          2. 用戶興趣演化模型

          在做推薦系統(tǒng)的過程中,很容易體會(huì)到一個(gè)現(xiàn)象,就是用戶越新的行為,能夠反映用戶當(dāng)時(shí)的興趣,對(duì)于推測(cè)之后的行為發(fā)揮的作用也是越大的;舊的行為發(fā)揮的作用就相對(duì)弱一些,這說明用戶的興趣是在不斷變化的。特別是在音樂中,外界的流行趨勢(shì)會(huì)發(fā)生非常大的改變。可能在幾年內(nèi),甚至是幾個(gè)月內(nèi)流行的方向,就發(fā)生一次非常大的改變。同時(shí),用戶自身的興趣,也會(huì)發(fā)生變化。所以我們?cè)谀P椭?,如何捕捉用戶興趣的演化路線?于是有了用戶興趣演化模型:

          我們將attention機(jī)制繼續(xù)延用了下來,并且加入了ARGRU網(wǎng)絡(luò)結(jié)構(gòu)。兩者相結(jié)合,既保留了原先的注意力機(jī)制,又能捕獲用戶歌曲興趣發(fā)展的路徑。在這里我們使用的序列,是用戶實(shí)時(shí)完整播放的序列。他使用了一個(gè)實(shí)時(shí)數(shù)據(jù),所以在線上預(yù)測(cè)時(shí),我們可以對(duì)用戶實(shí)時(shí)的行為得到快速反饋。另外,我們?cè)谧霾シ判蛄虚L(zhǎng)度時(shí),也進(jìn)行了一些探索。很明顯,如果播放序列越多,包含的行為也就越多。但是過長(zhǎng)的數(shù)據(jù),在實(shí)訓(xùn)模型中容易造成梯度消失問題,如何將更多行為融入進(jìn)來,是我們接下來要思考的一個(gè)方向。

          3. 基于會(huì)話的多行為域模型

          前面的學(xué)習(xí)建模過程中,我們使用的都是用戶整體的行為訓(xùn)練,忽略了序列內(nèi)部的機(jī)構(gòu)。用戶的行為序列是由多個(gè)會(huì)話組成的。然而往往用戶會(huì)話序列內(nèi)部,性質(zhì)偏移比較小,目的性會(huì)比較一致。但是在會(huì)話之間有著比較明顯的差異,所以我們會(huì)進(jìn)行session劃分。我們可以得到用戶session內(nèi)部的投入行為以及session之間的遞歸行為。這樣的劃分,從序列演化到session,可以關(guān)注到更長(zhǎng)遠(yuǎn)的行為數(shù)據(jù)。在音樂場(chǎng)景,我們對(duì)session的劃分,主要分為兩個(gè)點(diǎn):

          • 一個(gè)是因?yàn)橐魳匪蟹浅6嗟耐扑]場(chǎng)景,每一個(gè)推薦場(chǎng)景使用目的都是有差別的。用戶選擇不同的場(chǎng)景,都是基于用戶主動(dòng)意識(shí),所以我們通過場(chǎng)景就可以將序列進(jìn)行一個(gè)初步的劃分

          • 其次,聽歌過程中,用戶會(huì)有一定的疲勞感。如果時(shí)間過長(zhǎng)的話用戶的注意力可能就不會(huì)那么集中,所以我們對(duì)session的最大時(shí)長(zhǎng)做了切割

          這兩點(diǎn)是我們對(duì)section數(shù)據(jù)的處理。

          我們?cè)谀P椭凶隽烁蟮膰L試,考慮了用戶更多行為域的行為模式。之前我們所使用的用戶行為都是完整的播放歌曲序列,在這里我們加入了一個(gè)紅星收藏序列和跳過序列。為什么我們要將用戶不同的行為序列考慮進(jìn)來。我們觀察播放的整個(gè)詳情頁(yè),里面有很多的控件,比如收藏按鈕,表示用戶將歌曲加入紅心收藏歌單中,這是用戶非常強(qiáng)烈的行為。同樣下載歌曲或者分享,都是明顯的正向行為。對(duì)于評(píng)論信息,我們要具體分析評(píng)論的內(nèi)容,利用NLP技術(shù)進(jìn)行情感分析,去判斷用戶真正情感。如果用戶對(duì)這首歌曲標(biāo)了不感興趣,甚至是拉黑了歌曲或者藝人,那么這就是顯著的負(fù)向行為。還有比較隱蔽的負(fù)向行為,就是用戶在播放的過程中進(jìn)行切割操作,這是一個(gè)沒有消費(fèi)完全的狀態(tài),對(duì)用戶來說是不好的體驗(yàn)。所以我們會(huì)通過對(duì)用戶行為的不斷擴(kuò)充,把用戶正向和負(fù)向的行為,進(jìn)行完整的刻畫。

          4. 再說音樂推薦?VS 電商推薦

          回到最開始我們提到的,兩個(gè)推薦系統(tǒng)的差異。這些問題,其實(shí)在剛剛介紹召回和精排系統(tǒng)中有提到。對(duì)于音樂資源我們會(huì)從各種維度進(jìn)行偏好的分析,建立一個(gè)比較完善的歌曲畫像。同時(shí),雖然這次分享沒有提到,但是云音樂也利用了NLP、圖像、音頻等技術(shù),從內(nèi)容上去理解歌曲本身。對(duì)于是否可以重復(fù)消費(fèi)這個(gè)問題上,我們會(huì)關(guān)注用戶長(zhǎng)期的興趣偏好,達(dá)到長(zhǎng)短期用戶興趣的動(dòng)態(tài)平衡。對(duì)于用戶的行為序列,進(jìn)行顯隱式的拆解,刻畫用戶真正的行為意圖。對(duì)于長(zhǎng)短期興趣和用戶行為確認(rèn)這兩個(gè)方向,還是有很多的發(fā)展空間的,這也是之后我們需要繼續(xù)努力的研究方向。

          04
          音樂推薦場(chǎng)景AI思考

          最后分享下在音樂推薦場(chǎng)景下對(duì)于AI算法的思考。音樂是反映人類現(xiàn)實(shí)生活中,一種情感的藝術(shù);AI是一個(gè)理性的產(chǎn)品,它為人們提供便利的生活。理性和感性的結(jié)合,并不是相互抵消的過程,反而能發(fā)揮出更大的效果。我們認(rèn)為健康良性的音樂系統(tǒng) ( 如圖所示 ),通過AI技術(shù),可以幫助用戶去發(fā)現(xiàn)更多感興趣的音樂,讓用戶能夠沉浸在音樂帶給他的快樂當(dāng)中。更多用戶的使用行為可以幫助我們挖掘更多長(zhǎng)尾歌曲,挖掘那些小眾但是優(yōu)質(zhì)的音樂,使優(yōu)質(zhì)的歌曲都能得到合理的分發(fā)。我們的推薦歌曲池也會(huì)變得更多更好,可以更好地服務(wù)給用戶。以上,就是我們的網(wǎng)易云音樂推薦團(tuán)隊(duì)對(duì)AI和音樂的理解。

          章鶯

          網(wǎng)易云音樂 |?資深算法工程師

          畢業(yè)于浙江大學(xué)數(shù)學(xué)系,目前就職于網(wǎng)易云音樂,擔(dān)任資深推薦算法工程師,主要負(fù)責(zé)音樂推薦系統(tǒng)相關(guān)算法工作,在召回、排序、歌曲分發(fā)上有豐富的經(jīng)驗(yàn)。率先在云音樂實(shí)踐百億級(jí)別實(shí)時(shí)推薦模型,并在多目標(biāo)訓(xùn)練和序列行為數(shù)據(jù)上有深入的研究
          ·················END·················

          推薦閱讀

          1. 說說心里話

          2. 寫給所有數(shù)據(jù)人。

          3. 從留存率業(yè)務(wù)案例談0-1的數(shù)據(jù)指標(biāo)體系

          4. NB,真PDF神處理工具!

          5. 超級(jí)菜鳥如何入門數(shù)據(jù)分析?


          歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」

          瀏覽 41
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久久久免费精品国产夜色 | 黄色片三级片在线看网站 | 日韩无码性爱 | 国产美女高潮视频 | 婷婷黄色 |