
這是求職產(chǎn)品經(jīng)理系列的第196篇文章
是不是想做AI產(chǎn)品經(jīng)理,但是不知道要掌握哪些算法模型?是不是認(rèn)為AI產(chǎn)品經(jīng)理必須要有很深的數(shù)學(xué)功底?是不是不知道有哪些高效的渠道學(xué)習(xí)這些算法模型?
這篇文章就給大家深度講解AI產(chǎn)品經(jīng)理必須掌握的算法全景圖,幫助大家更好的求職AI產(chǎn)品經(jīng)理。
目前機(jī)器學(xué)習(xí)有三大類應(yīng)用場(chǎng)景:分類問題、回歸問題、聚類問題,作為AI產(chǎn)品經(jīng)理一定要掌握如何應(yīng)用這些算法來幫我們解決工作問題。
這篇文章先從宏觀上講解一下 AI 產(chǎn)品經(jīng)理需要掌握的算法技術(shù)全景圖。
這樣,大家后面再去學(xué)習(xí)具體的算法,就能有一個(gè)更清晰的學(xué)習(xí)路徑了,如下圖所示是三類場(chǎng)景的詳細(xì)描述。
在實(shí)際工作中,我們遇到最多的問題就是分類問題,分類問題經(jīng)常出現(xiàn)在分類判斷、標(biāo)簽預(yù)測(cè)、行為預(yù)測(cè)這些場(chǎng)景中。
比如說,你現(xiàn)在是一個(gè)電商產(chǎn)品經(jīng)理,有商城全部用戶的歷史行為數(shù)據(jù),以及用戶 A、B、C、D 的性別數(shù)據(jù),希望預(yù)測(cè)商城其他用戶的性別,可能是用戶 E。
這就是一個(gè)很經(jīng)典的分類問題,這個(gè)問題的預(yù)測(cè)結(jié)果就是男性或者女性。像這種判斷一個(gè)事情的結(jié)果是“男 / 女”、“是 / 否”、“1/0”的問題就是二分類問題。
不過,如果我把已知條件變換一下:你現(xiàn)在有商城全部用戶的歷史行為數(shù)據(jù),以及用戶A、B、C、D 的婚姻狀況數(shù)據(jù),希望預(yù)測(cè)商城其他用戶的婚姻狀況。這個(gè)時(shí)候,預(yù)測(cè)的結(jié)果就是未婚、已婚或者是離異了,像這種預(yù)測(cè)結(jié)果是多種情況的,就是多分類問題。
那分類問題怎么解決呢?我們?cè)倩氐絼偛胚@個(gè)例子中。結(jié)合上面的表格,我們可以看到,已知性別的用戶會(huì)呈現(xiàn)出來一種規(guī)律,就是女性瀏覽美妝品類次數(shù)遠(yuǎn)高于瀏覽數(shù)碼類頁面次數(shù),而男性會(huì)呈現(xiàn)出相反的趨勢(shì)。
我們可以把性別和瀏覽頁面次數(shù)呈現(xiàn)到一個(gè)圖里,然后將用戶瀏覽美妝品類頁面,數(shù)碼品類頁面次數(shù)錄入。這個(gè)時(shí)候,你會(huì)發(fā)現(xiàn)用戶 E 和用戶 A、C 離得很近,從數(shù)學(xué)的角度來看,距離越近就越相似,所以我們大概率認(rèn)為 E 的性別應(yīng)該和 A、C 一樣,是女性。這就是分類問題的解決過程。
在機(jī)器學(xué)習(xí)的場(chǎng)景中,分類算法解決分類問題也是利用相似的原理,可用的算法非常多,常見的有邏輯回歸、樸素貝葉斯、決策樹、隨機(jī)森林、K 近鄰、支持向量機(jī),以及神經(jīng)網(wǎng)絡(luò)等等。
如果想要詳細(xì)了解其他幾個(gè)分類算法的詳細(xì)實(shí)現(xiàn)原理、是用場(chǎng)景、優(yōu)缺點(diǎn),可以點(diǎn)擊查看下面這篇文章,有非常詳細(xì)的介紹:
總的來說,使用分類算法解決問題,我們必須要有已知的訓(xùn)練數(shù)據(jù),才能對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。當(dāng)已知信息缺失的時(shí)候,我們又該怎么辦呢?
這個(gè)時(shí)候,我們要么考慮通過人工打標(biāo)來處理數(shù)據(jù),要么考慮使用聚類算法。這就是我接下來要講的聚類問題的處理邏輯了。
在機(jī)器學(xué)習(xí)中,我們經(jīng)常需要給一些數(shù)據(jù)量很大,用戶屬性很多的用戶數(shù)據(jù)進(jìn)行分組,但往往很難下手。
我還是代入一個(gè)例子來給你講講,假設(shè),你現(xiàn)在是一個(gè)客服系統(tǒng)負(fù)責(zé)人,為了減輕人工客服的壓力,想把一部分常見的問題交給機(jī)器人來回復(fù)。解決這件事情的前提,就是我們要對(duì)用戶咨詢的商品問題先進(jìn)行分組,找到用戶最關(guān)心的那些問題。
這種需要根據(jù)用戶的特點(diǎn)或行為數(shù)據(jù),對(duì)用戶進(jìn)行分組,讓組內(nèi)數(shù)據(jù)盡可能相似的的問題,就屬于聚類問題,用一個(gè)詞概括它的特點(diǎn)就是 “物以類聚”。
常見的聚類算法有層次聚類、原型聚類(K-means)、密度聚類(DBSCAN)。
那聚類問題該怎么解決呢?我們接著剛才的例子來說,假設(shè)我們現(xiàn)在有 5 條如下的咨詢:
小愛同學(xué)和小愛音響有什么區(qū)別 ?
華為路由器和小米路由器哪個(gè)可以在校園網(wǎng)內(nèi)使用 ?
如果我們把每句話都看成單獨(dú)的小組,這一共就是 5 個(gè)小組,那我們的目標(biāo)就是把相似的問題合并成一個(gè)小組。
最簡(jiǎn)單的辦法,就是找出每個(gè)小組中的名詞,把“各句中包含的名詞一致的數(shù)量”看作“相似度”。這樣一來,相同名詞數(shù)量最多的兩個(gè)句子就是最相似的。
按照這個(gè)思路,我把這 5 個(gè)句子中含有的名詞都整理到了下面的表中,并用 “O” 進(jìn)行了標(biāo)記。
“句子 1”和“句子 2、3、4、5”的相似度分別是 2、0、0、0。
“句子 2”和“句子 3、4、5”的相似度是 1、0、0。
“句子 3”和“句子 4、5”的相似度是 0、0。
這樣,我們就能算出每一個(gè)句子和其他 4 句之間的相似度了。
這樣,我們也就能得出:最相似的小組是相似度為 2 的“句子 1”和“句子 2”,我們把這兩個(gè)句子合并之后,5 個(gè)小組就變成了 4 個(gè)小組:
然后,我們?cè)侔凑丈厦嫱瑯拥姆绞桨研律傻母餍〗M進(jìn)行聚類,就又會(huì)得到兩個(gè)相似度為1 的小組:
“小組 5”:“句子 1” 、“句子 2”和“句子 3”
就這樣,當(dāng)我們把所有相似的句子聚類到一起,就完成了聚類的過程。其實(shí),聚類算法的原理很簡(jiǎn)單,就是根據(jù)樣本之間的距離把距離相近的聚在一起。
總之,聚類算法解決問題的核心思想就是“物以類聚,人以群分”,所以,聚類分析較為重要的一個(gè)應(yīng)用就是用戶畫像。
我們剛才說了,分類問題和聚類問題的差異在于分類問題需要根據(jù)已知的數(shù)據(jù)去學(xué)習(xí),然后為新的數(shù)據(jù)進(jìn)行預(yù)測(cè),而聚類分析直接在已有數(shù)據(jù)中發(fā)現(xiàn)聯(lián)系。
但它們還存在著一個(gè)共同點(diǎn),那就是它們都輸出的是 “0” 或 “1” 這種離散型的標(biāo)簽。
離散型的標(biāo)簽指的就是非連續(xù)的一個(gè)個(gè)單獨(dú)的標(biāo)簽。比如說,一個(gè)人的年收入可能是從幾萬到幾千萬這樣的連續(xù)性值,但是如果我們將年收入的具體數(shù)值轉(zhuǎn)化成低收入、中等收入、高收入、超高收入這些檔,每一個(gè)檔就是一個(gè)離散型的標(biāo)簽。
但有時(shí)候,我們?cè)陧?xiàng)目中確實(shí)需要預(yù)測(cè)一個(gè)具體的連續(xù)性數(shù)值,比如酒店的價(jià)格或股票的價(jià)格。遇到這類問題我們?cè)撛趺崔k呢?這個(gè)時(shí)候,我們就可以通過解決回歸問題的算法來實(shí)現(xiàn)了。
在實(shí)際工作中,我們也經(jīng)常會(huì)遇到回歸問題,比如需要預(yù)測(cè)某個(gè)商品未來的銷量,預(yù)測(cè)某只股票未來的價(jià)格等等。
下面我就通過一個(gè)預(yù)測(cè)銷量調(diào)整庫存的例子,來講講回歸算法中線性回歸的解題過程。
假設(shè)你是一個(gè)電商產(chǎn)品經(jīng)理,你們公司每件商品的庫存都是通過預(yù)測(cè)未來產(chǎn)品的銷量來動(dòng)態(tài)調(diào)整的。這個(gè)功能的實(shí)現(xiàn)方式是,先根據(jù)商城 App 分析出用戶的商品搜索次數(shù),然后將每個(gè)商品的搜索次數(shù)和銷量做數(shù)據(jù)分析,畫出一個(gè)橫軸為搜索次數(shù),縱軸為銷量的二維散點(diǎn)圖。
我們以搜索小米路由器舉例,從上圖我們可以看到,相對(duì)密集的搜索次數(shù)都在 1000 次以下,當(dāng)搜索次數(shù)超過 1000 次以后,散點(diǎn)變得稀疏起來。這樣一來,我們就能根據(jù)數(shù)據(jù)擬合出一條回歸直線。
這條回歸直線上,因?yàn)殇N量和搜索次數(shù)成正比,所以它們都可以用一元回歸方程來表示。
如果我們假設(shè)影響銷量的因素只有搜索次數(shù)這一個(gè)特征,那么在有了新產(chǎn)品和它的搜索次數(shù)之后,我們根據(jù)一元回歸方程,就可以預(yù)測(cè)出新產(chǎn)品的銷量了。
這個(gè)時(shí)候有的同學(xué)可能想說,“用戶搜索次數(shù)雖然會(huì)影響銷量,但我認(rèn)為用戶評(píng)價(jià)和庫存也會(huì)影響銷量啊”。接下來,我們就一起來驗(yàn)證一下這個(gè)假設(shè)。我們將庫存、用戶評(píng)價(jià)作為影響銷量的兩個(gè)因素,去分析它們之間的關(guān)系。
如上圖所示,當(dāng)庫存小于 40% 的時(shí)候,用戶評(píng)價(jià)和銷量都很低,當(dāng)庫存大于 80% 的時(shí)候,用戶評(píng)價(jià)和銷量呈線性增長(zhǎng)。我們發(fā)現(xiàn),用戶評(píng)價(jià)和庫存共同影響了產(chǎn)品銷量,只有當(dāng)庫存大于 80% 且用戶評(píng)價(jià)高于 0.6 的時(shí)候,產(chǎn)品才有較好的銷量。因此,這三者之間的關(guān)系可以用二元回歸方程進(jìn)行量化。
當(dāng)然,實(shí)際情況是像服務(wù)態(tài)度、物流時(shí)間、折扣力度、廣告宣傳、購物體驗(yàn)這些因素,它們也會(huì)或多或少地影響銷量。我們可以把這些因素也就是 n 個(gè)特征,都總結(jié)到同一個(gè)回歸方程中,用多元回歸方程表示,具體的公式如下:
銷量 = a0 + a1 ? 搜索次數(shù) + a2 ? 用戶評(píng)價(jià) + a3 ? 庫存 + a4 ? 折扣力
通過這樣的方式,我們就可以輕易地預(yù)測(cè)每種產(chǎn)品的未來銷售,進(jìn)而可以動(dòng)態(tài)地規(guī)劃庫存和物流。當(dāng)然,回歸算法能做的還有很多,比如預(yù)測(cè)不同促銷組合產(chǎn)生的盈利進(jìn)而確定促銷活動(dòng),預(yù)測(cè)廣告的投入量進(jìn)而估算盈利額等等。
對(duì)于產(chǎn)品經(jīng)理來說,我們需要清楚的知道線性回歸的原理,熟悉回歸算法能解決的情況,比如它適合用來預(yù)測(cè)價(jià)格、銷量,這類結(jié)果是連續(xù)值的問題。
今天,我結(jié)合三大類問題,給你講了三大類常見算法和它們的應(yīng)用場(chǎng)景。為了方便你的記憶,我把重點(diǎn)內(nèi)容整理成了一張知識(shí)腦圖。

關(guān)于以上所有算法的詳細(xì)實(shí)現(xiàn)原理、是用場(chǎng)景、優(yōu)缺點(diǎn),可以點(diǎn)擊查看下面這篇文章,有非常詳細(xì)的介紹:
除此以外,以上大禮包還包括深度學(xué)習(xí)、AIGC/大模型相關(guān)算法的深度講解,以及AI產(chǎn)品經(jīng)理面試高頻30題和答案解析。
這里,我還想結(jié)合這三類算法,再給你舉幾個(gè)常見的應(yīng)用場(chǎng)景,因?yàn)橹朗裁磮?chǎng)景下使用什么算法來解決是我們產(chǎn)品經(jīng)理最需要掌握的。
如果你希望知道你的用戶會(huì)不會(huì)購買某個(gè)商品,你的用戶在你們平臺(tái)借款之后會(huì)不會(huì)不還錢,或者你想知道你的用戶會(huì)不會(huì)購買你們平臺(tái)的會(huì)員卡,這些就屬于分類問題了,你們的算法工程師可能會(huì)選擇邏輯回歸,決策樹來實(shí)現(xiàn)你的需求。
如果你希望知道你們平臺(tái)某個(gè)商品未來的價(jià)格,預(yù)測(cè)你們小區(qū)未來某個(gè)時(shí)間點(diǎn)的房?jī)r(jià),或者預(yù)測(cè)一下你的用戶收入情況是多少,你們的算法工程師可能會(huì)選擇使用回歸算法來解決這些回歸問題。
如果你想做一個(gè)用戶畫像體系,對(duì)用戶進(jìn)行分組打標(biāo)簽,這就屬于聚類分析的領(lǐng)域了,你們算法工程師可以選擇層次聚類,原型聚類等算法來實(shí)現(xiàn)你的需求。
當(dāng)然,算法分類的方式不止一種,我們也可以按照建模時(shí)候有沒有標(biāo)簽,把它們分成有監(jiān)督、無監(jiān)督和半監(jiān)督算法。我之所以選擇根據(jù)應(yīng)用場(chǎng)景來分類,是因?yàn)槟阕鳛橐粋€(gè)產(chǎn)品經(jīng)理,應(yīng)該關(guān)注的是:如何通過技術(shù)(算法)來解決業(yè)務(wù)場(chǎng)景中遇到的問題,這才是最最核心的。
如果你最進(jìn)想要看看AIGC的機(jī)會(huì),可以關(guān)注一下《AIGC產(chǎn)品實(shí)戰(zhàn)營(yíng)》,具體介紹如下:
面向群體:0經(jīng)驗(yàn)轉(zhuǎn)行想要求職AIGC產(chǎn)品經(jīng)理的人
項(xiàng)目?jī)?yōu)勢(shì):
2)結(jié)合學(xué)生背景定制化項(xiàng)目,項(xiàng)目可以更好的跟求職簡(jiǎn)歷融合
3)項(xiàng)目可落地,手把手帶著大家把項(xiàng)目訓(xùn)練落地,面試時(shí)可以展示給面試官
4)帶著做的項(xiàng)目屬于招聘量大、求職成功率高、薪資高的智能對(duì)話類(對(duì)話機(jī)器人)和圖片生成類(類妙鴨相機(jī))兩個(gè)項(xiàng)目。
5) 百度資深A(yù)I面試官1對(duì)1改簡(jiǎn)歷和模擬面試