<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          一張圖了解機(jī)器學(xué)習(xí)

          共 2711字,需瀏覽 6分鐘

           ·

          2021-11-14 09:48

          來源:DeepHub IMBA

          本文約2300字,建議閱讀8分鐘?

          本文介紹了機(jī)器學(xué)習(xí)的種類。


          機(jī)器學(xué)習(xí)


          機(jī)器學(xué)習(xí)是人工智能(AI)的一種應(yīng)用,為系統(tǒng)提供無需明確編程就能根據(jù)經(jīng)驗(yàn)自動(dòng)學(xué)習(xí)和改進(jìn)的能力。

          機(jī)器學(xué)習(xí)根據(jù)不同的任務(wù)類型可以分為以下三大類型:

          • 有監(jiān)督學(xué)習(xí)

          • 無監(jiān)督學(xué)習(xí)

          • 強(qiáng)化學(xué)習(xí)




          有監(jiān)督學(xué)習(xí)


          監(jiān)督學(xué)習(xí)是一種機(jī)器學(xué)習(xí)任務(wù),通過訓(xùn)練學(xué)習(xí)一個(gè)函數(shù),該函數(shù)根據(jù)示例輸入-輸出對(duì)將輸入映射到輸出。(需要數(shù)據(jù)標(biāo)注,輸入->輸出)

          在這種類型中,機(jī)器學(xué)習(xí)算法是在標(biāo)記數(shù)據(jù)上訓(xùn)練的。盡管這種方法需要準(zhǔn)確地標(biāo)記數(shù)據(jù),但在適當(dāng)?shù)那闆r下使用監(jiān)督學(xué)習(xí)是非常有效的。

          開始時(shí),系統(tǒng)接收輸入數(shù)據(jù)和輸出數(shù)據(jù)。它的任務(wù)是創(chuàng)建適當(dāng)?shù)囊?guī)則,將輸入映射到輸出。訓(xùn)練過程應(yīng)該持續(xù),直到表現(xiàn)水平足夠高為止。

          在訓(xùn)練之后,系統(tǒng)應(yīng)該能夠分配一個(gè)在訓(xùn)練階段沒有看到的輸出對(duì)象。在大多數(shù)情況下,這個(gè)過程是非??焖俸蜏?zhǔn)確的。

          監(jiān)督學(xué)習(xí)的類型:

          • Regression:回歸,輸出是連續(xù)值

          • Classification:分類,輸出是離散值


          回歸

          回歸是一種有監(jiān)督的機(jī)器學(xué)習(xí)技術(shù),用于預(yù)測(cè)連續(xù)值。例如,我們可以用它來預(yù)測(cè)某種產(chǎn)品的價(jià)格,比如某個(gè)城市的房?jī)r(jià)或股票的價(jià)值。

          機(jī)器學(xué)習(xí)中的回歸由數(shù)學(xué)方法組成,數(shù)據(jù)科學(xué)家可以根據(jù)一個(gè)或多個(gè)預(yù)測(cè)變量(x)的值預(yù)測(cè)一個(gè)連續(xù)的結(jié)果(y)。線性回歸可能是回歸分析中最流行的形式,因?yàn)樗陬A(yù)測(cè)和預(yù)測(cè)中很容易使用。

          分類

          分類是一種旨在重現(xiàn)類別分配的技術(shù)。它可以預(yù)測(cè)響應(yīng)值,并將數(shù)據(jù)分成“類”。例如識(shí)別照片中的汽車類型,鑒別垃圾郵件,檢測(cè)表情,人臉識(shí)別等等。

          分類的三種主要類型是:

          • 二元分類 Binary Classification


          它是分類的過程或任務(wù),其中將給定的數(shù)據(jù)分為兩類。它基本上是一種關(guān)于事物屬于兩個(gè)群體中的哪一個(gè)的預(yù)測(cè)。

          假設(shè)有兩封電子郵件發(fā)送給您,一封是由不斷發(fā)送廣告的保險(xiǎn)公司發(fā)送的,另一封是您的銀行發(fā)送的關(guān)于您的信用卡賬單的電子郵件。

          電子郵件服務(wù)提供商將對(duì)兩封電子郵件進(jìn)行分類,第一封將發(fā)送到垃圾郵件文件夾,第二封將保留在主郵件中。這個(gè)過程被稱為二元分類,因?yàn)橛袃蓚€(gè)離散的類,一個(gè)是垃圾郵件,另一個(gè)不是垃圾郵件的。所以這是一個(gè)二元分類的問題。

          算法:

          • 邏輯回歸

          • KNN

          • 決策樹/隨機(jī)森林/提升樹

          • 支持向量機(jī) SVM

          • 樸素貝葉斯

          • 多層感知機(jī)


          • 多分類 Multi-class Classification


          多類分類是指那些具有兩個(gè)以上類標(biāo)簽,但是輸入數(shù)據(jù)只對(duì)應(yīng)一個(gè)類標(biāo)簽的分類任務(wù)。

          算法:

          • KNN

          • 決策樹/隨機(jī)森林/提升樹

          • 樸素貝葉斯

          • 多層感知機(jī)


          注:這里去掉了SVM和邏輯回歸,因?yàn)樗麄冎恢С侄诸?,但是可以通過其他方法實(shí)現(xiàn)多分類,一般情況下會(huì)構(gòu)建與分類數(shù)相同的模型并進(jìn)行二元分類,比如數(shù)字識(shí)別0-9,SVM會(huì)訓(xùn)練10個(gè)二元模型,分別判斷是否是1,是否是2,邏輯回歸也是同理。


          • 多標(biāo)簽分類 Multi-Label Classification


          多標(biāo)簽分類是指那些具有兩個(gè)或多個(gè)類標(biāo)簽的分類任務(wù),其中每個(gè)示例可以預(yù)測(cè)一個(gè)或多個(gè)類標(biāo)簽。

          多分類可以叫做單標(biāo)簽多分類,是一對(duì)一的關(guān)系,而多標(biāo)簽分類是一對(duì)多的關(guān)系。

          通俗的講,一張照片里面有貓和狗,如果使用多分類來說,他只能將照片分成1類,貓或狗(一對(duì)一),但是對(duì)于多標(biāo)簽來說,會(huì)同時(shí)輸出貓和夠(一對(duì)多)

          無監(jiān)督學(xué)習(xí)


          無監(jiān)督學(xué)習(xí)是指使用人工智能 (AI) 算法來識(shí)別包含未標(biāo)記的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集中的模式。在訓(xùn)練時(shí)算法對(duì)包含在數(shù)據(jù)集中的數(shù)據(jù)點(diǎn)進(jìn)行分類、標(biāo)記和/或分組,在執(zhí)行訓(xùn)練時(shí)無需任何外部指導(dǎo)。換句話說無監(jiān)督學(xué)習(xí)允許系統(tǒng)自行識(shí)別數(shù)據(jù)集中的模式。在無監(jiān)督學(xué)習(xí)中,即使沒有提供任何的期望輸出模型也會(huì)根據(jù)異同對(duì)信息進(jìn)行分組。

          無監(jiān)督學(xué)習(xí)算法可以執(zhí)行比監(jiān)督學(xué)習(xí)系統(tǒng)更復(fù)雜的處理任務(wù)。

          無監(jiān)督學(xué)習(xí)的類型:

          A.聚類

          聚類是指自動(dòng)將具有相似特征的數(shù)據(jù)點(diǎn)組合在一起并將它們分配給“簇”的過程。

          常用算法:

          • K-Means(K均值)

          • DBSCAN

          • 使用高斯混合模型(GMM)


          B.關(guān)聯(lián)

          關(guān)聯(lián)規(guī)則學(xué)習(xí)是一種無監(jiān)督學(xué)習(xí)技術(shù),它在大型數(shù)據(jù)中檢查一個(gè)數(shù)據(jù)項(xiàng)對(duì)另一個(gè)數(shù)據(jù)項(xiàng)的依賴性 ,它試圖在數(shù)據(jù)集的變量之間找到一些有趣的關(guān)系或關(guān)聯(lián)。根據(jù)不同的規(guī)則來發(fā)現(xiàn)數(shù)據(jù)中變量之間的有趣關(guān)系。

          常用算法:

          • Apriori算法

          • PCY算法

          • FP-Tree算法

          • XFP-Tree算法

          • GPApriori算法

          應(yīng)用:

          市場(chǎng)分析:是關(guān)聯(lián)規(guī)則挖掘的流行示例和應(yīng)用之一。大型零售商通常使用這種技術(shù)來確定商品之間的關(guān)聯(lián)。(啤酒尿布)

          醫(yī)學(xué)診斷:關(guān)聯(lián)規(guī)則有助于識(shí)別特定疾病的患病概率。

          蛋白質(zhì)序列:關(guān)聯(lián)規(guī)則有助于確定人工蛋白質(zhì)的合成。

          強(qiáng)化學(xué)習(xí)


          強(qiáng)化學(xué)習(xí) (RL) 是一種機(jī)器學(xué)習(xí)技術(shù),它使代理通在交互式環(huán)境中通過來自其自身行為和經(jīng)驗(yàn)的反饋進(jìn)行學(xué)習(xí)。

          盡管監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)都使用輸入和輸出之間的映射,但與向代理提供的反饋是執(zhí)行任務(wù)的正確動(dòng)作集的監(jiān)督學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)使用獎(jiǎng)勵(lì)和懲罰作為積極和消極行為的信號(hào)。

          與無監(jiān)督學(xué)習(xí)相比,強(qiáng)化學(xué)習(xí)在目標(biāo)方面有所不同。雖然無監(jiān)督學(xué)習(xí)的目標(biāo)是找到數(shù)據(jù)點(diǎn)之間的異同,但在強(qiáng)化學(xué)習(xí)的情況下,目標(biāo)是找到一個(gè)合適的動(dòng)作模型,使代理的總累積獎(jiǎng)勵(lì)最大化。


          描述 RL 問題基本要素的一些關(guān)鍵術(shù)語是:

          1. 環(huán)境Environment ——代理運(yùn)行的物理世界
          2. 代理Agent ——也叫智能體,就是我們所寫的算法
          3. 行動(dòng)Action——代理產(chǎn)生的動(dòng)作
          4. 狀態(tài)State——代理的狀態(tài)
          5. 獎(jiǎng)勵(lì)Reward——來自環(huán)境的反饋,好的還是壞的
          6. 策略Policy ——將代理的狀態(tài)映射到動(dòng)作的方法,通過狀態(tài)選擇做什么行動(dòng)
          7. 價(jià)值Value ——代理在特定狀態(tài)下采取行動(dòng)將獲得的未來獎(jiǎng)勵(lì)


          deephub譯者注


          機(jī)器學(xué)習(xí)可以根據(jù)不同的分類方法分成不同的類型,例如本文是根據(jù)任務(wù)類型來進(jìn)行區(qū)分的大類,例如我們常見的,圖像分割其實(shí)就是對(duì)于圖片像素級(jí)別的分類任務(wù),而目標(biāo)檢測(cè)主要的目標(biāo)就是邊框的回歸。

          對(duì)于實(shí)現(xiàn)的方法,我們還可以根據(jù)模型分成不同的實(shí)現(xiàn)方法,例如:

          • 傳統(tǒng)的機(jī)器學(xué)習(xí):各種回歸

          • 核方法:SVM等

          • 貝葉斯模型:概率相關(guān)

          • 樹型模型:決策樹、隨機(jī)森林、各種boosting

          • 神經(jīng)網(wǎng)絡(luò):多層感知機(jī)、各種NN


          以上分類并不沖突并且是交叉的。最簡(jiǎn)單的就是我們?cè)谑褂蒙窠?jīng)網(wǎng)絡(luò)分類和回歸的時(shí)候,最后一層一般都會(huì)使用線性層(有的也叫稠密層)這一層使用的算法就是線性回歸,再例如我們也可以使用神經(jīng)網(wǎng)絡(luò)來進(jìn)行聚類算法,比如deepCluster。

          編輯:王菁
          校對(duì):龔力

          瀏覽 97
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产精品人人人人 | 蜜臀一二三区 | 久久Y成人电影 | 日韩大鸡巴在线 | 日本黄色录像 |