无码高清视频,,天天色、天天干,性爱婷婷,亚洲无码护士,成人无码影音,舔逼逼视频,五月天性爱网站,五月天激情影院

    
    
     
     
      
      
       
       
        
        
         
          來源：機(jī)器學(xué)習(xí)雜貨店 
         
        
        
       
       
      
      
     
     
    
    
    
    
     
     
      
      
       
       
        
        
         
         本文約5000字，建議閱讀10分鐘
         
         本文通過圖示將機(jī)器學(xué)習(xí)的發(fā)展歷史、關(guān)鍵方法以及未來會如何影響社會生活展現(xiàn)了出來。

[ 導(dǎo)讀 ] 本文通過一系列機(jī)器學(xué)習(xí)信息圖示，很好地將機(jī)器學(xué)習(xí)的發(fā)展歷史、關(guān)鍵方法以及未來會如何影響社會生活展現(xiàn)了出來。

基礎(chǔ)概念部分包括機(jī)器學(xué)習(xí)各大學(xué)派錯綜關(guān)系的梳理；應(yīng)用部分則描述了機(jī)器學(xué)習(xí)在社會中作用。文中的信息圖非常專業(yè)，是值得珍藏的材料。我們在此基礎(chǔ)上進(jìn)行了解說。希望這篇文章能對你有所幫助，讓你在學(xué)習(xí)和應(yīng)用AI技術(shù)的道路上更進(jìn)一步！

前言

AI 如何能成為商業(yè)的主流？這需要不同研究方法的結(jié)合，以及大量人類的智慧。

我們正處在 AI 取得突破性進(jìn)展的時代：更為復(fù)雜的神經(jīng)網(wǎng)絡(luò)伴著有效的語音識別訓(xùn)練數(shù)據(jù)將亞馬遜的 Echo 和谷歌的 Home 帶進(jìn)了千家萬戶。深度學(xué)習(xí)在圖像、語音和其他模式識別中取得的準(zhǔn)確度提升使得微軟和谷歌的機(jī)器翻譯被更多人使用。圖像識別的增強(qiáng)使 Facebook 的照片搜索和谷歌照片中的 AI 相關(guān)功能得以實現(xiàn)?？傮w來說，這些進(jìn)展使得機(jī)器識別的能力在很大程度上可以被消費者使用了。

在商業(yè)上，如何取得相似的進(jìn)展？這需要高質(zhì)量的訓(xùn)練數(shù)據(jù)、數(shù)字化數(shù)據(jù)處理和數(shù)據(jù)科學(xué)家，同時需要大量的人類智慧，比如請語言領(lǐng)域的專家來調(diào)整、精修可計算的、邏輯貫通的商業(yè)語境，以使得計算機(jī)實現(xiàn)在商業(yè)領(lǐng)域的邏輯推理。商業(yè)領(lǐng)袖們也要花時間來教導(dǎo)機(jī)器將其智能融入具體領(lǐng)域內(nèi)的處理進(jìn)程。

一些以統(tǒng)計學(xué)為導(dǎo)向的機(jī)器學(xué)習(xí)研究流派，比如聯(lián)結(jié)學(xué)派、貝葉斯學(xué)派和類推學(xué)派，會擔(dān)心符號學(xué)派推動的 “human-in-the-loop” 方法無法擴(kuò)展。但是，我們期待這一融合了幾種流派的、人類和機(jī)器間相互反饋的環(huán)，在接下來的幾年中，會在企業(yè)內(nèi)部變得更為常見。

機(jī)器學(xué)習(xí)概覽

1. 什么是機(jī)器學(xué)習(xí)？

機(jī)器通過分析大量數(shù)據(jù)來進(jìn)行學(xué)習(xí)。比如說，不需要通過編程來識別貓或人臉，它們可以通過使用圖片來進(jìn)行訓(xùn)練，從而歸納和識別特定的目標(biāo)。

2. 機(jī)器學(xué)習(xí)和人工智能的關(guān)系

機(jī)器學(xué)習(xí)是一種重在尋找數(shù)據(jù)中的模式并使用這些模式來做出預(yù)測的研究和算法的門類。機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一部分，并且和知識發(fā)現(xiàn)與數(shù)據(jù)挖掘有所交集。

機(jī)器學(xué)習(xí)演化史：各學(xué)派發(fā)展融合，最終讓自動機(jī)器成為可能

長久以來，各種派別的人工智能研究者總是在相互競爭。相互合作的時機(jī)到來了嗎？他們不得不握手言和，因為只有合作將算法整合才能實現(xiàn)真正的通用人工智能（AGI）。下面，我們就來看看機(jī)器學(xué)習(xí)方法走過了什么樣的歷程，未來又將如何？

符號學(xué)派（Symbolists）：是使用基于規(guī)則的符號系統(tǒng)做推理的人。大部分AI都圍繞著這種方法。使用Lisp和Prolog的方法屬于這一派，使用SemanticWeb，RDF和OWL的方法也屬于這一派。其中一個最雄心勃勃的嘗試是Doug Lenat在80年代開發(fā)的Cyc，試圖用邏輯規(guī)則將我們對這個世界的理解編碼。這種方法主要的缺陷在于其脆弱性，因為在邊緣情況下，一個僵化的知識庫似乎總是不適用。但在現(xiàn)實中存在這種模糊性和不確定性是不可避免的。愛用方法：規(guī)則和決策樹
貝葉斯學(xué)派（Bayesians）：是使用概率規(guī)則及其依賴關(guān)系進(jìn)行推理的一派。概率圖模型（PGM）是這一派通用的方法，主要的計算機(jī)制是用于抽樣分布的蒙特卡羅方法。這種方法與符號學(xué)方法的相似之處在于，可以以某種方式得到對結(jié)果的解釋。這種方法的另一個優(yōu)點是存在可以在結(jié)果中表示的不確定性的量度。愛用方法：樸素貝葉斯或馬爾科夫
聯(lián)結(jié)學(xué)派（Connectionists）：這一派的研究者相信智能起源于高度互聯(lián)的簡單機(jī)制。這種方法的第一個具體形式是出現(xiàn)于1959年的感知器。自那以后，這種方法消亡又復(fù)活了好幾次。其最新的形式是深度學(xué)習(xí)。愛用方法：神經(jīng)網(wǎng)絡(luò)
進(jìn)化學(xué)派（Evolutionists）：是應(yīng)用進(jìn)化的過程，例如交叉和突變以達(dá)到一種初期的智能行為的一派。在深度學(xué)習(xí)中，GA確實有被用來替代梯度下降法，所以它不是一種孤立的方法。這個學(xué)派的人也研究細(xì)胞自動機(jī)（cellular automata ），例如Conway的“生命游戲”和復(fù)雜自適應(yīng)系統(tǒng)（GAS）。愛用方法：遺傳算法
類推學(xué)派（The analogizers）：更多地關(guān)注心理學(xué)和數(shù)學(xué)最優(yōu)化，通過外推來進(jìn)行相似性判斷。類推學(xué)派遵循“最近鄰”原理進(jìn)行研究。各種電子商務(wù)網(wǎng)站上的產(chǎn)品推薦（例如亞馬遜或 Netflix的電影評級）是類推方法最常見的示例。愛用方法：支持向量機(jī)（SVM）
上世紀(jì) 80 年代流行符號學(xué)派，主導(dǎo)方法是知識工程（Knowledge engineering），由某個領(lǐng)域?qū)＜抑圃炷軌蛟谔囟I(lǐng)域發(fā)揮一定決策輔助的機(jī)器，也即所謂的“專家機(jī)”。
上世紀(jì) 90 年代開始，貝葉斯學(xué)派發(fā)展了起來，概率論成為當(dāng)時的主流思想，基于的原理是可以擴(kuò)展的比較和對比，這種方法能夠適用的場景比較多。
到上世紀(jì)末至今，連接學(xué)派掀起熱潮，神經(jīng)科學(xué)和概率論的方法得到了廣泛應(yīng)用。神經(jīng)網(wǎng)絡(luò)可以更精準(zhǔn)地識別圖像、語音，做好機(jī)器翻譯乃至情感分析（sentiment analysis）等任務(wù)。同時，由于神經(jīng)網(wǎng)絡(luò)需要大量的計算，基礎(chǔ)架構(gòu)也從上世紀(jì) 80 年代的服務(wù)器便為大規(guī)模數(shù)據(jù)中心或者云。這部分內(nèi)容相信大家都非常熟悉了。

如今，各學(xué)派開始相互借鑒融合，21 世紀(jì)的頭十年，最顯著的就是連接學(xué)派和符號學(xué)派的結(jié)合，由此產(chǎn)生了記憶神經(jīng)網(wǎng)絡(luò)以及能夠根據(jù)知識進(jìn)行簡單推理的智能體?；A(chǔ)架構(gòu)也向大規(guī)模云計算轉(zhuǎn)換。
第二個十年，連接學(xué)派、符號學(xué)派和貝葉斯學(xué)派也將融合到一起，實際上我們現(xiàn)在已經(jīng)看到了這樣的趨勢，比如 DeepMind 的貝葉斯 RNN，而主要的局面將是感知任務(wù)由神經(jīng)網(wǎng)絡(luò)完成，但涉及到推理和行動還是需要人為編寫規(guī)則。
從 2040 年以后，根據(jù)普華永道的預(yù)測，主流學(xué)派將成為 Algorithmic convergence，也即各種算法融合在一起，屆時機(jī)器自主學(xué)習(xí)，也即元學(xué)習(xí)（Meta-learning）實現(xiàn)，計算服務(wù)將無處不在。

機(jī)器學(xué)習(xí)：工作原理及適用場景

機(jī)器學(xué)習(xí)通過使人類能夠“教”機(jī)器如何學(xué)習(xí)，使人類和機(jī)器的聯(lián)系更為緊密。機(jī)器通過處理合適的訓(xùn)練集來學(xué)習(xí)，這些訓(xùn)練集包含優(yōu)化一個算法所需的各種特征。這個算法使機(jī)器能夠執(zhí)行特定的任務(wù)，例如對電子郵件進(jìn)行分類。

但是，其好處遠(yuǎn)遠(yuǎn)不止過濾電子郵件，那些十年前就能做到了。如今，在機(jī)器學(xué)習(xí)的助力下，無人機(jī)可以實時近距離地拍攝例如橋梁之類的地方，然后快速、準(zhǔn)確地評估重建項目的范圍。

下面，普華永道的信息圖示概述了機(jī)器學(xué)習(xí)的工作原理，機(jī)器學(xué)習(xí)與人工智能的關(guān)系，以及企業(yè)應(yīng)該在哪些地方利用它們。

機(jī)器學(xué)習(xí)能夠通過“學(xué)習(xí)”大量的數(shù)據(jù)，在不需要人為編程的情況下，生成以及識別特定的對象，比如人臉。目前，機(jī)器學(xué)習(xí)也是商業(yè)應(yīng)用中最常用的算法。

那么，機(jī)器學(xué)習(xí)跟人工智能之間具體是怎樣的關(guān)系呢？

機(jī)器學(xué)習(xí)是一類關(guān)注從數(shù)據(jù)中找到模式，并根據(jù)這些模式進(jìn)行預(yù)測的研究和算法。機(jī)器學(xué)習(xí)屬于人工智能，它與數(shù)據(jù)挖掘、統(tǒng)計學(xué)、模式識別等相關(guān)領(lǐng)域的關(guān)系如上圖所示。接下來看看機(jī)器學(xué)習(xí)如何工作。

根據(jù)普華永道信息圖的總結(jié)，機(jī)器學(xué)習(xí)的主要流程/步驟：

選擇數(shù)據(jù)：這一過程又分為三部分，分別是訓(xùn)練用數(shù)據(jù)、驗證用數(shù)據(jù)、測試用數(shù)據(jù)
數(shù)據(jù)建模：使用訓(xùn)練數(shù)據(jù)構(gòu)建涉及相關(guān)特征的模型
驗證模型：用驗證數(shù)據(jù)驗證建立的模型
調(diào)試模型：為了提升模型的性能，使用更多的數(shù)據(jù)、不同的特征，調(diào)整參數(shù)，這也是最耗時耗力的一步
使用模型：部署模型訓(xùn)練好的模型，對新的數(shù)據(jù)進(jìn)行預(yù)測
測試模型：使用測試用數(shù)據(jù)驗證模型，并評估模型的性能

接下來，我們看看機(jī)器學(xué)習(xí)在傳統(tǒng)編程、統(tǒng)計學(xué)這些常見方法中處于什么樣的地位。

與傳統(tǒng)編程和統(tǒng)計學(xué)方法不同，在機(jī)器學(xué)習(xí)當(dāng)中，數(shù)據(jù)科學(xué)家使用訓(xùn)練數(shù)據(jù)“教育”計算機(jī)，然后讓計算機(jī)執(zhí)行任務(wù)。由此，產(chǎn)生了智能應(yīng)用（Intelligent App）。圖中所舉的例子是智能農(nóng)業(yè)，通過無人機(jī)采集的數(shù)據(jù)進(jìn)行精準(zhǔn)的施肥、灌溉等操作。

在實際應(yīng)用中機(jī)器學(xué)習(xí)有很多適用場景。下圖給出了３個例子：

1. 快速三維成圖和建模 對一個鐵路橋梁重建項目，PwC 數(shù)據(jù)科學(xué)家和領(lǐng)域?qū)＜覍C(jī)器學(xué)習(xí)應(yīng)用于無人機(jī)收集到的數(shù)據(jù)。這樣的組合使得對正在進(jìn)行的工作進(jìn)行精確的監(jiān)控和快速的反饋成為可能。

2. 加強(qiáng)分析以減輕風(fēng)險 為了檢測內(nèi)幕交易，PwC 結(jié)合機(jī)器學(xué)習(xí)與其他分析技術(shù)，發(fā)掘更全面的用戶資料，更深入地了解復(fù)雜的可疑行為。

3. 預(yù)測最佳表現(xiàn)者 PwC 使用機(jī)器學(xué)習(xí)和其他分析技術(shù)來評估墨爾本杯參賽的各匹馬的潛力。

實際應(yīng)用機(jī)器學(xué)習(xí)：什么才是特定任務(wù)的正確算法？

人工智能和機(jī)器學(xué)習(xí)是企業(yè)界的熱門話題，公司的領(lǐng)導(dǎo)者對如何利用它們改善及自動化業(yè)務(wù)流程抱有很高的期望。

那么，AI 如何解決商業(yè)上的問題，例如幫助你弄清楚為什么流失了客戶，或評估信貸申請人的風(fēng)險？這取決于許多因素，尤其是算法使用的數(shù)據(jù)以及要訓(xùn)練的類型。什么是特定任務(wù)的正確算法？報告調(diào)查了最常用的算法以及它們解決的商業(yè)問題。

下面列舉了最常用的算法及其使用案例。

機(jī)器學(xué)習(xí)中常用的算法有很多，具體需要用哪種，很大程度上取決于你手頭的數(shù)據(jù)及其特征，你的訓(xùn)練目標(biāo)，尤其是具體的使用場景。除非特殊情況，不必使用最復(fù)雜的算法。下面是常見的機(jī)器學(xué)習(xí)算法。

1. 決策樹（Decision Trees）

決策樹是一個決策支持工具，它使用樹形圖或決策模型以及序列可能性。包括各種偶然事件的后果、資源成本、功效。從商務(wù)決策的角度來看，大部分情況下，決策樹是一個人為了評估做出正確決定的概率需要問的是/否問題的最小數(shù)值。它能讓你以一個結(jié)構(gòu)化和系統(tǒng)化的方式來處理這個問題，然后得出一個合乎邏輯的結(jié)論。

2. 支持向量機(jī)

支持向量機(jī)（SVM）是二元分類算法。給定一組兩種類型的N維的地方點，SVM產(chǎn)生一個（N - 1）維超平面到這些點分成2組。假設(shè)你有兩種類型的點，且它們是線性可分的。SVM將找到一條直線將這些點分成2種類型，并且這條直線會盡可能地遠(yuǎn)離所有的點。在規(guī)模上，目前使用SVM（在適當(dāng)修改的情況下）解決的最大的問題包括顯示廣告、人類剪接位點識別、基于圖像的性別檢測和大規(guī)模的圖像分類等等。

3. 邏輯回歸

回歸是非常常用的方法。其中，邏輯回歸是一種強(qiáng)大的統(tǒng)計方法，它能建模出一個二項結(jié)果與一個（或多個）解釋變量。它通過估算使用邏輯運算的概率，測量分類依賴變量和一個（或多個）獨立的變量之間的關(guān)系，是累積的邏輯分布情況。

總的來說，邏輯回歸可以用于以下場景：

車流分析
信用評分
衡量營銷活動的成功率
預(yù)測某個產(chǎn)品的收入
某一天是否會發(fā)生地震？

4. 樸素貝葉斯分類

樸素貝葉斯分類是一種十分簡單的分類算法，方程 P(A|B)是后驗概率，P(B|A)是可能性，P(A)是類先驗概率，而P(B)是預(yù)測先驗概率。樸素貝葉斯的思想基礎(chǔ)是這樣的：對于給出的待分類項，求解在此項出現(xiàn)的條件下各個類別出現(xiàn)的概率，哪個最大，就認(rèn)為此待分類項屬于哪個類別。它的現(xiàn)實使用例子有：

5. 隱馬爾科夫模型

可觀察的馬爾科夫決策過程是確定性的——一個給定的狀態(tài)總是遵循另一個給定的狀態(tài)。例如交通信號燈的模式。

相反，隱馬爾科夫模型通過分析可觀察的數(shù)據(jù)來計算隱藏狀態(tài)的概率，然后通過分析隱藏狀態(tài)來估計未來可能觀察到的模式。一個例子是，通過分析高氣壓（或低氣壓）的概率來預(yù)測天氣是晴天，雨天或多云的可能性。

6. 隨機(jī)森林

隨機(jī)森林算法結(jié)合了多個樹，使用隨機(jī)挑選的數(shù)據(jù)子集，以此提升決策樹的分析準(zhǔn)確率。上圖中的例子展示的是與乳腺癌復(fù)發(fā)相關(guān)的不同基因及其幾率。隨機(jī)深林算法的優(yōu)勢在于能夠處理大規(guī)模數(shù)據(jù)集，以及大量看似不相關(guān)的數(shù)據(jù)，可以用于風(fēng)險評估和客戶信息分析。

7. 遞歸神經(jīng)網(wǎng)絡(luò)

實際上，遞歸神經(jīng)網(wǎng)絡(luò)（RNN）是兩種人工神經(jīng)網(wǎng)絡(luò)的總稱。一種是時間遞歸神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network），另一種是結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)（Recursive Neural Network）。時間遞歸神經(jīng)網(wǎng)絡(luò)的神經(jīng)元間連接構(gòu)成有向圖，而結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)利用相似的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)遞歸構(gòu)造更為復(fù)雜的深度網(wǎng)絡(luò)。RNN一般指代時間遞歸神經(jīng)網(wǎng)絡(luò)，正如上圖所示。

時間遞歸神經(jīng)網(wǎng)絡(luò)可以描述動態(tài)時間行為，因為和前饋神經(jīng)網(wǎng)絡(luò)（feedforward neural network）接受較特定結(jié)構(gòu)的輸入不同，RNN 將狀態(tài)在自身網(wǎng)絡(luò)中循環(huán)傳遞，因此可以接受更廣泛的時間序列結(jié)構(gòu)輸入。手寫識別是最早成功利用 RNN 的研究結(jié)果，其他應(yīng)用還包括圖像分類、圖說生成和情感分析。

8. 長短期記憶（LSTM）

較舊的 RNN 可能是有損的（lossy），因為它們只能保存少量的舊信息。但新的長短期記憶（LSTM）和門控循環(huán)單元（gated recurrent unit, GRU）神經(jīng)網(wǎng)絡(luò)同時具有長期記憶和短期記憶。換句話說，這些較新的 RNN 具有更好的記憶控制，允許先前的值持續(xù)保存，或必要時為許多序列步驟重置，避免在步驟到步驟的傳遞時造成“梯度衰減”（gradient decay）。LSTM 和 GRU 網(wǎng)絡(luò)通過記憶體組（memory blocks）和被稱為“門”（gates）的結(jié)構(gòu)適當(dāng)?shù)?pass 或 reset 值來實現(xiàn)這種記憶控制。

9. 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）是一種前饋神經(jīng)網(wǎng)絡(luò)，它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元，對于大型圖像處理、藥物發(fā)現(xiàn)等有出色表現(xiàn)。

卷積神經(jīng)網(wǎng)絡(luò)由一個或多個卷積層和頂端的全連通層（對應(yīng)經(jīng)典的神經(jīng)網(wǎng)絡(luò)）組成，同時也包括關(guān)聯(lián)權(quán)重和池化層。這一結(jié)構(gòu)使得卷積神經(jīng)網(wǎng)絡(luò)能夠利用輸入數(shù)據(jù)的二維結(jié)構(gòu)。與其他深度學(xué)習(xí)結(jié)構(gòu)相比，卷積神經(jīng)網(wǎng)絡(luò)在圖像和語音識別方面能夠給出更優(yōu)的結(jié)果。這一模型也可以使用反向傳播算法進(jìn)行訓(xùn)練。相比較其他深度、前饋神經(jīng)網(wǎng)絡(luò)，卷積神經(jīng)網(wǎng)絡(luò)需要估計的參數(shù)更少。

編輯：于騰凱

校對：龔力

圖解機(jī)器學(xué)習(xí)：演化史、方法、應(yīng)用場景與發(fā)展趨勢

圖解機(jī)器學(xué)習(xí)：演化史、方法、應(yīng)用場景與發(fā)展趨勢