<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          《面向機器學習的特征工程》.pdf

          共 1405字,需瀏覽 3分鐘

           ·

          2021-11-09 10:16

          前段時間發(fā)現(xiàn)apachecn在github上翻譯了一本和特征工程相關的書籍:《Feature Engineering for Machine Learning》,中文名為《面向機器學習的特征工程》。


          這本書包含了特征工程中的數(shù)字處理技巧、文本數(shù)據(jù)處理方式、特征縮放、類別特征、降維、非線性特征提取、自動化特征提取等方面,非常適合初學者。



          01

          書籍簡介


          特征工程對于應用機器學習來說是基礎的,但是使用域知識來加強你的預測模型既困難成本又高。為了彌補特征工程現(xiàn)有資料的不足,本書將會為初中級數(shù)據(jù)科學家講解如何處理這項廣泛應用卻鮮見討論的技術。

          特征工程是機器學習流程中至關重要的一個環(huán)節(jié),然而專門討論這個話題的著作卻很少。本書旨在填補這一空白,著重闡明特征工程的基本原則,介紹大量特征工程技術,教你從原始數(shù)據(jù)中提取出正確的特征并將其轉(zhuǎn)換為適合機器學習模型的格式,從而輕松構建模型,增強機器學習算法的效果。
          然而,本書并非單純地講述特征工程的基本原則,而是通過大量示例和練習將重點放在了實際應用上。每一章都集中研究一個數(shù)據(jù)問題:如何表示文本數(shù)據(jù)或圖像數(shù)據(jù),如何為自動生成的特征降低維度,何時以及如何對特征進行標準化,等等。最后一章通過一個完整的例子演示了多種特征工程技術的實際應用。書中所有代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。

          - 數(shù)值型數(shù)據(jù)的特征工程:過濾、分箱、縮放、對數(shù)變換和指數(shù)變換

          - 自然文本技術:詞袋、n元詞與短語檢測

          - 基于頻率的過濾和特征縮放

          - 分類變量編碼技術:特征散列化與分箱計數(shù)

          - 使用主成分分析的基于模型的特征工程

          - 模型堆疊與k-均值特征化

          - 圖像特征提取:人工提取與深度學習


          02

          目錄


          第 1 章從數(shù)字數(shù)據(jù)的基本特征工程開始:過濾,合并,縮放,日志轉(zhuǎn)換和能量轉(zhuǎn)換以及交互功能。

          第 2 章和第 3 章深入探討了自然文本的特征工程:bag-of-words,n-gram 和短語檢測。
          第 4 章將 tf-idf 作為特征縮放的例子,并討論它的工作原理。
          第 5 章討論分類變量的高效編碼技術,包括特征哈希和 bin-counting。
          第 6 章中進行主成分分析,我們深入機器學習的領域。
          第 7 章將 k-means 看作一種特征化技術,它說明了模型堆疊的有效理論。
          第 8 章都是關于圖像的,在特征提取方面比文本數(shù)據(jù)更具挑戰(zhàn)性。在得出深度學習是最新圖像特征提取技術的解釋之前,我們著眼于兩種手動特征提取技術 SIFT 和 HOG。
          第 9 章中完成了一個端到端示例中的幾種不同技術,為學術論文數(shù)據(jù)集創(chuàng)建了一個推薦器。


          03

          中文版HTML


          中文版的HTML格式如下,左側為目錄,右側為具體內(nèi)容,可以點擊左側目錄跳轉(zhuǎn)到對應的正文內(nèi)容,非常方便。



          04

          獲取方式


          全套電子書中文版HTML+英文版PDF獲取

          為了方便大家,附上書籍云盤下載鏈接。

          點擊下方??名片關注:機器學習算法那些事 ,后臺回復?1101(建議復制)即可獲得百度網(wǎng)盤地址。

          注意??:是在上方??公眾號后臺消息框中回復 1101,而非本號!

          瀏覽 87
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人男人的天堂视频在线观看 | 91视频网站 | 欧美成人在线支援 | 成人福利免费视频 | 天天日天天操天天干天天 |