《面向機器學習的特征工程》.pdf
前段時間發(fā)現(xiàn)apachecn在github上翻譯了一本和特征工程相關的書籍:《Feature Engineering for Machine Learning》,中文名為《面向機器學習的特征工程》。
這本書包含了特征工程中的數(shù)字處理技巧、文本數(shù)據(jù)處理方式、特征縮放、類別特征、降維、非線性特征提取、自動化特征提取等方面,非常適合初學者。


書籍簡介
特征工程對于應用機器學習來說是基礎的,但是使用域知識來加強你的預測模型既困難成本又高。為了彌補特征工程現(xiàn)有資料的不足,本書將會為初中級數(shù)據(jù)科學家講解如何處理這項廣泛應用卻鮮見討論的技術。
- 數(shù)值型數(shù)據(jù)的特征工程:過濾、分箱、縮放、對數(shù)變換和指數(shù)變換
- 自然文本技術:詞袋、n元詞與短語檢測
- 基于頻率的過濾和特征縮放
- 分類變量編碼技術:特征散列化與分箱計數(shù)
- 使用主成分分析的基于模型的特征工程
- 模型堆疊與k-均值特征化
- 圖像特征提取:人工提取與深度學習

目錄
第 1 章從數(shù)字數(shù)據(jù)的基本特征工程開始:過濾,合并,縮放,日志轉(zhuǎn)換和能量轉(zhuǎn)換以及交互功能。

中文版HTML
中文版的HTML格式如下,左側為目錄,右側為具體內(nèi)容,可以點擊左側目錄跳轉(zhuǎn)到對應的正文內(nèi)容,非常方便。


獲取方式
為了方便大家,附上書籍云盤下載鏈接。
點擊下方??名片關注:機器學習算法那些事 ,后臺回復?1101(建議復制)即可獲得百度網(wǎng)盤地址。
注意??:是在上方??公眾號后臺消息框中回復 1101,而非本號!
評論
圖片
表情
