機器學習系統(tǒng)設計
如今,機器學習正在互聯(lián)網(wǎng)上下掀起熱潮,而Python則是非常適合開發(fā)機器學習系統(tǒng)的一門優(yōu)秀語言。作為動態(tài)語言,它支持快速探索和實驗,并且針對Python的機器學習算法庫的數(shù)量也與日俱增。本書最大的特色,就是結合實例分析教會讀者如何通過機器學習解決實際問題。
本書將向讀者展示如何從原始數(shù)據(jù)中發(fā)現(xiàn)模式,首先從Python與機器學習的關系講起,再介紹一些庫,然后就開始基于數(shù)據(jù)集進行比較正式的項目開發(fā)了,涉及建模、推薦及改進,以及聲音與圖像處理。通過流行的開源庫,我們可以掌握如何高效處理文本、圖片和聲音。同時,讀者也能掌握如何評估、比較和選擇適用的機器學習技術。
舉幾個例子,我們會介紹怎么把StackOverflow的回答按質(zhì)量高低進行分類,怎么知道某個音樂文件是爵士風格,還是重金屬搖滾風格。另外,本書還涵蓋了主題建模、購物習性分析及云計算等高級內(nèi)容。總之,...
如今,機器學習正在互聯(lián)網(wǎng)上下掀起熱潮,而Python則是非常適合開發(fā)機器學習系統(tǒng)的一門優(yōu)秀語言。作為動態(tài)語言,它支持快速探索和實驗,并且針對Python的機器學習算法庫的數(shù)量也與日俱增。本書最大的特色,就是結合實例分析教會讀者如何通過機器學習解決實際問題。
本書將向讀者展示如何從原始數(shù)據(jù)中發(fā)現(xiàn)模式,首先從Python與機器學習的關系講起,再介紹一些庫,然后就開始基于數(shù)據(jù)集進行比較正式的項目開發(fā)了,涉及建模、推薦及改進,以及聲音與圖像處理。通過流行的開源庫,我們可以掌握如何高效處理文本、圖片和聲音。同時,讀者也能掌握如何評估、比較和選擇適用的機器學習技術。
舉幾個例子,我們會介紹怎么把StackOverflow的回答按質(zhì)量高低進行分類,怎么知道某個音樂文件是爵士風格,還是重金屬搖滾風格。另外,本書還涵蓋了主題建模、購物習性分析及云計算等高級內(nèi)容。總之,通過學習本書,讀者可以掌握構建自己所需系統(tǒng)的各方面知識,并且學以致用,解決自己面臨的現(xiàn)實問題。
讀者只要具有一定的Python編程經(jīng)驗,能夠自己安裝和使用開源庫,就足夠了,即使對機器學習一點了解都沒有也沒關系。本書不會講機器學習算法背后的數(shù)學。
作者簡介:
Willi Richert
機器學習和機器人學博士,目前任職于微軟Bing搜索核心研發(fā)團隊。他從事多種機器學習領域的研究,包括主動學習和統(tǒng)計機器翻譯。
Luis Pedro Coelho
計算生物學家,主要關注生物圖像信息學和大規(guī)模圖像數(shù)據(jù)的處理,致力于生物標本圖像分析中機器學習技術的應用,他還是Python計算機視覺庫mahotas的主要開發(fā)人員。他于1998年開始開發(fā)開源軟件,2004年起從事Python開發(fā),并為多個Python開源庫貢獻了代碼。另外,Luis擁有機器學習領域世界領先的卡內(nèi)基-梅隆大學的博士學位,并發(fā)表過多篇科學論文。
譯者簡介:
劉峰
百度LBS地圖基礎業(yè)務部資深研發(fā)工程師,新加坡南洋理工大學計算機工程系博士,研究領域包括機器學習、模糊神經(jīng)網(wǎng)絡等。2010年加入百度,主要從事大數(shù)據(jù)分析和挖掘方面的工作,近年來專注于...
作者簡介:
Willi Richert
機器學習和機器人學博士,目前任職于微軟Bing搜索核心研發(fā)團隊。他從事多種機器學習領域的研究,包括主動學習和統(tǒng)計機器翻譯。
Luis Pedro Coelho
計算生物學家,主要關注生物圖像信息學和大規(guī)模圖像數(shù)據(jù)的處理,致力于生物標本圖像分析中機器學習技術的應用,他還是Python計算機視覺庫mahotas的主要開發(fā)人員。他于1998年開始開發(fā)開源軟件,2004年起從事Python開發(fā),并為多個Python開源庫貢獻了代碼。另外,Luis擁有機器學習領域世界領先的卡內(nèi)基-梅隆大學的博士學位,并發(fā)表過多篇科學論文。
譯者簡介:
劉峰
百度LBS地圖基礎業(yè)務部資深研發(fā)工程師,新加坡南洋理工大學計算機工程系博士,研究領域包括機器學習、模糊神經(jīng)網(wǎng)絡等。2010年加入百度,主要從事大數(shù)據(jù)分析和挖掘方面的工作,近年來專注于無線定位、用戶軌跡等LBS大數(shù)據(jù)的挖掘及機器學習應用。
