寫了本機器學習的入門書
我寫的一本針對大學生入門機器學習的教材《機器學習入門基礎(chǔ)》即將上市,希望能給初學者雪中送炭。
黃海廣
動機
作為計算機方向的博士,本人一直熱衷于幫助機器學習初學者入門方面的工作,主持和參與了很多國內(nèi)外優(yōu)秀作品的翻譯、代碼復現(xiàn)工作,比較有代表性的是吳恩達老師的機器學習課程的翻譯工作,以及機器學習和深度學習筆記的撰寫,幫助了很多初學者。
博士畢業(yè)后,我成為一名大學教師,同時承擔了本科生和研究生的機器學習課程的教學工作。在教學過程中,我學習和借鑒了國內(nèi)外很多非常優(yōu)秀的機器學習課程或作品(如吳恩達老師的機器學習課程、李航老師的統(tǒng)計學習方法、周志華老師的機器學習等),經(jīng)典是只能學習,不能超越。
站在巨人的肩膀上,本人決定寫一本適合本科生和初學者的機器學習入門書,以方便只有本科三年級數(shù)學水平的學生入門。
這本書已經(jīng)完成部分印刷,將在清華大學出版社出版。

本書正文244頁,此外還包含代碼、課件、視頻、教學大綱、教學進度。不僅適合初學者學習,也適合新手老師授課。

內(nèi)容簡介
這本書的初稿于2021年3月完成,并根據(jù)初稿的內(nèi)容進行授課,經(jīng)過三輪授課,我們團隊對其中的部分內(nèi)容進行了調(diào)整,更適合初學者學習,同時,根據(jù)本書的內(nèi)容,制作了慕課,并通過中國大學慕課向讀者開放,累計學習者超過2萬人,屬于比較熱門的課程。
這本書的課件和代碼,已經(jīng)在Github進行分享,原版課件分享給了國內(nèi)1400多位大學教師,也收到了很多寶貴的意見。
在本書中,我們主要講解經(jīng)典的機器學習算法,如線性回歸、邏輯回歸、決策樹等,也將講解近幾年才出現(xiàn)的如XGBoost、LightGBM等集成學習算法,每章都有代碼,以及20題以上的練習題。此外,這本書還會講解利用機器學習解決問題的實用技術(shù),還包括Python、Scikit-learn工具的使用等等。
本書定位為入門基礎(chǔ)課,通過這本書,學習者將初步理解主流的機器學習算法,并且可以用機器學習技術(shù)解決現(xiàn)實生活中的問題。
本書對初學者來說,屬于“雪中送炭”,而不是“錦上添花”,更適合初學者學習,主要解決初學者的三個問題:
(1)資料太多,難以取舍。
(2)理論性強,初學比較困難。
(3)代碼資料比較少。
只要有本科三年級以上的數(shù)學知識,會一種編程語言,就可以掌握這本書的絕大部分內(nèi)容。
本書共有15章,本書結(jié)構(gòu)大體分為:監(jiān)督學習、無監(jiān)督學習兩個部分。監(jiān)督學習介紹了多種常見的機器學習算法,如KNN、線性回歸、SVM、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、邏輯回歸、集成學習等分類算法和回歸算法。無監(jiān)督學習則聚焦于聚類、降維、關(guān)聯(lián)規(guī)則等幾大問題,并對K-means、PCA等代表算法進行了介紹,此外,還對關(guān)聯(lián)規(guī)則的主要算法進行講解。此外,本書的第2章為選修內(nèi)容,附上了所需的數(shù)學知識回顧供同學們參考。
本書可以作為專科生、本科生、研究生的教材,作為本科生的教材時,第2章數(shù)學基礎(chǔ)回顧和第11章人工神經(jīng)網(wǎng)絡(luò)可以作為選修部分,建議課時:理論課32課時,實驗課16~32課時;作為專科生的教材時,建議配合代碼進行課程講解,增加實驗部分課時,減少理論部分課時,建議課時:理論課32課時,實驗課32課時;作為研究生的教材時,建議課時為36課時,實驗部分建議自學。

相關(guān)資源
這本書的視頻內(nèi)容已經(jīng)在中國大學慕課進行授課,目前是第四輪了。慕課地址:
https://www.icourse163.org/course/WZU-1464096179
課程資源(pdf版本課件和代碼)公布在Github:
https://github.com/fengdu78/WZU-machine-learning-course
本書的課件和教案,可以分享給在職的教師, 請用edu郵箱聯(lián) 系我: haiguang2000@ wzu.edu.cn
在本書的編寫過程中,得到了很多人的支持和幫助,如李航老師和徐亦達老師,對我的工作十分支持,在此表示感謝!
本人水平有限,如有公式、算法錯誤,歡迎各位讀者指正批評。
一起 “ 點贊 ” 三連 ↓
