精通數(shù)據(jù)科學(xué):從線性回歸到深度學(xué)習(xí)
數(shù)據(jù)科學(xué)是一門內(nèi)涵很廣的學(xué)科,它涉及到統(tǒng)計分析、機器學(xué)習(xí)以及計算機科學(xué)三方面的知識和技能。本書深入淺出、全面系統(tǒng)地介紹了這門學(xué)科的內(nèi)容。
本書分為13章,最初的3章主要介紹數(shù)據(jù)科學(xué)想要解決的問題、常用的IT工具Python以及這門學(xué)科所涉及的數(shù)學(xué)基礎(chǔ)。第4-7章主要討論數(shù)據(jù)模型,主要包含三方面的內(nèi)容:一是統(tǒng)計中最經(jīng)典的線性回歸和邏輯回歸模型;二是計算機估算模型參數(shù)的隨機梯度下降法,這是模型工程實現(xiàn)的基礎(chǔ);三是來自計量經(jīng)濟學(xué)的啟示,主要涉及特征提取的方法以及模型的穩(wěn)定性。接下來的8-10章主要討論算法模型,也就是機器學(xué)習(xí)領(lǐng)域比較經(jīng)典的模型。這三章依次討論了監(jiān)督式學(xué)習(xí)、生成式模型以及非監(jiān)督式學(xué)習(xí)。目前數(shù)據(jù)科學(xué)最前沿的兩個領(lǐng)域分別是大數(shù)據(jù)和人工智能。本書的第11章將介紹大數(shù)據(jù)中很重要的分布式機器學(xué)習(xí),而本書的最后兩章將討論人工智能領(lǐng)域的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。...
數(shù)據(jù)科學(xué)是一門內(nèi)涵很廣的學(xué)科,它涉及到統(tǒng)計分析、機器學(xué)習(xí)以及計算機科學(xué)三方面的知識和技能。本書深入淺出、全面系統(tǒng)地介紹了這門學(xué)科的內(nèi)容。
本書分為13章,最初的3章主要介紹數(shù)據(jù)科學(xué)想要解決的問題、常用的IT工具Python以及這門學(xué)科所涉及的數(shù)學(xué)基礎(chǔ)。第4-7章主要討論數(shù)據(jù)模型,主要包含三方面的內(nèi)容:一是統(tǒng)計中最經(jīng)典的線性回歸和邏輯回歸模型;二是計算機估算模型參數(shù)的隨機梯度下降法,這是模型工程實現(xiàn)的基礎(chǔ);三是來自計量經(jīng)濟學(xué)的啟示,主要涉及特征提取的方法以及模型的穩(wěn)定性。接下來的8-10章主要討論算法模型,也就是機器學(xué)習(xí)領(lǐng)域比較經(jīng)典的模型。這三章依次討論了監(jiān)督式學(xué)習(xí)、生成式模型以及非監(jiān)督式學(xué)習(xí)。目前數(shù)據(jù)科學(xué)最前沿的兩個領(lǐng)域分別是大數(shù)據(jù)和人工智能。本書的第11章將介紹大數(shù)據(jù)中很重要的分布式機器學(xué)習(xí),而本書的最后兩章將討論人工智能領(lǐng)域的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。
本書通俗易懂,而且理論和實踐相結(jié)合,可作為數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的學(xué)習(xí)用書,也適合對數(shù)學(xué)科學(xué)有強烈興趣的初學(xué)者使用。同時也可作為高等院校計算機、數(shù)學(xué)及相關(guān)專業(yè)的師生用書和培訓(xùn)學(xué)校的教材。
唐亙,數(shù)據(jù)科學(xué)家,專注于機器學(xué)習(xí)和大數(shù)據(jù),熱愛并積極參與Apache Spark、scikit-learn等開源項目。作為講師和技術(shù)顧問,為多家機構(gòu)(包括惠普、華為、復(fù)旦大學(xué)等)提供百余場技術(shù)培訓(xùn)。
此前的工作和研究集中于經(jīng)濟和量化金融,曾參與經(jīng)濟合作與發(fā)展組織(OECD)的研究項目并發(fā)表論文,并擔(dān)任英國知名在線出版社Packt的技術(shù)審稿人。
曾獲得復(fù)旦大學(xué)的數(shù)學(xué)和計算機雙學(xué)士學(xué)位;巴黎綜合理工的金融碩士學(xué)位;法國國立統(tǒng)計與經(jīng)濟管理學(xué)校的數(shù)據(jù)科學(xué)碩士學(xué)位。
