經(jīng)典教材《統(tǒng)計學(xué)習(xí)導(dǎo)論》第二版來了,新增深度學(xué)習(xí)等內(nèi)容,免費下載
經(jīng)典的《統(tǒng)計學(xué)習(xí)導(dǎo)論》又出第二版了,相比于第一版,新版增加了深度學(xué)習(xí)、生存分析、多重測試等內(nèi)容,可免費下載。
斯坦福經(jīng)典教材《The Element of Statistical Learning》(簡稱 ESL)被稱為頻率學(xué)派的統(tǒng)計學(xué)習(xí)「圣經(jīng)」,由 Trevor Hastie、Robert Tibshirani、Jerome Friedman 這三位大師共同完成。這本書介紹了神經(jīng)網(wǎng)絡(luò)、支持向量機、分類樹和 boosting、圖模型、隨機森林等各類機器學(xué)習(xí)算法,可以幫助讀者了解機器學(xué)習(xí)算法全貌。
但是由于這本書涉及大量的公式、矩陣推導(dǎo)等許多比較難以理解的內(nèi)容,比較適合在數(shù)學(xué)科學(xué)方面受過高級訓(xùn)練的個人,而對于初學(xué)者而言,學(xué)習(xí)起來比較困難,因此,Trevor Hastie 等人又寫了一本入門級的《Introduction to Statistical Learning with R(統(tǒng)計學(xué)習(xí)導(dǎo)論:基于 R 應(yīng)用)》(ISL),幫助更多的人盡快上手。
ISL 弱化了數(shù)學(xué)推導(dǎo)的細節(jié),更注重方法的應(yīng)用,相當(dāng)于 ESL 的導(dǎo)讀版,在入門讀者中很受歡迎。每個章節(jié)都包含一個實驗,用 R 語言實現(xiàn)。這些實驗為讀者提供了寶貴的實踐經(jīng)驗。

目前,該書已被翻譯成多國語言,包括中文、意大利文、日文、韓文、俄文和越南文等。
現(xiàn)在,ISL 又更新到了第二版(ISLRv2),相比于第一版,第二版增加了深度學(xué)習(xí)(第 10 章)、生存分析(第 11 章)、多重測試(第 13 章)。ISLRv2 還大幅擴展了第一版的一些章節(jié):樸素貝葉斯和廣義線性模型的處理(第 4 章),貝葉斯加性回歸樹(第 8 章),矩陣補全(第 12 章)。
此外,ISLRv2 已經(jīng)更新了整個 R 代碼實驗。

網(wǎng)友極力推薦:非常好,這是一本很棒的入門書籍。

書籍介紹
全書多達 597 頁,共 13 個章節(jié),主要包括:
統(tǒng)計學(xué)習(xí);
線性回歸;
分類;
重采樣方法;
線性模型選擇與正則化;
非線性模型;
基于樹的方法;
支持向量機;
深度學(xué)習(xí);
生存分析和刪失數(shù)據(jù);
無監(jiān)督學(xué)習(xí);
多重測試。
具體而言,本書第 2 章介紹了統(tǒng)計學(xué)習(xí)背后的基本術(shù)語和概念,此外還介紹了 k - 最近鄰分類器,這是一種非常簡單的方法,在處理許多問題上都非常有效。
第 3 章和第 4 章介紹了用于回歸和分類的經(jīng)典線性方法。具體地,第 3 章回顧了線性回歸,這是所有回歸方法的基本出發(fā)點;第 4 章討論了兩個最重要的經(jīng)典分類方法,邏輯回歸和線性判別分析。
所有統(tǒng)計學(xué)習(xí)情況中的一個核心問題是為給定的應(yīng)用程序選擇最佳方法。因此,第 5 章介紹了交叉驗證和 bootstrap,它們可用于估計多種不同方法的準(zhǔn)確性以選擇最佳方法。
第 6 章考慮了許多線性方法,包括經(jīng)典的和更現(xiàn)代的線性方法,它們提供了對標(biāo)準(zhǔn)線性回歸的潛在改進,包括嶺回歸、主成分回歸和 Lasso 等。
剩余章節(jié)主要是非線性統(tǒng)計學(xué)習(xí)。第 7 章首先介紹了一些非線性方法,這些方法可以很好地解決只有一個輸入變量的問題,然后展示了如何使用這些方法來擬合有多個輸入的非線性加性模型。
第 8 章研究了基于樹的方法,包括 bagging、boosting 和隨機森林。
第 9 章介紹了支持向量機等內(nèi)容。
第 10 章介紹了深度學(xué)習(xí),這是一種非線性回歸和分類的方法,近年來受到了廣泛的關(guān)注。
第 11 章探討了生存分析,這是一種回歸方法,專門用于輸出變量被刪失的情況,即不完全觀察。
第 12 章介紹了無監(jiān)督設(shè)置,其中在無監(jiān)督設(shè)置中有輸入變量,但沒有輸出變量。特別地,作者提出了主成分分析、k - 均值聚類和層次聚類。最后,第 13 章討論了多重假設(shè)檢驗這個非常重要的話題。
作者介紹
書籍作者從左到右分別是:Gareth James、Daniela Witten、Trevor Hastie 和 Rob Tibshirani。

Gareth James 是南加州大學(xué)馬歇爾商學(xué)院副院長,主要研究領(lǐng)域包括函數(shù)型數(shù)據(jù)分析、高維回歸、市場營銷中的統(tǒng)計問題。
Daniela Witten 是一位美國生物統(tǒng)計學(xué)家,主要研究領(lǐng)域是研究如何使用機器學(xué)習(xí)來理解高維數(shù)據(jù)。
Trevor Hastie 是斯坦福大學(xué)教授,還曾經(jīng)是 AT&T 貝爾實驗室的一名技術(shù)人員。2018 年,Hastie 當(dāng)選為美國國家科學(xué)院院士。他的主要研究領(lǐng)域是應(yīng)用統(tǒng)計學(xué)。
Rob Tibshirani 是斯坦福大學(xué)統(tǒng)計與生物醫(yī)學(xué)數(shù)據(jù)科學(xué)系的教授,他曾開發(fā)了用于分析復(fù)雜數(shù)據(jù)集的統(tǒng)計工具。
書籍目錄:







領(lǐng)取方式:
長按下方掃碼,關(guān)注后發(fā)消息?[導(dǎo)論]
感謝你的分享,點贊,在看三連??
評論
圖片
表情
