<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          霍普金斯大學(xué)教授強(qiáng)烈推薦的5本數(shù)據(jù)科學(xué)經(jīng)典書籍

          共 2335字,需瀏覽 5分鐘

           ·

          2022-05-31 11:37

          來源:https://fivebooks.com/best-books/data-science-roger-peng/

          翻譯內(nèi)容來源程序員書庫(kù)


          數(shù)據(jù)科學(xué)在近幾年變得非常流行,Roger D. Peng是一名霍普金斯大學(xué)的生物統(tǒng)計(jì)學(xué)教授,美國(guó)統(tǒng)計(jì)協(xié)會(huì)的會(huì)員,同時(shí)他也是最大的數(shù)據(jù)科學(xué)在線課程的創(chuàng)始人之一。今天,我們就一起來看看他都推薦了哪些關(guān)于數(shù)據(jù)科學(xué)的書籍。



          在我們知道這些書單之前,先了解一下Roger D. Peng是如何從生物統(tǒng)計(jì)科學(xué)轉(zhuǎn)向數(shù)據(jù)科學(xué)?


          Roger D. Peng:在我看來,我作為生物統(tǒng)計(jì)學(xué)家所做的大部分工作和我作為數(shù)據(jù)科學(xué)家所做的是一樣的。數(shù)據(jù)科學(xué)的范圍很廣,許多人都離不開它,這也是為什么近幾年會(huì)出現(xiàn)“數(shù)據(jù)科學(xué)”這個(gè)概念的原因,真正讓我更深入這個(gè)社區(qū)的是一系列的課程,我和我的同事Brian Caffo和Jeff Leek通過Coursera開展的一系列數(shù)據(jù)科學(xué)和R語(yǔ)言教程。


          目前已經(jīng)有8000多名學(xué)生參加完Roger D. Peng的完整在線數(shù)據(jù)科學(xué)專業(yè)課程,數(shù)百萬(wàn)人選修了其中一到兩門課程。話不多說,接下來就來看看Roger D. Peng推薦的這幾本書



          1、《Statistical Evidence》


          推薦理由:Richard Royall也是霍普金斯大學(xué)的教授,但在我加入之前他就已經(jīng)退休了,這本書徹底改變了我對(duì)數(shù)據(jù)分析和統(tǒng)計(jì)思維的看法,這本書很薄,讀起來很快,但我已經(jīng)讀了20~30遍。每一次,我都可以從里面學(xué)到新東西,它有點(diǎn)學(xué)術(shù)性和數(shù)學(xué)性,比確實(shí)需要一些統(tǒng)計(jì)學(xué)背景才能更好地閱讀它。


          它講的是數(shù)據(jù)提供給你的東西和你把數(shù)據(jù)和外界事物結(jié)合起來會(huì)發(fā)生什么之間的區(qū)別。他還解釋了統(tǒng)計(jì)學(xué)中的概率論、貝葉斯理論等,他主要的觀點(diǎn)是我們做的一些事情可以追溯到數(shù)據(jù),你需要把兩件事情分開,一是建立數(shù)據(jù),然后才是決定要用它去做什么(比如決策、病人參與試驗(yàn)等等)


          我們經(jīng)常將數(shù)據(jù)和外部元素相結(jié)合從而做出決策,但是許多工具將這些因素打包在一起,反而讓事情變得復(fù)雜,Royall的思維方式對(duì)于我來說很新穎,它對(duì)我如何進(jìn)行數(shù)據(jù)分析產(chǎn)生了深遠(yuǎn)的影響,很多關(guān)于數(shù)據(jù)分析的討論都傾向于把所有事情混在一起,因?yàn)樗鼈兪恰皵?shù)據(jù)相關(guān)”的,但是不要忘了,數(shù)據(jù)分析師的角色固然重要,但是他們和科學(xué)家或決策者的角色是不同的,我們要把他們區(qū)分開來。



          2、《Visualize This》


          推薦理由:Nathan Yau是一名統(tǒng)計(jì)學(xué)家,和我一樣擁有加州大學(xué)洛杉磯分校(University of California, Los Angeles)的博士學(xué)位,Yau在他的博客‘Flowing Data’中寫了很多關(guān)于數(shù)據(jù)可視化的文章,這本書就是關(guān)于如何更好的將數(shù)據(jù)呈現(xiàn)給其他人,你可以使用哪些工具,以及你可以實(shí)現(xiàn)的可視化類型有哪些。


          Yau在這個(gè)領(lǐng)域是一個(gè)很了不起的專家,他在他網(wǎng)站上展示的那些例子都是經(jīng)過精心設(shè)計(jì)的,你可以從這本書里學(xué)到的一件事就是思考你在做什么,以及確保你的數(shù)據(jù)可視化達(dá)到你的理想結(jié)果。



          3、《Storytelling with Data》


          推薦理由:Cole Nussbaumer Knaflic曾在谷歌任職,離開谷歌后寫下了這本書,她和Nathan Yau有一個(gè)關(guān)于數(shù)據(jù)分析的博客——‘Storytelling with Data’,她非常注重可視化,本書關(guān)注的是那些將成為分析或報(bào)告的接收端的受眾,最重要的是考慮他們需要的是什么,以及分析數(shù)據(jù)時(shí),哪些選擇對(duì)受眾是最佳的。


          她另一個(gè)重要的思想是你如何講述數(shù)據(jù)分析呈現(xiàn)的效果,在進(jìn)行數(shù)據(jù)分析時(shí),你可能會(huì)創(chuàng)建了數(shù)百?gòu)垐D片從而擬合數(shù)千個(gè)查看數(shù)據(jù)的不同方式,但最后你一定要把這些結(jié)果整理成連貫的東西。從某種程度上來說,一個(gè)數(shù)據(jù)的分析和輸出只完成了四分之三,最后一個(gè)的部分是你要從中建立一個(gè)最終的“數(shù)據(jù)產(chǎn)品”。



          4、《An Introduction to Statistical Learning》


          推薦理由:這本書是由機(jī)器學(xué)習(xí)領(lǐng)域的一群權(quán)威作者寫的,同時(shí),他們也是偉大的作家,同一家出版社還出版了另一本書,叫做《the Elements of Statistical Learning》,這本書更先進(jìn)一些,可以吸引更多的讀者,如果您真的想深入了解目前使用的模型和統(tǒng)計(jì)工具的核心內(nèi)容,這是一個(gè)很好的參考資料,也是一個(gè)很好的學(xué)習(xí)方法。書里面有很多代碼示例,其中包括一個(gè)用R包來實(shí)現(xiàn)模型、運(yùn)行示例等。


          這本書使用R編寫代碼,我用R語(yǔ)言已經(jīng)20年,我在學(xué)校的時(shí)候就開始使用它了,那時(shí)我對(duì)Python還不太了解,無(wú)論怎么說,Python和R都是兩門很好的語(yǔ)言。這是一本相當(dāng)有深度的書籍,在數(shù)學(xué)方面比其他類似的資源要多一點(diǎn),而且比最近的許多課程更注重?cái)?shù)學(xué),這些課程向你展示了可以使用的“現(xiàn)成的”機(jī)器學(xué)習(xí)算法,而沒有過多地介紹底層模型。



          5、《Design Thinking Understanding How Designers Think and Work》


          推薦理由:我選擇的五本書在數(shù)據(jù)科學(xué)方面是相當(dāng)抽象的,我本可以推薦一堆關(guān)于詳細(xì)統(tǒng)計(jì)、R編程等方面的書籍,但我故意選了一些高一點(diǎn)的書籍,作為一個(gè)做過大量數(shù)據(jù)分析的人,我發(fā)現(xiàn)當(dāng)你分析數(shù)據(jù)的時(shí)候很容易缺乏正確的思維模式,大多數(shù)大學(xué)都有一個(gè)叫做“數(shù)據(jù)分析”的課程,通常它會(huì)提供各種有用的工具,但很少討論分析本身實(shí)際發(fā)生了什么。


          所以這本書是關(guān)于一般的設(shè)計(jì),而不是具體的數(shù)據(jù)分析,因?yàn)槊恳豁?xiàng)數(shù)據(jù)分析都是獨(dú)一無(wú)二的,因此很難在不同的經(jīng)驗(yàn)中進(jìn)行歸納


          ---END---



          謝謝大家觀看,如有幫助,來個(gè)喜歡或者關(guān)注吧!


          本文僅供學(xué)習(xí)參考,有任何疑問及建議,掃描以下公眾號(hào)二維碼添加交流:




          瀏覽 106
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产精品男人操女人 | 国产黄色在线播放 | www,av手机在线 | 国产福利1000 | 中文字幕aⅴ一区中文字幕天堂 |