<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          《動(dòng)手學(xué)數(shù)據(jù)分析》開(kāi)源教程完整發(fā)布!

          共 1650字,需瀏覽 4分鐘

           ·

          2020-09-02 06:33

          ↑↑↑關(guān)注后"星標(biāo)"Datawhale
          每日干貨?&?每月組隊(duì)學(xué)習(xí),不錯(cuò)過(guò)
          ?Datawhale干貨?
          作者:陳安東,湖南大學(xué),Datawhale成員


          1. 開(kāi)源初衷

          對(duì)于任何一個(gè)將來(lái)要實(shí)際運(yùn)用的技能,通過(guò)實(shí)戰(zhàn),自己親自將一行行代碼敲出來(lái),然后達(dá)到自己想要的效果,這個(gè)過(guò)程是最好的學(xué)習(xí)方式。

          最開(kāi)始接觸了Datawhale數(shù)據(jù)分析項(xiàng)目,那時(shí)我作為一名學(xué)員的以《Python for data analysis》這本書(shū)為教材,通過(guò)刷這本教材的代碼來(lái)學(xué)習(xí)數(shù)據(jù)分析的數(shù)據(jù)處理技能,書(shū)里對(duì)于pandas和numpy操作講的很細(xì),但是對(duì)于數(shù)據(jù)分析思維的內(nèi)容涉及就少了很多。最后感覺(jué)就是敲了一堆代碼并不知道怎么用。

          后面又接觸了Datawhale數(shù)據(jù)挖掘?qū)崙?zhàn)項(xiàng)目[1]?。這個(gè)項(xiàng)目又比較偏模型和實(shí)戰(zhàn),直接給你一個(gè)任務(wù),讓你去完成,上手難度比較大,但是它的實(shí)戰(zhàn)性可以讓你對(duì)于什么是數(shù)據(jù)挖掘,以及數(shù)據(jù)挖掘的邏輯有很好的把握。

          所以我們?cè)谙胗袥](méi)有這樣一個(gè)項(xiàng)目,以實(shí)戰(zhàn)為主線,將知識(shí)點(diǎn)孕育其中,通過(guò)邊學(xué),邊做以及邊被引導(dǎo)的方式來(lái)使學(xué)習(xí)效果達(dá)到更好,學(xué)完之后既能掌握數(shù)據(jù)處理技能又能掌握數(shù)據(jù)分析的大致思路和流程。于是就有了開(kāi)源項(xiàng)目《動(dòng)手學(xué)數(shù)據(jù)分析》,讓小白也可以更好地開(kāi)啟他的數(shù)據(jù)分析之路。

          2. 項(xiàng)目詳情

          2.1 項(xiàng)目概括

          項(xiàng)目分為三個(gè)單元,大致可以分為:數(shù)據(jù)基礎(chǔ)操作,數(shù)據(jù)清洗與重構(gòu),建模和評(píng)估。每個(gè)部分的學(xué)習(xí)內(nèi)容如下:

          • 第一單元:我們獲得一個(gè)要分析的數(shù)據(jù),我要學(xué)會(huì)如何加載數(shù)據(jù),查看數(shù)據(jù),然后學(xué)習(xí)Pandas的一些基礎(chǔ)操作,最后開(kāi)始嘗試探索性的數(shù)據(jù)分析。

          • 第二單元:當(dāng)我們可以比較熟練的操作數(shù)據(jù)并認(rèn)識(shí)這個(gè)數(shù)據(jù)之后,我們需要開(kāi)始數(shù)據(jù)清洗以及重構(gòu),將原始數(shù)據(jù)變?yōu)橐粋€(gè)可用好用的數(shù)據(jù),為之后放入模型做準(zhǔn)備。

          • 第三單元:我們根據(jù)任務(wù)需求不同,要考慮建立什么模型,我們使用流行的sklearn庫(kù),建立模型。對(duì)于一個(gè)模型的好壞,我們是需要評(píng)估的,之后我們會(huì)評(píng)估我們的模型,對(duì)模型做優(yōu)化。

          2.2 項(xiàng)目詳情

          • 開(kāi)源地址:

            https://github.com/datawhalechina/hands-on-data-analysis

          • 代碼形式:jupyter
          • 數(shù)據(jù)集:kaggle上的泰坦尼克[2]數(shù)據(jù)集
          • 目的:是通過(guò)真實(shí)的數(shù)據(jù),以實(shí)戰(zhàn)的方式熟悉數(shù)據(jù)分析python的基本操作和了解數(shù)據(jù)分析思維
          • 結(jié)果:完成Kaggle上泰坦尼克任務(wù)

          在從GitHub下載了我們的倉(cāng)庫(kù)之后,里面包含了我們所需的數(shù)據(jù)以及實(shí)戰(zhàn)需要的代碼。在每個(gè)單元里,分別有【課程】文件和【答案】文件。

          【課程】是實(shí)戰(zhàn)文件,根據(jù)我們的引導(dǎo),通過(guò)代碼完成相應(yīng)的任務(wù)。除了需要完成了代碼的編寫(xiě),在重要的地方我們?cè)O(shè)計(jì)了思考題,學(xué)習(xí)者可以有更深刻的理解。

          在完成一個(gè)【課程】后,既掌握了這一部分知識(shí)又可以完成代碼的編寫(xiě)。

          在相對(duì)應(yīng)的【答案】文件,我們提供了參考答案。也是希望新手可以在實(shí)戰(zhàn)的路上少一點(diǎn)坑,多一點(diǎn)注意力放到知識(shí)點(diǎn)本身。

          3. 寫(xiě)到最后

          關(guān)于我們項(xiàng)目的名字——?jiǎng)邮謱W(xué)數(shù)據(jù)分析(Hands-on data analysis)。數(shù)據(jù)分析是一個(gè)要從一堆數(shù)字中看到真相的過(guò)程。學(xué)會(huì)操作數(shù)據(jù)只是數(shù)據(jù)分析的一半功力,剩下的另一半要用我們的大腦,多思考,多總結(jié),更要多動(dòng)手,實(shí)打?qū)嵉牡那么a。所以也希望在學(xué)習(xí)這個(gè)開(kāi)源教程的時(shí)候,多去推理,多去問(wèn)問(wèn)為什么;多多練習(xí),確保理論實(shí)踐結(jié)合起來(lái),在學(xué)習(xí)結(jié)束的時(shí)候一定會(huì)大收獲。

          參考資料

          [1]

          數(shù)據(jù)挖掘?qū)崙?zhàn): https://github.com/datawhalechina/team-learning-data-mining

          [2]

          泰坦尼克數(shù)據(jù)集: 后臺(tái)回復(fù)titanic獲取

          后臺(tái)回復(fù)?動(dòng)手學(xué)數(shù)據(jù)分析?,可下載 PDF教程

          “干貨學(xué)習(xí),點(diǎn)三連
          瀏覽 75
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久热中文字幕在线 | 中文字幕第5页 | 操你啦青青草 | 偷偷操视频 | 丁香五月天婷婷激情 |