<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【資源】《動(dòng)手學(xué)數(shù)據(jù)分析》開源教程完整發(fā)布!

          共 1734字,需瀏覽 4分鐘

           ·

          2020-09-14 23:25

          作者:陳安東,湖南大學(xué),Datawhale成員


          1. 開源初衷

          對于任何一個(gè)將來要實(shí)際運(yùn)用的技能,通過實(shí)戰(zhàn),自己親自將一行行代碼敲出來,然后達(dá)到自己想要的效果,這個(gè)過程是最好的學(xué)習(xí)方式。

          最開始接觸了Datawhale數(shù)據(jù)分析項(xiàng)目,那時(shí)我作為一名學(xué)員的以《Python for data analysis》這本書為教材,通過刷這本教材的代碼來學(xué)習(xí)數(shù)據(jù)分析的數(shù)據(jù)處理技能,書里對于pandas和numpy操作講的很細(xì),但是對于數(shù)據(jù)分析思維的內(nèi)容涉及就少了很多。最后感覺就是敲了一堆代碼并不知道怎么用。

          后面又接觸了Datawhale數(shù)據(jù)挖掘?qū)崙?zhàn)項(xiàng)目[1]?這個(gè)項(xiàng)目又比較偏模型和實(shí)戰(zhàn),直接給你一個(gè)任務(wù),讓你去完成,上手難度比較大,但是它的實(shí)戰(zhàn)性可以讓你對于什么是數(shù)據(jù)挖掘,以及數(shù)據(jù)挖掘的邏輯有很好的把握。

          所以我們在想有沒有這樣一個(gè)項(xiàng)目,以實(shí)戰(zhàn)為主線,將知識(shí)點(diǎn)孕育其中,通過邊學(xué),邊做以及邊被引導(dǎo)的方式來使學(xué)習(xí)效果達(dá)到更好,學(xué)完之后既能掌握數(shù)據(jù)處理技能又能掌握數(shù)據(jù)分析的大致思路和流程。于是就有了開源項(xiàng)目《動(dòng)手學(xué)數(shù)據(jù)分析》,讓小白也可以更好地開啟他的數(shù)據(jù)分析之路。

          2. 項(xiàng)目詳情

          2.1 項(xiàng)目概括

          項(xiàng)目分為三個(gè)單元,大致可以分為:數(shù)據(jù)基礎(chǔ)操作,數(shù)據(jù)清洗與重構(gòu),建模和評估。每個(gè)部分的學(xué)習(xí)內(nèi)容如下:

          • 第一單元:我們獲得一個(gè)要分析的數(shù)據(jù),我要學(xué)會(huì)如何加載數(shù)據(jù),查看數(shù)據(jù),然后學(xué)習(xí)Pandas的一些基礎(chǔ)操作,最后開始嘗試探索性的數(shù)據(jù)分析。

          • 第二單元:當(dāng)我們可以比較熟練的操作數(shù)據(jù)并認(rèn)識(shí)這個(gè)數(shù)據(jù)之后,我們需要開始數(shù)據(jù)清洗以及重構(gòu),將原始數(shù)據(jù)變?yōu)橐粋€(gè)可用好用的數(shù)據(jù),為之后放入模型做準(zhǔn)備。

          • 第三單元:我們根據(jù)任務(wù)需求不同,要考慮建立什么模型,我們使用流行的sklearn庫,建立模型。對于一個(gè)模型的好壞,我們是需要評估的,之后我們會(huì)評估我們的模型,對模型做優(yōu)化。

          2.2 項(xiàng)目詳情

          • 開源地址:

            https://github.com/datawhalechina/hands-on-data-analysis

          • 代碼形式:jupyter
          • 數(shù)據(jù)集:kaggle上的泰坦尼克[2]數(shù)據(jù)集
          • 目的:是通過真實(shí)的數(shù)據(jù),以實(shí)戰(zhàn)的方式熟悉數(shù)據(jù)分析python的基本操作和了解數(shù)據(jù)分析思維
          • 結(jié)果:完成Kaggle上泰坦尼克任務(wù)

          在從GitHub下載了我們的倉庫之后,里面包含了我們所需的數(shù)據(jù)以及實(shí)戰(zhàn)需要的代碼。在每個(gè)單元里,分別有【課程】文件和【答案】文件。

          【課程】是實(shí)戰(zhàn)文件,根據(jù)我們的引導(dǎo),通過代碼完成相應(yīng)的任務(wù)。除了需要完成了代碼的編寫,在重要的地方我們設(shè)計(jì)了思考題,學(xué)習(xí)者可以有更深刻的理解。

          在完成一個(gè)【課程】后,既掌握了這一部分知識(shí)又可以完成代碼的編寫。

          在相對應(yīng)的【答案】文件,我們提供了參考答案。也是希望新手可以在實(shí)戰(zhàn)的路上少一點(diǎn)坑,多一點(diǎn)注意力放到知識(shí)點(diǎn)本身。

          3. 寫到最后

          關(guān)于我們項(xiàng)目的名字——?jiǎng)邮謱W(xué)數(shù)據(jù)分析(Hands-on data analysis)。數(shù)據(jù)分析是一個(gè)要從一堆數(shù)字中看到真相的過程。學(xué)會(huì)操作數(shù)據(jù)只是數(shù)據(jù)分析的一半功力,剩下的另一半要用我們的大腦,多思考,多總結(jié),更要多動(dòng)手,實(shí)打?qū)嵉牡那么a。所以也希望在學(xué)習(xí)這個(gè)開源教程的時(shí)候,多去推理,多去問問為什么;多多練習(xí),確保理論實(shí)踐結(jié)合起來,在學(xué)習(xí)結(jié)束的時(shí)候一定會(huì)大收獲。

          參考資料

          [1]

          數(shù)據(jù)挖掘?qū)崙?zhàn): https://github.com/datawhalechina/team-learning-data-mining

          [2]

          泰坦尼克數(shù)據(jù)集


          往期精彩回顧





          獲取一折本站知識(shí)星球優(yōu)惠券,復(fù)制鏈接直接打開:

          https://t.zsxq.com/662nyZF

          本站qq群1003271085。

          加入微信群請掃碼進(jìn)群(如果是博士或者準(zhǔn)備讀博士請說明):

          瀏覽 36
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  人人草人人入 | 黄片大全在线看 | 午夜福利爱爱 | 狼友在线视频 | 伦理精品一区二区三精品 |