<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          14個(gè)超有趣的數(shù)據(jù)分析項(xiàng)目,數(shù)據(jù)集都給你整理好啦

          共 3710字,需瀏覽 8分鐘

           ·

          2021-11-07 01:22



          項(xiàng)目分為三種類型:

          • 可視化項(xiàng)目 -  探索性數(shù)據(jù)分析(EDA)項(xiàng)目 -  預(yù)測建模

          可視化項(xiàng)目

          最容易上手的就是數(shù)據(jù)可視化, 以下3個(gè)數(shù)據(jù)集可以用于創(chuàng)建一些有意思的的可視化效果并加到你的簡歷中。


          1. 新冠病毒可視化

          學(xué)習(xí)如何使用Plotly構(gòu)建動態(tài)可視化數(shù)據(jù),展示冠狀病毒是如何在全球范圍內(nèi)傳播的。Plotly很好用,它可以做動態(tài)可視化,好看且操作簡單。


          難易程度:?

          數(shù)據(jù)集:

          https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset

          教程:

          https://towardsdatascience.com/visualizing-the-coronavirus-pandemic-with-choropleth-maps-7f30fccaecf5

          2. 澳洲大火數(shù)據(jù)可視化

          2019-2020年的叢林大火季,也稱為黑色夏天,由2019年6月開始的幾場極端野火組成的。據(jù)維基百科統(tǒng)計(jì),這場大火燒毀了約1,860萬公頃的土地和5,900多座建筑物。

          這是一個(gè)有趣的項(xiàng)目,可以利用Plotly或Matplotlib數(shù)據(jù)可視化工具來可視化野火的規(guī)模和對地理的影響。

          難易程度:?

          數(shù)據(jù)集:

          https://www.kaggle.com/carlosparadis/fires-from-space-australia-and-new-zeland

          3. 地表溫度可視化

          你是否懷疑過全球變暖的觀點(diǎn)?創(chuàng)建一些數(shù)據(jù)可視化效果,顯示地球表面溫度如何隨時(shí)間變化,并可以通過創(chuàng)建折線圖或其他動畫的Choropleth貼圖來實(shí)現(xiàn)!也可以創(chuàng)建一個(gè)預(yù)測模型來預(yù)測未來五十年內(nèi)地球的溫度。

          難易程度:??

          數(shù)據(jù)集:

          https://www.kaggle.com/berkeleyearth/climate-change-earth-surface-temperature-data/kernels

          很多人學(xué)習(xí)python,不知道從何學(xué)起。很多人學(xué)習(xí)python,掌握了基本語法過后,不知道在哪里尋找案例上手。


          探索性數(shù)據(jù)分析項(xiàng)目

          探索性數(shù)據(jù)分析(EDA),也稱為數(shù)據(jù)挖掘,意思是數(shù)據(jù)分析過程中使用了多種技術(shù)來更好理解數(shù)據(jù)。


          1. 紐約Airbnb數(shù)據(jù)挖掘

          自2008年以來,Airbnb使游客和房東出行更方便,提出更多個(gè)性化的體驗(yàn)世界的方式。該數(shù)據(jù)集包含有關(guān)2019年紐約出租的信息以及包含其地理信息,價(jià)格,評論數(shù)量等。

          可以分析的一些角度如下

          • 哪些區(qū)域生意最好,為什么?-  哪些區(qū)域的流量比其他區(qū)域大,為什么?-  價(jià)格,評論數(shù)量和預(yù)訂天數(shù)之間是否存在一些關(guān)系?

          難易程度:???

          數(shù)據(jù)集:

          https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data

          2. 哪些因素與員工離職和績效有關(guān)

          IBM公開了一個(gè)綜合數(shù)據(jù)集,可以使用它來了解各種因素如何影響員工的流失率和滿意度。一些變量包括教育程度,工作相關(guān)性,績效評估和工作生活平衡程度等。

          分析此數(shù)據(jù)集,找到任何確實(shí)影響員工滿意度的變量,另外,還可以看看是否可以對變量進(jìn)行重要程度排名。

          難易程度:?

          數(shù)據(jù)集:

          https://www.kaggle.com/pavansubhasht/ibm-hr-analytics-attrition-dataset

          3. 世界大學(xué)排名

          你認(rèn)為你的國家擁有世界上最好的大學(xué)嗎?成為“最好”大學(xué)的衡量標(biāo)準(zhǔn)是什么?該數(shù)據(jù)集包含三個(gè)全球大學(xué)排名方式。使用此數(shù)據(jù),你是否可以回答以下問題:

          • 頂尖的大學(xué)都在哪些國家?-  決定世界排名的主要因素是什么?

          難易程度:?

          數(shù)據(jù)集:

          https://www.kaggle.com/mylesoneill/world-university-rankings

          4. 飲酒與在校表現(xiàn)

          喝酒會影響學(xué)生的成績嗎?如果不會,那有什么別的影響嗎?這個(gè)數(shù)據(jù)是從中學(xué)數(shù)學(xué)和葡萄牙語課程的學(xué)生進(jìn)行的一項(xiàng)調(diào)查中獲得的。它包含幾個(gè)變量,例如飲酒量,家庭人數(shù),參與課外活動。

          利用這些數(shù)據(jù),挖掘?qū)W校成績與各種因素之間的關(guān)系。另外,看看是否可以根據(jù)其他變量來預(yù)測學(xué)生的成績!

          難易程度:?

          數(shù)據(jù)集:

          https://www.kaggle.com/uciml/student-alcohol-consumption

          5. 寵物小精靈數(shù)據(jù)挖掘

          對所有游戲玩家來說,這是一個(gè)包含來自七代802個(gè) Pokemon的信息數(shù)據(jù)集。試著回答以下幾個(gè)問題!

          • 哪一代寵物小精靈最強(qiáng)?哪代最弱?-  哪種類型神奇寶貝最強(qiáng)?哪種最弱?-  能否建立分類器來識別神奇寶貝?-  身體特征與力量狀態(tài)(進(jìn)攻,防守,速度等)之間是否有相關(guān)性?

          難易程度:?

          數(shù)據(jù)集:

          https://www.kaggle.com/rounakbanik/pokemon

          6. 探索影響預(yù)期壽命的因素

          世衛(wèi)組織建立了一段時(shí)間內(nèi)所有國家健康狀況的數(shù)據(jù)集,其中包括預(yù)期壽命,成人死亡率等方面的統(tǒng)計(jì)數(shù)據(jù)。使用此數(shù)據(jù)集,探索各種變量之間的關(guān)系,預(yù)測對預(yù)期壽命的最大影響因素是什么?

          請嘗試回答以下問題:

          • 最初選擇的各種預(yù)測因素是否真的影響預(yù)期壽命?實(shí)際影響預(yù)期壽命的預(yù)測變量有哪些?-  預(yù)期壽命值低于(<65)的國家是否應(yīng)該增加其醫(yī)療保健支出以改善其平均壽命?-  嬰兒和成人死亡率如何影響預(yù)期壽命?-  預(yù)期壽命與飲食習(xí)慣,生活方式,運(yùn)動,吸煙,飲酒等是正相關(guān)還是負(fù)相關(guān)?-  是否接受教育對人類壽命有何影響?-  預(yù)期壽命與飲酒是正相關(guān)還是負(fù)相關(guān)?-  人口稠密的國家的預(yù)期壽命是否有降低的趨勢?-  免疫覆蓋率對預(yù)期壽命有什么影響?**難易程度:**?

          數(shù)據(jù)集:

          https://www.kaggle.com/kumarajarshi/life-expectancy-who

          預(yù)測模型

          1. 能源消耗的時(shí)間序列預(yù)測

          該數(shù)據(jù)集由美國區(qū)域傳輸組織PJM網(wǎng)站上的功耗數(shù)據(jù)組成,使用此數(shù)據(jù)集,查看是否可以構(gòu)建時(shí)間序列模型來預(yù)測能耗。除此之外,還可以查看是否可以找到一天中每個(gè)小時(shí)的趨勢,假日用電量以及長期趨勢!

          難易程度:????

          數(shù)據(jù)集:

          https://www.kaggle.com/robikscube/hourly-energy-consumption

          2. 貸款預(yù)測

          該數(shù)據(jù)集取自Analytics Vidhya,包括 615行和13列有關(guān)已批準(zhǔn)和尚未批準(zhǔn)的歷史貸款信息。你是否可以創(chuàng)建一個(gè)模型來預(yù)測貸款是否會獲批。

          難易程度:?

          數(shù)據(jù)集:

          https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/

          3. 二手車價(jià)格計(jì)算器

          Craigslist是全球最大的二手車經(jīng)銷商,該數(shù)據(jù)集由Craigslist的抓取數(shù)據(jù)組成,每隔幾個(gè)月更新一次。使用此數(shù)據(jù)集,查看是否可以創(chuàng)建一個(gè)數(shù)據(jù)集來預(yù)測一輛汽車價(jià)格是否被高估或低估了。

          難易程度:???

          數(shù)據(jù)集:

          https://www.kaggle.com/austinreese/craigslist-carstrucks-data

          4. 信用卡欺詐檢測

          該數(shù)據(jù)集顯示了兩天內(nèi)發(fā)生的交易,其中284,807筆交易中有492筆欺詐。數(shù)據(jù)高度正態(tài)分布,欺詐占所有交易的0.172%。學(xué)習(xí)如何使用不正態(tài)的數(shù)據(jù)集并建立信用卡欺詐檢測模型。

          **難易程度:**????

          數(shù)據(jù)集:

          https://www.kaggle.com/janiobachmann/credit-fraud-dealing-with-imbalanced-datasets

          5. 皮膚癌圖像檢測

          通過10,000多張圖像來構(gòu)建神經(jīng)網(wǎng)絡(luò)來檢測皮膚癌。這絕對是最難的項(xiàng)目,需要有關(guān)神經(jīng)網(wǎng)絡(luò)和圖像識別的儲備知識。

          難易程度:?????

          數(shù)據(jù)集:

          https://www.kaggle.com/kmader/skin-cancer-mnist-ham10000




          Python“寶藏級”公眾號【Python之王】專注于Python領(lǐng)域,會爬蟲,數(shù)分,C++,tensorflow和Pytorch等等

          近 2年共原創(chuàng) 100+ 篇技術(shù)文章。創(chuàng)作的精品文章系列有:

          日常收集整理了一批不錯(cuò)的 Python 學(xué)習(xí)資料,有需要的小伙可以自行免費(fèi)領(lǐng)取。

          獲取方式如下:公眾號回復(fù)資料領(lǐng)取Python等系列筆記,項(xiàng)目,書籍,直接套上模板就可以用了。資料包含算法、python、算法小抄、力扣刷題手冊和 C++ 等學(xué)習(xí)資料!


          瀏覽 87
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  伊人网大香蕉 | 欧美精品三级视频在线看 | 操逼网av | 天天干,天天干 | 最近中文字幕在线中文字幕7 |