<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          獨(dú)家 | Bamboolib:你所見過的最有用的Python庫(kù)之一(附鏈接)

          共 4116字,需瀏覽 9分鐘

           ·

          2021-11-24 03:46

          作者:Ismael Araujo

          翻譯:王可汗

          校對(duì):歐陽(yáng)錦


          本文約3200字,建議閱讀5分鐘

          本文介紹了Python數(shù)據(jù)分析的一個(gè)利器——Bamboolib,它無(wú)需編碼技能,能夠自動(dòng)生成pandas代碼。


          由Andrea Piacquadio拍攝,來(lái)源:Pexels


          下面是我對(duì)這個(gè)很酷的Python庫(kù)的看法,以及為什么你應(yīng)該嘗試一下。

          我喜歡寫關(guān)于Python庫(kù)的文章。如果你讀過我的博客,你可能知道我寫過很多關(guān)于庫(kù)的文章。在寫之前,我測(cè)試了一些Python庫(kù),檢查了它們最顯著的特性,如果愿意,我還會(huì)寫一些關(guān)于它們的內(nèi)容。通常,我嘗試在同一個(gè)博客中包含幾個(gè)庫(kù)來(lái)充實(shí)博客。然而,我偶爾會(huì)發(fā)現(xiàn)一些很酷的庫(kù),它們值得擁有自己的博客。Bamboolib就是這種庫(kù)!

          Bamboolib是那種會(huì)讓你想:我以前怎么不知道這些?是啊,聽起來(lái)有點(diǎn)夸張,但相信我,你會(huì)大吃一驚的。Bamboolib可以為需要一段時(shí)間才能編寫的內(nèi)容構(gòu)建代碼,比如復(fù)雜的按子句分組。讓我們開始吧,因?yàn)槲曳浅Ed奮地向你們展示它是如何工作的。

          Bamboolib -為初學(xué)者和專業(yè)人士

          Bamboolib的賣點(diǎn)是,任何人都可以用Python做數(shù)據(jù)分析,而不必成為程序員或搜索語(yǔ)法。根據(jù)我的測(cè)試,這是真的!它不需要任何編碼技能。我看到對(duì)于時(shí)間緊迫的人或者不想為簡(jiǎn)單任務(wù)輸入長(zhǎng)代碼的人來(lái)說(shuō),它是多么方便。我還可以看到學(xué)習(xí)Python的人如何利用它。例如,如果您想學(xué)習(xí)如何在Python中做一些事情,您可以使用Bamboolib,檢查它生成的代碼,并從中學(xué)習(xí)。

          不管怎樣,讓我們來(lái)探索一下如何使用它,你可以決定它是否對(duì)你有幫助。讓我們開始吧!

          安裝

          安裝Bamboolib很簡(jiǎn)單。我在這個(gè)博客中介紹了不同的安裝方法,展示了如何在安裝Bamboolib之前創(chuàng)建一個(gè)環(huán)境。如果你沒有心情創(chuàng)建一個(gè)新環(huán)境,你可以在你的終端中輸入pipinstall upgrade bamboolib user,它會(huì)工作得很好?,F(xiàn)在你可以通過輸入importbamboolib as bam將它導(dǎo)入到一個(gè)Jupyter Notebook中,我們就可以開始了?,F(xiàn)在,我們需要一個(gè)數(shù)據(jù)集。我將使用All Video Games Sales 數(shù)據(jù)集,因?yàn)樗雌饋?lái)很有趣,但你可以使用任何你喜歡的。下載了數(shù)據(jù)集之后,讓我們導(dǎo)入它,然后我們就可以開始使用Bamboolib了。

          第一步

          還記得我說(shuō)過Bamboolib不需要編碼嗎?我是認(rèn)真的。要將數(shù)據(jù)集導(dǎo)入到您的Jupyter Notebook,鍵入bam,它將顯示一個(gè)UI,您可以在其中單擊三次即可導(dǎo)入數(shù)據(jù)集。

          Type bam > Read CSV file> Navigate to your file > Choose the file name > Open CSV file


          注意,Bamboolib導(dǎo)入了Pandas并為您創(chuàng)建了代碼。是的,整個(gè)項(xiàng)目都是這樣的。

          數(shù)據(jù)準(zhǔn)備

          將字符串更改為datetime

          您加載了數(shù)據(jù),并意識(shí)到日期列是一個(gè)字符串。然后,單擊列類型(列名稱旁邊的小字母),選擇新的數(shù)據(jù)類型和格式,如果需要的話,可以選擇一個(gè)新的名稱,然后單擊執(zhí)行。

          您是否看到單元格中也添加了更多代碼?


          另外,user_review列似乎是一個(gè)對(duì)象。讓我們通過創(chuàng)建一個(gè)整數(shù)來(lái)解決這個(gè)問題。



          記得我說(shuō)過列名旁邊的小字母是列數(shù)據(jù)類型嗎?如果你看旁邊的字母user_review列名,你會(huì)看到一個(gè)作為整數(shù)的f而不是i,即使我改變了數(shù)據(jù)類型為整數(shù)。這是因?yàn)锽amboolib將數(shù)據(jù)類型理解為float,所以它沒有拋出錯(cuò)誤,而是為您修復(fù)了錯(cuò)誤。

          使用不同的數(shù)據(jù)類型和名稱創(chuàng)建新列

          如果您需要一個(gè)具有不同數(shù)據(jù)類型和名稱的新列,而不是更改列的數(shù)據(jù)類型和名稱,該怎么辦?只需單擊列數(shù)據(jù)類型,選擇新的格式和名稱,然后單擊執(zhí)行即可。您將立即在數(shù)據(jù)集中看到新列。

          在下圖中,我選擇了meta_score列,將數(shù)據(jù)類型更改為float,選擇了一個(gè)新名稱,新列就創(chuàng)建了。



          刪除列

          如果您意識(shí)到不需要列,只需在search轉(zhuǎn)換框中搜索下拉,選擇下拉,選擇想要下拉的列,然后單擊執(zhí)行。


          重命名列

          現(xiàn)在您需要重命名列,這是再容易不過的了。只需搜索rename,選擇要重命名的列,寫入新的列名,然后單擊執(zhí)行。您可以選擇任意多的列。


          將一個(gè)字符串分割

          假設(shè)您需要將一列人的名字分成兩列,一列寫名,另一列寫姓。這很容易做到。出于演示的目的,我將游戲名稱分割開來(lái),這并沒有什么意義,但你可以看到它是如何工作的。

          只需在Search轉(zhuǎn)換框中鍵入split,選擇要分割的列、分隔符和你想要的列數(shù)的最大值。Boom!


          由于這只是一個(gè)演示,讓我們刪除額外的列。搜索刪除,選擇要?jiǎng)h除的列,然后單擊“執(zhí)行”。(您可在原文查看動(dòng)圖)

          選擇列

          然后,我們可以選擇只可視化一些列。在這里我將選擇游戲名稱、平臺(tái)和分?jǐn)?shù)。只需在Search轉(zhuǎn)換框中鍵入select,選擇要選擇并執(zhí)行的列。


          在這些步驟的最后,Bamboolib創(chuàng)建了以下代碼,即使沒有安裝Bamboolib,也可以使用這些代碼。很酷,對(duì)吧?

          圖源自作者

          數(shù)據(jù)轉(zhuǎn)換

          過濾數(shù)據(jù)

          如果想要篩選數(shù)據(jù)集或創(chuàng)建一個(gè)帶有篩選信息的新數(shù)據(jù)集,可以在search轉(zhuǎn)換中搜索filter,選擇想要篩選的內(nèi)容,決定是否要?jiǎng)?chuàng)建新數(shù)據(jù)集,然后單擊execute。這么簡(jiǎn)單!


          合并數(shù)據(jù)

          如果您需要合并兩個(gè)數(shù)據(jù)集,只需搜索合并,選擇要合并的兩個(gè)數(shù)據(jù)集、連接的類型,和要用于合并數(shù)據(jù)集的關(guān)鍵列,然后單擊執(zhí)行。您可以創(chuàng)建一個(gè)新的數(shù)據(jù)集或僅僅編輯當(dāng)前的數(shù)據(jù)集。


          提取datetime屬性


          如果您想從日期列中提取一個(gè)字符串,比如星期和月份,您知道代碼嗎,還是必須谷歌一下?有了BambooLib,這兩種都不需要。只需搜索extract datatime屬性,選擇日期列,并選擇要提取的內(nèi)容。


          有多個(gè)選項(xiàng)供您選擇。我必須承認(rèn),我不知道如何做到這一點(diǎn),或者使用“Pandas”是否有可能做到這一點(diǎn)……我剛剛學(xué)到了一些新東西。



          分組

          使用group by是你可以用Pandas做的最有價(jià)值的事情之一。然而,它有時(shí)會(huì)變得非常復(fù)雜。幸運(yùn)的是,Bamboolib可以通過非常直觀和簡(jiǎn)單的方式制作群組。在Search轉(zhuǎn)換框中搜索分組by,選擇要分組的列,然后選擇要查看的計(jì)算。

          在這個(gè)例子中,我希望看到每個(gè)平臺(tái)上的游戲數(shù)量和平均分?jǐn)?shù)。我發(fā)現(xiàn)PlayStation 4在所有平臺(tái)中得分最低。(您可在原文查看動(dòng)圖)


          數(shù)據(jù)可視化

          Bamboolib是一個(gè)創(chuàng)建快速數(shù)據(jù)可視化的偉大工具。例如,要?jiǎng)?chuàng)建直方圖,單擊create plot,選擇圖形類型、x軸,就差不多了。您只需點(diǎn)擊四次就創(chuàng)建了一個(gè)漂亮的圖表。()

          或者你可以創(chuàng)建一個(gè)箱形圖。過程是非常相似的。很簡(jiǎn)單!

          有許多其他類型的圖表可供探索,但所有游戲數(shù)據(jù)集并不是創(chuàng)造圖表的最佳選擇。不過,您可以使用其他數(shù)據(jù)集以測(cè)試此功能。有很多東西需要探索。

          數(shù)據(jù)探索

          Bamboolib使數(shù)據(jù)探索超級(jí)簡(jiǎn)單。您可以從Bamboolib中獲得靈感,Bamboolib使得數(shù)據(jù)探索變得超級(jí)簡(jiǎn)單。僅僅通過點(diǎn)擊,您就可以從您的數(shù)據(jù)集得到靈感。這很容易實(shí)現(xiàn):?jiǎn)螕鬍xplore DataFrame,它將返回一些信息,如具有平均值、中位數(shù)、四分位數(shù)、標(biāo)準(zhǔn)偏差、觀測(cè)值數(shù)量、缺失值、正負(fù)觀測(cè)值的數(shù)量等統(tǒng)計(jì)信息。它還創(chuàng)建了圖表,以便您能夠理解數(shù)據(jù)分布。如果數(shù)據(jù)集中有DateTime數(shù)據(jù)類型,它還可以創(chuàng)建圖表,顯示數(shù)據(jù)在一段時(shí)間內(nèi)如何更改。因此,與其浪費(fèi)時(shí)間創(chuàng)建單獨(dú)的圖表來(lái)理解數(shù)據(jù)集,還不如使用這個(gè)功能來(lái)了解數(shù)據(jù)集。(您可在原文查看動(dòng)圖)


          結(jié)束語(yǔ)

          唷!我現(xiàn)在很滿意,因?yàn)槲医o予了這個(gè)庫(kù)應(yīng)得的關(guān)注。是的,我知道這不是第一個(gè)關(guān)于Bamboolib的博客,但我想談?wù)勎业目捶ā_€有很多東西需要探索。

          Bamboolib有很大的潛力來(lái)改變我們分析數(shù)據(jù)的方式和我們學(xué)習(xí)的方式。我已經(jīng)用Pandas好幾年了,我學(xué)到了用Bamboolib可以做的新東西。感謝閱讀,下一篇博客見。

          原文標(biāo)題:
          Bamboolib:One of the Most Useful Python Libraries You Have Ever Seen
          原文鏈接:
          https://towardsdatascience.com/bamboolib-one-of-the-most-useful-python-libraries-you-have-ever-seen-6ce331685bb7


          編輯:王菁

          校對(duì):林亦霖



          譯者簡(jiǎn)介







          王可汗,清華大學(xué)機(jī)械工程系直博生在讀。曾經(jīng)有著物理專業(yè)的知識(shí)背景,研究生期間對(duì)數(shù)據(jù)科學(xué)產(chǎn)生濃厚興趣,對(duì)機(jī)器學(xué)習(xí)AI充滿好奇。期待著在科研道路上,人工智能與機(jī)械工程、計(jì)算物理碰撞出別樣的火花。希望結(jié)交朋友分享更多數(shù)據(jù)科學(xué)的故事,用數(shù)據(jù)科學(xué)的思維看待世界。

          翻譯組招募信息

          工作內(nèi)容:需要一顆細(xì)致的心,將選取好的外文文章翻譯成流暢的中文。如果你是數(shù)據(jù)科學(xué)/統(tǒng)計(jì)學(xué)/計(jì)算機(jī)類的留學(xué)生,或在海外從事相關(guān)工作,或?qū)ψ约和庹Z(yǔ)水平有信心的朋友歡迎加入翻譯小組。

          你能得到:定期的翻譯培訓(xùn)提高志愿者的翻譯水平,提高對(duì)于數(shù)據(jù)科學(xué)前沿的認(rèn)知,海外的朋友可以和國(guó)內(nèi)技術(shù)應(yīng)用發(fā)展保持聯(lián)系,THU數(shù)據(jù)派產(chǎn)學(xué)研的背景為志愿者帶來(lái)好的發(fā)展機(jī)遇。

          其他福利:來(lái)自于名企的數(shù)據(jù)科學(xué)工作者,北大清華以及海外等名校學(xué)生他們都將成為你在翻譯小組的伙伴。


          點(diǎn)擊文末“閱讀原文”加入數(shù)據(jù)派團(tuán)隊(duì)~



          轉(zhuǎn)載須知

          如需轉(zhuǎn)載,請(qǐng)?jiān)陂_篇顯著位置注明作者和出處(轉(zhuǎn)自:數(shù)據(jù)派ID:DatapiTHU),并在文章結(jié)尾放置數(shù)據(jù)派醒目二維碼。有原創(chuàng)標(biāo)識(shí)文章,請(qǐng)發(fā)送【文章名稱-待授權(quán)公眾號(hào)名稱及ID】至聯(lián)系郵箱,申請(qǐng)白名單授權(quán)并按要求編輯。

          發(fā)布后請(qǐng)將鏈接反饋至聯(lián)系郵箱(見下方)。未經(jīng)許可的轉(zhuǎn)載以及改編者,我們將依法追究其法律責(zé)任。



          點(diǎn)擊“閱讀原文”查看原文



          瀏覽 49
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  含羞草91| h片网在线观看 | 国产中文字幕网站 | 欧美有码视频 | 开心激情站中文字幕 |