又一個(gè)Jupyter神器,操作Excel自動(dòng)生成Python代碼!
↑↑↑關(guān)注后"星標(biāo)"簡(jiǎn)說Python
人人都可以簡(jiǎn)單入門Python、爬蟲、數(shù)據(jù)分析 簡(jiǎn)說Python推薦 來源:Python數(shù)據(jù)科學(xué) 作者:東哥起飛

大家好,我是老表。
Jupyter對(duì)于表的處理真的是越來越方便了,很多庫(kù)可以直接實(shí)現(xiàn)可視化操作,無需寫代碼。但是這還不夠,最近看到一個(gè)神器叫Mito,它真的是做到了無需寫一行代碼,而且手動(dòng)的操作可以自動(dòng)轉(zhuǎn)換為代碼,供后續(xù)批量化操作,這簡(jiǎn)直不要太爽。一、Mito是什么?
Mito是Jupyter notebook的一個(gè)插件,作用是編輯電子表格,并在編輯表格(帶格式轉(zhuǎn)換功能)時(shí),可以生成相對(duì)應(yīng)的Python代碼。
Mito和使用Excel表格沒什么太大區(qū)別,只需要掌握一些Mito的自定義函數(shù)即可,然后它會(huì)自動(dòng)生成pandas處理表的代碼。二、Mito 安裝
Mito的安裝要求比較簡(jiǎn)單,有兩個(gè):
Python 3.6或更高版本 需要安裝了Node
打開終端,直接pip安裝:
pip install mitosheet然后,安裝JupyterLab擴(kuò)展管理器。這個(gè)命令可能需要運(yùn)行個(gè)幾分鐘:
jupyter labextension install @jupyter-widgets/jupyterlab-manager@2最后,啟動(dòng)JupyterLab就完事了。
jupyter lab也可以用conda安裝到一個(gè)虛擬環(huán)境里。
三、Mito 操作方法
創(chuàng)建一個(gè)表
import mitosheet
mitosheet.sheet()導(dǎo)入數(shù)據(jù)
pandas讀入數(shù)據(jù)生成dataframe給mitosheet。如果不想寫代碼,也可以手動(dòng)點(diǎn)導(dǎo)入按鈕導(dǎo)入數(shù)據(jù),導(dǎo)入數(shù)據(jù)代碼會(huì)自動(dòng)生成。# import Python packages
import mitosheet
import pandas as pd
# Create a simple dataframe to display
car_data = pd.DataFrame({'car': ['Toyota', 'Nissan', 'Honda', 'Mini Cooper', 'Saturn'], 'mph': [60, 50, 60, 75, 90], 'length': [10, 12, 13, 8, 9]})
# render the Mitosheet with car_data
mitosheet.sheet(car_data)操作方法
Excel一樣,一般的兩種方法。sum、sumif這種等等。公式法其實(shí)就是個(gè)孰能生巧的事。我看了下,Mito中的函數(shù)不復(fù)雜,使用很容易上手。Mito也提供了分析工具,比如合并、透視表、篩選、排序、保存分析等部分功能,都是點(diǎn)點(diǎn)點(diǎn)的操作。Mito的合并功能可用于將數(shù)據(jù)集水平組合在一起。通過查找兩個(gè)表關(guān)鍵列的匹配項(xiàng),然后將這些匹配項(xiàng)數(shù)據(jù)組合到一行中。
數(shù)據(jù)透視表

篩選
過濾器是單個(gè)條件,對(duì)于該列中的每個(gè)單元格,其評(píng)估結(jié)果為true或false。 過濾器組是結(jié)合了布爾運(yùn)算符的過濾器聚合。

排序

保存分析

四、后話
Mito的背后原理,這里不過多介紹,如果感興趣可以參考這篇博客:Mito的創(chuàng)作者是三位來自賓大的學(xué)霸 Aaron Diamond-Reivich、Jake Diamond-Reivich和Nate Rush,他們是在搞數(shù)據(jù)分析的時(shí)候,萌生了想要制作Mito的想法。文末推薦一本《Python數(shù)據(jù)科學(xué)實(shí)踐》,本書是由狗熊會(huì)推出的一本利用Python介紹數(shù)據(jù)科學(xué)基本過程的著作。本書以Python語言為基礎(chǔ),介紹利用Python進(jìn)行數(shù)據(jù)科學(xué)研究與商業(yè)分析的全貌。其核心的設(shè)計(jì)理念是通過經(jīng)典的商業(yè)應(yīng)用案例對(duì)數(shù)據(jù)爬取、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)建模的核心Python模塊做相應(yīng)的介紹。??????

掃下方二維碼添加我的私人微信,可以在我的朋友圈獲取最新的Python學(xué)習(xí)資料,以及近期推文中的源碼或者其他資源,另外不定期開放學(xué)習(xí)交流群,以及朋友圈福利(送書、紅包、學(xué)習(xí)資源等)。
掃碼查看我朋友圈
獲取最新學(xué)習(xí)資源
學(xué)習(xí)更多: 整理了我開始分享學(xué)習(xí)筆記到現(xiàn)在超過250篇優(yōu)質(zhì)文章,涵蓋數(shù)據(jù)分析、爬蟲、機(jī)器學(xué)習(xí)等方面,別再說不知道該從哪開始,實(shí)戰(zhàn)哪里找了
“點(diǎn)贊”傳統(tǒng)美德不能丟 
評(píng)論
圖片
表情
