又一個(gè)Jupyter神器,操作Excel自動生成Python代碼!
點(diǎn)擊關(guān)注上方“SQL數(shù)據(jù)庫開發(fā)”,
設(shè)為“置頂或星標(biāo)”,第一時(shí)間送達(dá)干貨
Jupyter對于表的處理真的是越來越方便了,很多庫可以直接實(shí)現(xiàn)可視化操作,無需寫代碼。但是這還不夠,最近看到一個(gè)神器叫Mito,它真的是做到了無需寫一行代碼,而且手動的操作可以自動轉(zhuǎn)換為代碼,供后續(xù)批量化操作,這簡直不要太爽。一、Mito是什么?
Mito是Jupyter notebook的一個(gè)插件,作用是編輯電子表格,并在編輯表格(帶格式轉(zhuǎn)換功能)時(shí),可以生成相對應(yīng)的Python代碼。
Mito和使用Excel表格沒什么太大區(qū)別,只需要掌握一些Mito的自定義函數(shù)即可,然后它會自動生成pandas處理表的代碼。二、Mito 安裝
Mito的安裝要求比較簡單,有兩個(gè):
Python 3.6或更高版本 需要安裝了Node
打開終端,直接pip安裝:
pip install mitosheet然后,安裝JupyterLab擴(kuò)展管理器。這個(gè)命令可能需要運(yùn)行個(gè)幾分鐘:
jupyter labextension install @jupyter-widgets/jupyterlab-manager@2最后,啟動JupyterLab就完事了。
jupyter lab也可以用conda安裝到一個(gè)虛擬環(huán)境里。
三、Mito 操作方法
創(chuàng)建一個(gè)表
import mitosheet
mitosheet.sheet()導(dǎo)入數(shù)據(jù)
pandas讀入數(shù)據(jù)生成dataframe給mitosheet。如果不想寫代碼,也可以手動點(diǎn)導(dǎo)入按鈕導(dǎo)入數(shù)據(jù),導(dǎo)入數(shù)據(jù)代碼會自動生成。# import Python packages
import mitosheet
import pandas as pd
# Create a simple dataframe to display
car_data = pd.DataFrame({'car': ['Toyota', 'Nissan', 'Honda', 'Mini Cooper', 'Saturn'], 'mph': [60, 50, 60, 75, 90], 'length': [10, 12, 13, 8, 9]})
# render the Mitosheet with car_data
mitosheet.sheet(car_data)操作方法
Excel一樣,一般的兩種方法。sum、sumif這種等等。公式法其實(shí)就是個(gè)孰能生巧的事。我看了下,Mito中的函數(shù)不復(fù)雜,使用很容易上手。Mito也提供了分析工具,比如合并、透視表、篩選、排序、保存分析等部分功能,都是點(diǎn)點(diǎn)點(diǎn)的操作。Mito的合并功能可用于將數(shù)據(jù)集水平組合在一起。通過查找兩個(gè)表關(guān)鍵列的匹配項(xiàng),然后將這些匹配項(xiàng)數(shù)據(jù)組合到一行中。
數(shù)據(jù)透視表

篩選
過濾器是單個(gè)條件,對于該列中的每個(gè)單元格,其評估結(jié)果為true或false。 過濾器組是結(jié)合了布爾運(yùn)算符的過濾器聚合。

排序

保存分析

四、后話
Mito的背后原理,這里不過多介紹,如果感興趣可以參考這篇博客:Mito的創(chuàng)作者是三位來自賓大的學(xué)霸 Aaron Diamond-Reivich、Jake Diamond-Reivich和Nate Rush,他們是在搞數(shù)據(jù)分析的時(shí)候,萌生了想要制作Mito的想法。
推薦閱讀
后臺回復(fù)關(guān)鍵字:1024,獲取一份精心整理的技術(shù)干貨
后臺回復(fù)關(guān)鍵字:進(jìn)群,帶你進(jìn)入高手如云的交流群
評論
圖片
表情
