pandas 1.3版本主要更新內(nèi)容一覽

添加微信號(hào)"CNFeffery"加入技術(shù)交流群
?本文示例代碼及文件已上傳至我的
?Github倉(cāng)庫https://github.com/CNFeffery/DataScienceStudyNotes
1 簡(jiǎn)介
就在幾天前,pandas發(fā)布了其1.3版本,在這次新的版本中添加了諸多實(shí)用的新特性,今天的文章我們就一起來get其中主要的一些內(nèi)容更新~

2 pandas 1.3主要更新內(nèi)容一覽
使用pip install pandas==1.3.0 -U -i https://pypi.douban.com/simple/安裝1.3版本后,下面我們來看看新的版本給我們帶來了哪些新特性:
2.1 新增對(duì)xml文件的讀寫操作
在這次新版本中新增了對(duì)xml格式數(shù)據(jù)進(jìn)行解析讀寫的功能,對(duì)此有特殊需求的朋友可以前往https://pandas.pydata.org/docs/user_guide/io.html#xml詳細(xì)了解:


2.2 Styler可使用原生css語法
很多朋友都知道pandas中可以配合Styler對(duì)數(shù)據(jù)框進(jìn)行自定義樣式輸出,其中最自由的是通過Styler.set_table_styles()來自定義css樣式,以前的方式需要將一條css屬性寫到二元組中傳入,在1.3版本中可以直接傳入css字符串,比如下面我們通過設(shè)置hover偽類樣式,來修改每一行鼠標(biāo)懸停時(shí)的樣式:

2.3 center參數(shù)在時(shí)間日期index的數(shù)據(jù)框rolling操作中可用
在先前的版本中,如果針對(duì)行索引為時(shí)間日期型的數(shù)據(jù)框進(jìn)行rolling滑窗操作使用center參數(shù)將每行記錄作為窗口中心時(shí)會(huì)報(bào)錯(cuò):

而在1.3中這個(gè)問題終于得到解決~方便了許多時(shí)序數(shù)據(jù)分析時(shí)的操作:

2.4 sample()隨機(jī)抽樣新增ignore_index參數(shù)
我們都知道在pandas中可以使用sample()方法對(duì)數(shù)據(jù)框進(jìn)行各種放回/不放回抽樣,但以前版本中抽完樣的數(shù)據(jù)框每行記錄還保持著先前的行索引,使得我們還得多一步reset_index()操作,而在1.3中,新增類似sort_values()和drop_duplicates()中的同名參數(shù)ignore_index:

2.5 explode()新增多列操作支持
當(dāng)數(shù)據(jù)框中某些字段某些位置元素為列表、元組等數(shù)據(jù)結(jié)構(gòu)時(shí),我們可以使用explode()方法來基于這些序列型元素進(jìn)行展開擴(kuò)充,但在以前的版本中每次explode()操作只支持對(duì)單個(gè)字段的展開,如果數(shù)據(jù)中多個(gè)字段之間同一行對(duì)應(yīng)序列型元素位置是一一對(duì)應(yīng)的,需要展開后也是一一對(duì)應(yīng)的,操作起來就比較棘手。
而1.3版本中直接對(duì)多字段同步explode()進(jìn)行了支持:

2.6 append模式下寫出多工作表excel文件的新策略
在1.3版本中,針對(duì)mode='a'模式下向外寫出多工作表excel文件,新增了參數(shù)if_sheet_exists來設(shè)定新工作表與已存在工作表重名時(shí)的處理策略,默認(rèn)為'error'即直接拋出錯(cuò)誤,'new'則會(huì)自動(dòng)修改工作表名,'replace'則會(huì)覆蓋原同名工作表:

2.7 結(jié)合SQL讀取數(shù)據(jù)庫表時(shí)可直接設(shè)置類型轉(zhuǎn)換
在1.3版本中,我們?cè)谑褂?code style="margin-right: 2px;margin-left: 2px;padding: 2px 4px;font-size: 14px;overflow-wrap: break-word;border-radius: 4px;background-color: rgba(27, 31, 35, 0.05);font-family: "Operator Mono", Consolas, Monaco, Menlo, monospace;word-break: break-all;">read_sql_query()結(jié)合SQL查詢數(shù)據(jù)庫時(shí),新增了參數(shù)dtype可以像在其他API中那樣一步到位轉(zhuǎn)換查詢到的數(shù)據(jù):

以上就是本文的全部?jī)?nèi)容,歡迎在評(píng)論區(qū)與我進(jìn)行討論~

加入知識(shí)星球【我們談?wù)摂?shù)據(jù)科學(xué)】
400+小伙伴一起學(xué)習(xí)!
· 推薦閱讀 ·
在模仿中精進(jìn)數(shù)據(jù)可視化09:近期基金漲幅排行可視化
使用Matplotlib & Cartopy繪制我國(guó)臺(tái)風(fēng)路徑圖
