【Python基礎(chǔ)】一文搞定pandas的數(shù)據(jù)合并
??作者:來(lái)源于讀者投稿
出品:Python數(shù)據(jù)之道
一文搞定pandas的數(shù)據(jù)合并
merge
append
join
concat

為方便大家練習(xí),文末提供了本文源代碼的獲取方式。
文章目錄

導(dǎo)入庫(kù)
import pandas as pd
import numpy as np
—??01?—
merge
官方參數(shù)
merge函數(shù)的參數(shù)如下:
DataFrame.merge(left, right,
how='inner', # {‘left’, ‘right’, ‘outer’, ‘inner’}, default ‘inner’
on=None,
left_on=None, right_on=None,
sort=False,
suffixes=('_x', '_y'))
模擬數(shù)據(jù)


使用默認(rèn)參數(shù)

參數(shù)how
how參數(shù)的取值有4種:inner(默認(rèn))
outer
right
left




參數(shù)on
用于連接的列索引列名,必須同時(shí)存在于左右的兩個(gè)dataframe型數(shù)據(jù)中,類(lèi)似SQL中兩個(gè)表的相同字段屬性 如果沒(méi)有指定或者其他參數(shù)也沒(méi)有指定,則以?xún)蓚€(gè)dataframe型數(shù)據(jù)的相同鍵作為連接鍵
on參數(shù)為單個(gè)字段



on參數(shù)為多個(gè)字段-列表形式


參數(shù)lefton/righton

參數(shù)suffixes
_x,_y,可以自己指定

參數(shù)sort


—??02?—
concat
官方參數(shù)
concat方法是將兩個(gè)?DataFrame數(shù)據(jù)框中的數(shù)據(jù)進(jìn)行合并通過(guò)axis參數(shù)指定是在行還是列方向上合并
參數(shù)?
ignore_index實(shí)現(xiàn)合并后的索引重排

生成數(shù)據(jù)

指定合并軸

改變索引

join參數(shù)



sort-屬性排序


—??03?—
append
官方參數(shù)

基本使用
data3.append(data4) # 等同于pd.append([data3, data4]) 忽略pandas版本的警告

改變索引-自然數(shù)排序
data3.append(data4, ignore_index=True) # 設(shè)置參數(shù)

sort=True-屬性的排序
data3.append(data4) # 默認(rèn)對(duì)字段屬性排序

—??04?—
join
官方參數(shù)

通過(guò)相同索引合并


相同字段屬性指后綴


相同字段變成索引index

相同字段保留一次

往期精彩回顧
獲取一折本站知識(shí)星球優(yōu)惠券,復(fù)制鏈接直接打開(kāi):
https://t.zsxq.com/662nyZF
本站qq群704220115。
加入微信群請(qǐng)掃碼進(jìn)群(如果是博士或者準(zhǔn)備讀博士請(qǐng)說(shuō)明):
