可能是全網(wǎng)最完整的 Python 操作 Excel庫總結(jié)!
設(shè)為“置頂或星標(biāo)”,第一時間送達(dá)干貨
在之前的辦公自動化系列文章中,我已經(jīng)對Python操作Excel的幾個常用庫openpyxl、xlrd/xlwt、xlwings、xlsxwriter等進(jìn)行了詳細(xì)的講解。
為了進(jìn)一步帶大家了解各個庫的異同,從而在不同場景下可以靈活使用,本文將橫向比較7個可以操作 Excel 文件的常用模塊,在比較各模塊常用操作的同時進(jìn)行鞏固學(xué)習(xí)!
首先讓我們來整體把握下不同庫的特點
“”
xlrd、xlwt、xlutils各自的功能都有局限性,但三者互為補(bǔ)充,覆蓋了Excel文件尤其是.xls文件的操作。xlwt可以生成.xls文件,xlrd可以讀取已經(jīng)存在的.xls文件,xlutils連接xlrd和xlwt兩個模塊,使用戶可以同時讀寫一個.xls文件。簡單來說,xlrd負(fù)責(zé)讀、xlwt負(fù)責(zé)寫、xlutils負(fù)責(zé)提供輔助和銜接xlwings能夠非常方便的讀寫 Excel 文件中的數(shù)據(jù),并且能夠進(jìn)行單元格格式的修改XlsxWriter是一個用來寫.xlsx文件格式的模塊。它可以用來寫文本、數(shù)字、公式并支持單元格格式化、圖片、圖表、文檔配置、自動過濾等特性。但不能用來讀取和修改 Excel 文件openpyxl通過 工作簿 “workbook - 工作表 sheet - 單元格 cell” 的模式對.xlsx文件進(jìn)行讀、寫、改,并且可以調(diào)整樣式pandas大家都不陌生,是進(jìn)行數(shù)據(jù)處理和分析的強(qiáng)大模塊,有時也可以用來自動化處理Excel
如果你懶得看詳細(xì)的對比過程,可以直接看最后的總結(jié)圖,然后拉到文末收藏點贊就算學(xué)會了

一、安裝
7個模塊均為非標(biāo)準(zhǔn)庫,因此都需要在命令行中 pip 進(jìn)行安裝:
pip install xlrd
pip install xlwt
pip install xlutils
pip install xlwings
pip install XlsxWriter
pip install openpyxl
pip install pandas
二、模塊導(dǎo)入
多數(shù)模塊可以直接通過名字導(dǎo)入,有些模塊約定俗稱會使用縮寫:
import xlrd
import xlwt
import xlwings as xw
import xlsxwriter
import openpyxl
import pandas as pd
xlutils 模塊是 xlrd 和 xlwt 之間的橋梁,最核心的作用是拷貝一份通過 xlrd 讀取到內(nèi)存中的 .xls 對象,然后再拷貝對象上通過 xlwt 修改 .xls 表格的內(nèi)容。xlutils 可以將 xlrd 的 Book 對象復(fù)制轉(zhuǎn)換為 xlwt 的Workbook 對象,具體使用時通常導(dǎo)入的是模塊中的 copy 子模塊:
import xlutils.copy
三、讀取 Excel 文件
3.1 獲取文件
并不是所有7個模塊都可以讀取 Excel 文件,而即使能讀取Excel文件也要分不同后綴名進(jìn)行討論,具體如下:
“”
xlwt、xlutils、XlsxWriter不能讀取文件xlrd可以讀取.xls和.xlsx文件xlwings可以讀取.xls和.xlsx文件openpyxl可以讀取.xlsx文件pandas可以讀取.xls和.xlsx文件
下面使用兩個大小均為 10MB 的 .xls 和 .xlsx 文件進(jìn)行測試:
xls_path = r'C:\xxx\Desktop\test.xls'
xlsx_path = r'C:\xxx\Desktop\test.xlsx'
3.1.1 xlrd 讀取文件
xlrd 可以讀取 .xls 和 .xlsx 文件
xls = xlrd.open_workbook(xls_path)
xlsx = xlrd.open_workbook(xlsx_path)
3.1.2 xlwings 讀取文件
xlwings 直接對接的是 apps,也就是 Excel 應(yīng)用程序,然后才是工作簿 books 和工作表 sheets,xlwings 需要安裝有 Excel 應(yīng)用程序的環(huán)境xlwings 可以讀取 .xls 和 .xlsx 文件
app = xw.App(visible=True, add_book=False) # 程序可見,只打開不新建工作薄
app.display_alerts = False # 警告關(guān)閉
app.screen_updating = False # 屏幕更新關(guān)閉
# wb = app.books.open(xls_path)
wb = app.books.open(xlsx_path)
wb.save() # 保存文件
wb.close() # 關(guān)閉文件
app.quit() # 關(guān)閉程序
3.1.3 openpyxl 讀取文件
openpyxl 可以讀取 .xlsx 文件
wb = openpyxl.load_workbook(xlsx_path)
如果讀取 .xls 文件會報錯:
wb = openpyxl.load_workbook(xls_path)
openpyxl.utils.exceptions.InvalidFileException: openpyxl does not support the old .xls file format, please use xlrd to read this file, or convert it to the more recent .xlsx file format.
3.1.4 pandas 讀取文件
pandas 可以讀取 .xls 和 .xlsx 文件
xls = pd.read_excel(xls_path, sheet_name='Sheet1')
xlsx = pd.read_excel(xlsx_path, sheet_name='Sheet1')
接下來比較四個模塊在同一配置電腦下讀取 10MB .xlsx 文件的時間(運行3次求平均值),所用代碼為:
import time
import xxx
time_start = time.time()
xxx
time_end = time.time()
print('time cost: ', time_end-time_start, 's')
最后測試的結(jié)果是,xlwings 讀取 10MB 文件最快,xlrd 次之,openpyxl 最慢(因電腦而異,結(jié)果僅供參考)
讀入 Excel 文件部分的表格總結(jié)如下:
3.2 獲取工作表
針對上述4個可以讀取 Excel 文件的模塊,進(jìn)一步討論其獲取工作表 sheet 的方式
3.2.1 xlrd 獲取工作表
可以通過 sheet 名查找:
sheet = xlsx.sheet_by_name("Sheet1")
也可通過索引查找:
sheet = xlsx.sheet_by_index(0)
3.2.2 xlwings 獲取工作表
xlwings 的工作表分為活動工作表以及指定工作簿下的特定工作表:
sheet = xw.sheets.active # 在活動工作簿
sheet = wb.sheets.active # 在特定工作簿
3.2.3 openpyxl 獲取工作表
.active 方法默認(rèn)獲取工作簿的第一張工作表
sheet = wb.active
另外也可以通過工作表名指定獲取工作表:
sheet = wb['Sheet1']
3.2.4 pandas 獲取工作表
單獨獲取工作表完全沒有 pandas 什么事情,因為讀取文件的同時已經(jīng)且必須指定工作表才能讀取:
xlsx = pd.read_excel(xlsx_path, sheet_name='Sheet1')
四、創(chuàng)建 Excel 文件
簡單總結(jié)創(chuàng)建 Excel 文件的情況:
“”
xlrd、xlutils不能創(chuàng)建 Excel 文件xlwt只能創(chuàng)建.xls文件,不能創(chuàng)建.xlsx文件xlwings可以創(chuàng)建.xls和.xlsx文件XlsxWriter可以創(chuàng)建.xlsx文件openpyxl可以創(chuàng)建.xls和.xlsx文件pandas沒有創(chuàng)建 Excel 的概念,但可以存儲時產(chǎn)生.xls或.xlsx文件
4.1 xlwt 創(chuàng)建文件
xlwt 只能創(chuàng)建 .xls 文件,不能創(chuàng)建 .xlsx 文件
xls = xlwt.Workbook(encoding= 'ascii')
# 創(chuàng)建新的sheet表
worksheet = xls.add_sheet("Sheet1")
4.2 xlwings 創(chuàng)建文件
xlwings可以創(chuàng)建 .xls 和 .xlsx 文件,只需要最后保存時寫清楚后綴即可。使用如下命令:
wb = app.books.add()
無論是新建還是打開都需要保存工作簿、關(guān)閉工作簿、關(guān)閉程序,即:
wb.save(path + r'\new_practice.xlsx')
wb.close()
app.quit()
4.3. XlsxWriter 創(chuàng)建文件
XlsxWriter 可以創(chuàng)建 .xlsx 文件:
xlsx = xlsxwriter.Workbook()
# 添加工作表
sheet = xlsx .add_worksheet('Sheet1')
4.4 openpyxl 創(chuàng)建文件
openpyxl可以創(chuàng)建 .xls 和 .xlsx 文件,只需要最后保存時寫清楚后綴即可。使用如下命令:
wb = Workbook()
# 新工作簿中指定即創(chuàng)建工作表
sheet = wb.active
4.5. pandas 創(chuàng)建文件
pandas 只需要最后轉(zhuǎn)存時寫清楚后綴即可。實際上比較抽象,pandas 并不需要一開始先創(chuàng)建一個 Excel 文件,可以圍繞數(shù)據(jù)框做各式操作后用 .to_excel 命令再用 .xls 或者 .xlsx 做文件后綴。如果一定要產(chǎn)生一個空白 Excel 文件可以用如下命令:
df = pd.DataFrame([])
df.to_excel(r'C:\xxx\test1.xlsx')
五、保存文件
簡單總結(jié)保存 Excel 文件的情況:
“”
xlrd不能保存 Excel 文件xlwt可以保存.xls文件xlutils可以將xlrd對象復(fù)制為xlwt對象后保存.xls文件xlwings可以保存.xls和.xlsx文件XlsxWriter可以保存.xlsx文件openpyxl可以保存.xlsx文件pandas可以保存.xls或.xlsx文件
5.1 xlwt 保存文件
xlwt 可以保存 .xls 文件
# xls = xlwt.Workbook(encoding= 'ascii')
# worksheet = xls.add_sheet("Sheet1")
xls.save("new_table.xls")
5.2 xlutils 保存文件
xlutils 可以將 xlrd 對象復(fù)制為 xlwt 對象后保存 .xls 文件
# xls_path = r'C:\xxxx\test.xls'
# xls = xlrd.open_workbook(xls_path)
xls_xlutils = xlutils.copy.copy(xls)
xls_xlutils.save('new_text.xls')
5.3 xlwings 保存文件
xlwings可以保存 .xls 和 .xlsx 文件
# wb = app.books.open(xls_path)
wb = app.books.open(xlsx_path)
wb.save() # 保存文件
wb.close() # 關(guān)閉文件
app.quit() # 關(guān)閉程序
5.4 XlsxWriter 保存文件
XlsxWriter 可以保存 .xlsx 文件,.close 命令執(zhí)行后文件關(guān)閉的同時保存:
# xlsx = xlsxwriter.Workbook()
# sheet = xlsx .add_worksheet('Sheet1')
xlsx.close()
5.5 openoyxl 保存文件
openpyxl 可以保存 .xlsx 文件
# wb = openpyxl.load_workbook(xlsx_path)
# wb = Workbook()
# sheet = wb.active
wb.save('new_test.xlsx')
6. pandas 保存文件
pandas 可以保存 .xls 或 .xlsx 文件
df1 = pd.DataFrame([1, 2, 3])
df2 = pd.DataFrame([1, 2, 4])
df1.to_excel(r'C:\xxxx\test1.xls')
df2.to_excel(r'C:\xxxx\test2.xlsx')
六、獲取單元格的值
獲取單元格的值基本前提是能夠讀取文件,因此基本圍繞 xlrd、xlwings、openpyxl、pandas 介紹。xlutils 由于能夠復(fù)制一份 .xls 因此也可以使用和 xlrd 完全一樣的讀取單元格方法。
6.1. xlrd/xlutils 獲取單元格
xlutils 因為是直接拷貝一份 xlrd 適用的對象,讀取單元格使用的方法和 xlrd 完全一樣。xlwt 沒有讀取單元格的能力
# xls = xlrd.open_workbook(xls_path)
# sheet = xlsx.sheet_by_name("Sheet1")
value = sheet.cell_value(4, 6) # 第5行第7列的單元格
print(value)
rows = table.row_values(4)
cols = table.col_values(6)
for cell in rows:
print(cell)
6.2. xlwings 獲取單元格
# app = xw.App(visible=True, add_book=False)
# app.display_alerts = False
# app.screen_updating = False
# wb = app.books.open(xls_path)
# sheet = wb.sheets.active
# 獲取單個單元格的值
A1 = sheet.range('A1').value
print(A1)
# 獲取橫向或縱向多個單元格的值,返回列表
A1_A3 = sheet.range('A1:A3').value
print(A1_A3)
# 獲取給定范圍內(nèi)多個單元格的值,返回嵌套列表,按行為列表
A1_C4 = sheet.range('A1:C4').value
print(A1_C4)
# 獲取單個單元格的值
A1 = sheet.range('A1').value
print(A1)
# 獲取橫向或縱向多個單元格的值,返回列表
A1_A3 = sheet.range('A1:A3').value
print(A1_A3)
# 獲取給定范圍內(nèi)多個單元格的值,返回嵌套列表,按行為列表
A1_C4 = sheet.range('A1:C4').value
print(A1_C4)
6.3 openpyxl 獲取單元格
# wb = openpyxl.load_workbook(xlsx_path)
# wb = Workbook()
# sheet = wb.active
# 一、指定坐標(biāo)范圍的值
cells = sheet['A1:B5']
# 二、指定列的值
cells = sheet['A']
cells = sheet['A:C']
# 三、指定行的值
cells = sheet[5]
cells = sheet[5:7]
# 獲取單元格的值
for cell in cells:
print(cell.value)
6.4 pandas 獲取單元格的值
pandas 讀取 Excel 文件后即將它轉(zhuǎn)換為數(shù)據(jù)框?qū)ο螅馕鰞?nèi)容的方法基本是 pandas 體系中的知識點,如 .iloc() .loc() .ix() 等:
print(df1.iloc[0:1, [1]])
print(df1.loc['b'])
print(df2.ix['a', 'a']) # 有些版本取消了ix,可以用iat
七、寫入數(shù)據(jù)
還是先簡單總結(jié)對 Excel 文件寫入數(shù)據(jù)的情況:
“”
xlrd不能寫入數(shù)據(jù)xlwt可以寫入數(shù)據(jù)xlutils可以借用xlwt方法寫入數(shù)據(jù)xlwings可以寫入數(shù)據(jù)XlsxWriter可以寫入數(shù)據(jù)openpyxl可以寫入數(shù)據(jù)pandas將 Excel 文件讀取為數(shù)據(jù)框后,是抽象出數(shù)據(jù)框?qū)用孢M(jìn)行操作,沒有了對 Excel 進(jìn)行單元格寫入和修改的概念
7.1. xlwt/xlutils 寫入數(shù)據(jù)
# xls = xlrd.open_workbook(xls_path)
# xls_xlutils = xlutils.copy.copy(xls)
# sheet = xls_xlutils.sheet_by_name("Sheet1")
# value = sheet.cell_value(4, 6)
# print(value)
sheet.write(4, 6, "新內(nèi)容")
7.2 xlwings 寫入數(shù)據(jù)
# app = xw.App(visible=True, add_book=False)
# app.display_alerts = False
# app.screen_updating = False
# wb = app.books.open(xls_path)
# sheet = wb.sheets.active
# 寫入 1 個單元格
sheet.range('A2').value = '大明'
# 一行或一列寫入多個單元格
# 橫向?qū)懭階1:C1
sheet.range('A1').value = [1,2,3]
# 縱向?qū)懭階1:A3
sheet.range('A1').options(transpose=True).value = [1,2,3]
# 寫入范圍內(nèi)多個單元格
sheet.range('A1').options(expand='table').value = [[1,2,3], [4,5,6]]
7.3 XlsxWriter 寫入數(shù)據(jù)
代碼中的 new_format 是之前預(yù)設(shè)好的樣式,下文會進(jìn)行介紹
# xlsx = xlsxwriter.Workbook()
# sheet = xlsx .add_worksheet('Sheet1')
# 一、寫入單個單元格
sheet.write(row, col, data, new_format)
# A1:從A1單元格開始插入數(shù)據(jù),按行插入
sheet.write_row('A1', data, new_format)
# A1:從A1單元格開始插入數(shù)據(jù),按列插入
sheet.write_column('A1', data, new_format)
7.4. openpyxl 寫入數(shù)據(jù)
# wb = openpyxl.load_workbook(xlsx_path)
# wb = Workbook()
# sheet = wb.active
# 一、寫入單元格
cell = sheet['A1']
cell.value = '業(yè)務(wù)需求'
# 二、寫入一行或多行數(shù)據(jù)
data1 = [1, 2, 3]
sheet.append(data1)
data2 = [[1, 2, 3], [4, 5, 6]]
sheet.append(data2)
八、樣式調(diào)整
依舊簡單總結(jié)對 Excel 文件樣式調(diào)整的情況:
“”
xlrd、xlutils不能調(diào)整樣式 (也可以說xlutils可以,只不過是借用了xlwt的方法)xlwt可以調(diào)整樣式xlwings可以調(diào)整樣式XlsxWriter可以調(diào)整樣式openpyxl可以調(diào)整樣式pandas不能調(diào)整樣式
8.1 xlwt 調(diào)整樣式
xlwt 支持調(diào)整字體、邊框、顏色等樣式
# 字體部分
# 初始化樣式
style1 = xlwt.XFStyle()
# 為樣式創(chuàng)建字體
font = xlwt.Font()
font.name = 'Times New Roman' #字體
font.bold = True #加粗
font.underline = True #下劃線
font.italic = True #斜體
# 設(shè)置樣式
style1.font = font
# 使用樣式
sheet.write(4, 6, "新內(nèi)容1", style1)
# 邊框部分
borders = xlwt.Borders()
# 設(shè)置線型
borders.left = xlwt.Borders.DASHED
borders.right = xlwt.Borders.DASHED
borders.top = xlwt.Borders.DASHED
borders.bottom = xlwt.Borders.DASHED
# 設(shè)置樣色
borders.left_colour = 0x40
borders.right_colour = 0x40
borders.top_colour = 0x40
borders.bottom_colour = 0x40
#
style2 = xlwt.XFStyle()
style2.borders = borders
# 使用樣式
sheet.write(5, 8, "新內(nèi)容2", style2)
8.2 xlwings 調(diào)整樣式
簡單介紹 xlwings 對顏色的調(diào)整:
# 獲取顏色
print(sheet.range('C1').color)
# 設(shè)置顏色
sheet.range('C1').color = (255, 0, 120)
# 清除顏色
sheet.range('C1').color = None
8.3 XlsxWriter 調(diào)整樣式
XlsxWriter 包含大量功能,可以創(chuàng)建工作表后對工作表進(jìn)行高定自定義的樣式修改:
new_format = xlsx.add_format({
'bold': True, # 字體加粗
'border': 1, # 單元格邊框?qū)挾?/span>
'align': 'left', # 水平對齊方式
'valign': 'vcenter', # 垂直對齊方式
'fg_color': '#F4B084', # 單元格背景顏色
'text_wrap': True # 是否自動換行
})
sheet.write(row, col, data, new_format)
8.4 openpyxl 調(diào)整樣式
openpyxl 樣式主要包括字體、邊框、段落對齊樣式等
# 字體樣式
from openpyxl.styles import Font
cell = sheet['A1']
font = Font(name='Arial', size=12, bold=True, italic=True, color='FF0000')
cell.font = font
# 段落對齊
from openpyxl.styles import Alignment
cell = sheet['B2']
alignment = Alignment(horizontal='center', vertical='center', text_rotation=45, wrap_text=True)
cell.alignment = alignment
# 邊框樣式
from openpyxl.styles import Side, Border
cell = sheet['B2']
side1 = Side(style='thin', color='FF0000')
side2 = Side(style='dashed')
border = Border(left=side1, right=side1, top=side2, bottom=side2)
cell.border = border
九、插入圖片
簡單總結(jié)對 Excel 文件插入圖片的情況:
“”
xlrd、xlutils不能調(diào)整樣式 (也可以說xlutils可以,只不過是借用了xlwt的方法)xlwt可以插入.bmp圖片xlwings可以插入 圖片XlsxWriter可以插入圖片openpyxl可以插入圖片pandas不能插入圖片
9.1 xlwt 插入圖片
xlwt 插入圖片要求圖片格式必須是 .bmp 格式才能插入成功
sheet.insert_bitmap("test.bmp", 2, 3, 2, 2, 0.5, 0.5)
insert_bitmap(img, x, y, x1, y1, scale_x, scale_y)img 表示要插入的圖像地址,x 表示行,y 表示列x1 y1 表示相對原來位置向下向右偏移的像素scale_x scale_y表示相對原圖寬高的比例,圖片可放大縮小
9.2 xlwings 插入圖片
下面是用xlwings 插入圖片的代碼,可以指定位置
sheet.pictures.add(r'C:\\xxx.jpg')
# 也可以給定位置插入
sheet.pictures.add(r'C:\\xxx.jpg', left=sheet.range('A2').left, top=sheet.range('A2').top, width=100, height=100)
9.3 XlsxWriter 插入圖片
第一個參數(shù)是插入的起始單元格,第二個參數(shù)是圖片文件的絕對路徑
sheet.insert_image('A1', r'C:\\xxx.jpg')
9.4 openpyxl 插入圖片
openpyxl也可以給Excel中插入指定圖片并修改大小
from openpyxl.drawing.image import Image
img = Image('test.jpg')
newsize = (180, 360)
img.width, img.height = newsize # 設(shè)置圖片的寬和高
sheet.add_image(img, 'A2') # 往A2單元格插入圖片
小結(jié)
以上就是根據(jù)不同 Python 模塊,對常見的 Excel 操作進(jìn)行對比的全部內(nèi)容,最終結(jié)果匯總?cè)缦卤硭?/p>

請注意,本文目的并不是要評出一個最好的庫,僅是從不同角度對不同庫進(jìn)行對比,希望能夠讓大家了解各個庫所擅長的工作。比如pandas雖然處理方便,但是不能添加圖片修改樣式,openpyxl雖然各種操作都支持,但是速度又相對慢一點等。
只有充分了解不同工具的特點,才能夠在不同的場景下靈活運用不同的方法來高效解決問題!如果喜歡本文的話,希望你可以給本文點個贊來支持早起創(chuàng)作!
最后給大家分享我寫的SQL兩件套:《SQL基礎(chǔ)知識第二版》和《SQL高級知識第二版》的PDF電子版。里面有各個語法的解釋、大量的實例講解和批注等等,非常通俗易懂,方便大家跟著一起來實操。
有需要的讀者可以下載學(xué)習(xí),在下面的公眾號「數(shù)據(jù)前線」(非本號)后臺回復(fù)關(guān)鍵字:SQL,就行
數(shù)據(jù)前線
后臺回復(fù)關(guān)鍵字:1024,獲取一份精心整理的技術(shù)干貨
后臺回復(fù)關(guān)鍵字:進(jìn)群,帶你進(jìn)入高手如云的交流群

