如何用Python快速優(yōu)雅的批量修改Word文檔樣式?

一、前言
大家好,又到了辦公自動化系列!
之前講過很多基于Excel的數(shù)據(jù)及樣式調(diào)整案例,今天分享一個Python操作Word的真實(shí)自動化需求實(shí)現(xiàn)過程:
「使用Python批量修改Word樣式」
主要將涉及
os模塊綜合應(yīng)用glob模塊綜合應(yīng)用docx模塊讀寫Word文檔及樣式修改
二、需求描述
手上現(xiàn)有若干份財(cái)務(wù)分析報(bào)告的Word文檔,如下:
每一份Word文檔中的內(nèi)容如下:
為了方便后續(xù)審閱,需要將所有文檔中所有含有資金的語句標(biāo)紅加粗,如圖所示
三、步驟分析和前置知識
為了解決這個需求簡單復(fù)習(xí)一下相關(guān)知識。Word文檔一般而言由文檔(document) - 段落(paragraph) - 文字塊(run) 三級結(jié)構(gòu)組成:
從需求反饋中可以看出,本質(zhì)上我們需要做的就是對所有含有資金的文字塊Run進(jìn)行樣式調(diào)整
因此,本需求的邏輯如下:
1.創(chuàng)建一個空文件夾(用于存放修改后的財(cái)務(wù)報(bào)告,避免直接對原文件修改) 2.通過 glob獲取目標(biāo)文件夾下的所有Word路徑3.利用 docx模塊對每個Word文檔遍歷,并獲取包含特定詞的文字塊4.對文字塊進(jìn)行樣式修改
四、代碼實(shí)現(xiàn)
首先導(dǎo)入需要的庫并設(shè)置目標(biāo)文件夾路徑
from?docx?import?Document
from?docx.shared?import?RGBColor,?Pt,?Cm
import?os
import?glob
#?此處更換創(chuàng)建文件夾的路徑
mkdir_path?=?r'C:\Users\xxx\new_dir'
#?此處更換所有文件所在的位置
file_path?=?r'C:\Users\xxx\'
os和glob我們都很熟悉,這里簡單介紹一下docx模塊
這是一個非標(biāo)準(zhǔn)庫,在命令行中我們需要輸入以下命令安裝:
pip?install?python-docx
尤其要注意安裝時候輸入的是python-docx,而實(shí)際調(diào)用時為docx
實(shí)例化具體的Word文檔代碼為:
from?docx?import?Document
wordfile?=?Document(path)
如果不指定路徑則為創(chuàng)建新的Word文檔,這點(diǎn)跟操作Excel的openpyxl不太一樣,有機(jī)會再做介紹。
現(xiàn)在我們建立文件夾存放新生成的文件,首先判斷文件夾是否存在,不存在時再運(yùn)行os.mkdir避免報(bào)錯
if?not?os.path.exists(mkdir_path):
????os.mkdir(mkdir_path)
接著遍歷Word文檔,利用glob模塊的通配符,框架如下:
for?file?in?glob.glob(file_path?+?'/*.docx'):
????pass
根據(jù)三級結(jié)構(gòu),一個文檔Document有一個或多個段落Paragragh,一個段落Paragraph有一個或多個文字塊Run,合起來代碼為:
for?file?in?glob.glob(file_path?+?'/*.docx'):
????docx?=?Document(file)
????for?paragraph?in?docx.paragraphs:
????????for?run?in?paragraph.runs:
????????????pass
最后我們針對特定詞修改樣式,遍歷到文字塊后就可以做判斷了
????????...
????????for?run?in?paragraph.runs:
????????????if?'資金'?in?run.text:
????????????????run.font.bold?=?True?#?加粗
????????????????run.font.color.rgb?=?RGBColor(255,?0,?255)?#?設(shè)置字體顏色
????????#?最后切記保存
????????docx.save(mkdir_path?+?'/'?+?os.path.basename(file))
當(dāng)然,除了修改字體顏色和加粗之外,還支持其他樣式的設(shè)置,以下列出常用的作為參考:
#?加粗
run.font.bold?=?True
#?斜體
run.font.italic?=?True
#?下劃線
run.font.underline?=?True
#?刪除線
run.font.strike?=?True
#?字號
run.font.size?=?Pt(20)
#?陰影
run.font.shadow?=?True
#?字體顏色
run.font.color.rgb?=?RGBColor(255,?0,?255)
至此,整個需求就順利結(jié)束了,附上完整代碼:
from?docx?import?Document
from?docx.shared?import?RGBColor,?Pt,?Cm
import?os
import?glob
mkdir_path?=?r'C:\xxx\new_dir)'
if?not?os.path.exists(mkdir_path):
????os.mkdir(mkdir_path)
keyword?=?'資金'
file_path?=?r'C:\Users\xxx'
for?file?in?glob.glob(file_path?+?'\*.docx'):
????docx?=?Document(file)
????for?paragraph?in?docx.paragraphs:
????????for?run?in?paragraph.runs:
????????????if?keyword?in?run.text:
????????????????run.font.bold?=?True
????????????????run.font.color.rgb?=?RGBColor(255,?0,?0)
????docx.save(mkdir_path?+?'/'?+?os.path.basename(file))
五、寫在最后
通過本文的Python自動化腳本制作過程,我們可以再次體會Python辦公自動化的強(qiáng)大!如果對自動化代碼和數(shù)據(jù)感興趣可以在后臺回復(fù)自動化獲取。
當(dāng)然除了調(diào)整Word字體顏色,其他的大多數(shù)樣式調(diào)整都可以使用Python完成,也可以與Excel和PPT結(jié)合,這些就留給讀者自己開發(fā)。
最后還是希望大家能夠理解Python辦公自動化的一個核心就是批量操作-解放雙手,讓復(fù)雜的工作自動化!
今天的文章就到這里,原創(chuàng)不易,如果喜歡的話請給我一波三連支持吧(在看、轉(zhuǎn)發(fā)、留言)

wen
mo
song
shu
今天的自動化案例學(xué)會了嗎?文末推薦一本書Python自動化測試實(shí)戰(zhàn)(本書從自動化測試?yán)碚撊胧郑娴仃U述自動化測試的意義及實(shí)施過程。全文以Python語言驅(qū)動,結(jié)合真實(shí)案例分別對主流自動化測試工具Selenium、Python+Requests、Appium等進(jìn)行系統(tǒng)講解。通過學(xué)習(xí)本書,讀者可以快速掌握主流自動化測試技術(shù),并幫助讀者豐富測試思維,提高Python編碼能力)點(diǎn)擊下方圖片可以直達(dá)購買界面查看與購買,現(xiàn)在京東和當(dāng)當(dāng)均有100-50活動!


