宅男福利!我50行Python代碼讓小姐姐給你讀Pdf
最近小編忙著給項(xiàng)目做文檔,需要閱讀大量的文獻(xiàn)資料,長(zhǎng)時(shí)間的閱讀讓本就不喜歡看書的我是又困又乏,所以想著,要是能有小姐姐在旁邊讀給我聽該有多好。
說干就干,小編整理了一下思路,晚上熬夜花了幾個(gè)小時(shí)就完成了整個(gè)小程序,一起來跟小編學(xué)習(xí)一下吧。
代碼的構(gòu)思

上圖中,我們首先需要實(shí)現(xiàn)的是將PDF文章中,我們想要提取的文字提取出來,然后再將提取的文本內(nèi)容,通過小姐姐文本朗讀轉(zhuǎn)化為MP3文件,保存到本地當(dāng)中。明確思路之后,接下來我們就來看一下程序是如何實(shí)現(xiàn)的吧。
文字提取
但是需要注意版本的使用,這里我們使用的python3.5環(huán)境下的版本號(hào)為0.5.25的pdfplumber。對(duì)于文本的提取,其程序如下所示:

上述的程序中,我們首先打開pdf文件,并返回一個(gè)pdf的類對(duì)象,然后根據(jù)指定的pages數(shù)據(jù),來提取指定頁(yè)碼的文本信息。我們來運(yùn)行一下程序,看一下提取的結(jié)果如何吧。

上述的紅框中,左側(cè)的是程序提取的結(jié)果,而右側(cè)是PDF的文本,通過提取的結(jié)果來看,pdfplumber能夠準(zhǔn)確的提取出PDF中的文本信息。
文本轉(zhuǎn)語(yǔ)音

程序首先采用判斷的方式,如果形參baidu == True,則采用百度AI,否則就采用pyttsx3庫(kù)。
對(duì)于百度AI的調(diào)用,想必大家都非常的熟悉,大家需要到百度的AI開發(fā)者平臺(tái),進(jìn)行接口的申請(qǐng),然后通過申請(qǐng)的信息來進(jìn)行百度AI接口的調(diào)用。

對(duì)于pyttsx3庫(kù),首先需要初始化語(yǔ)音引擎,然后設(shè)置語(yǔ)音的聲音類型、語(yǔ)速和音量的信息。就可以進(jìn)行引擎的調(diào)用。
結(jié)果展示
以上就是對(duì)于程序部分的講解,下面小編通過視頻展示的方式來看一下程序的運(yùn)行效果。
最后來聽一下小姐姐閱讀pdf,是什么感覺!有點(diǎn)酥麻!
以上的內(nèi)容就是小編今天為大家?guī)淼姆窒?,通過這樣的處理,小編可以解放雙眼,直接”聽文檔“,大家也趕快下載程序,一起學(xué)習(xí)起來吧!
需要本篇的源碼,后臺(tái)輸入:pdf 也可以添加小助手微信小助手獲得技術(shù)支持,暗號(hào):pdf
菜鳥小助手
推薦閱讀:
這個(gè)GitHub 1400星的Git魔法書火了,斯坦福校友出品丨有中文版 賊 TM 好用的 Java 工具類庫(kù) 超全Python IDE武器庫(kù)大總結(jié),優(yōu)缺點(diǎn)一目了然! 秋招來襲!GitHub28.5顆星!這個(gè)匯聚阿里,騰訊,百度,美團(tuán),頭條的面試題庫(kù)必須安利! 收獲10400顆星!這個(gè)Python庫(kù)有點(diǎn)黑科技,竟然可以偽造很多'假'的數(shù)據(jù)! 牛掰了!這個(gè)Python庫(kù)有點(diǎn)逆天了,竟然能把圖片,視頻無損清晰放大!
點(diǎn)這里,獲取一大波福利


