<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          宅男福利!我50行Python代碼讓小姐姐給你讀Pdf

          共 1377字,需瀏覽 3分鐘

           ·

          2020-12-20 08:11

          最近小編忙著給項(xiàng)目做文檔,需要閱讀大量的文獻(xiàn)資料,長(zhǎng)時(shí)間的閱讀讓本就不喜歡看書的我是又困又乏,所以想著,要是能有小姐姐在旁邊讀給我聽該有多好。


          說干就干,小編整理了一下思路,晚上熬夜花了幾個(gè)小時(shí)就完成了整個(gè)小程序,一起來跟小編學(xué)習(xí)一下吧。



          01

          代碼的構(gòu)思


          要完成該任務(wù)的設(shè)計(jì),首先我們需要明確思路,整體的設(shè)計(jì)方案如下圖所示:

          上圖中,我們首先需要實(shí)現(xiàn)的是將PDF文章中,我們想要提取的文字提取出來,然后再將提取的文本內(nèi)容,通過小姐姐文本朗讀轉(zhuǎn)化為MP3文件,保存到本地當(dāng)中。明確思路之后,接下來我們就來看一下程序是如何實(shí)現(xiàn)的吧。



          02

          文字提取


          對(duì)于PDF文檔中文字的提取,這里我們采用的是pdfplumber庫(kù)進(jìn)行提取,pdfplumber可以處理PDF中,包括文本、表格、格式在內(nèi)的各種信息,小巧但是功能十分的強(qiáng)大。


          但是需要注意版本的使用,這里我們使用的python3.5環(huán)境下的版本號(hào)為0.5.25的pdfplumber。對(duì)于文本的提取,其程序如下所示:

          上述的程序中,我們首先打開pdf文件,并返回一個(gè)pdf的類對(duì)象,然后根據(jù)指定的pages數(shù)據(jù),來提取指定頁(yè)碼的文本信息。我們來運(yùn)行一下程序,看一下提取的結(jié)果如何吧。

          上述的紅框中,左側(cè)的是程序提取的結(jié)果,而右側(cè)是PDF的文本,通過提取的結(jié)果來看,pdfplumber能夠準(zhǔn)確的提取出PDF中的文本信息。



          03

          文本轉(zhuǎn)語(yǔ)音


          提取到文本信息之后,接下來就是將文本信息,轉(zhuǎn)化為語(yǔ)音信息,并保存到本地,這里,小編采用了兩種方式進(jìn)行實(shí)現(xiàn),第一種方式采用的是pyttsx3庫(kù)進(jìn)行轉(zhuǎn)換,而另一種方式采用的則是百度AI進(jìn)行實(shí)現(xiàn)。程序如下所示:

          程序首先采用判斷的方式,如果形參baidu == True,則采用百度AI,否則就采用pyttsx3庫(kù)。


          對(duì)于百度AI的調(diào)用,想必大家都非常的熟悉,大家需要到百度的AI開發(fā)者平臺(tái),進(jìn)行接口的申請(qǐng),然后通過申請(qǐng)的信息來進(jìn)行百度AI接口的調(diào)用。

          對(duì)于pyttsx3庫(kù),首先需要初始化語(yǔ)音引擎,然后設(shè)置語(yǔ)音的聲音類型、語(yǔ)速和音量的信息。就可以進(jìn)行引擎的調(diào)用。


          結(jié)果展示

          以上就是對(duì)于程序部分的講解,下面小編通過視頻展示的方式來看一下程序的運(yùn)行效果。


          最后來聽一下小姐姐閱讀pdf,是什么感覺!有點(diǎn)酥麻!



          以上的內(nèi)容就是小編今天為大家?guī)淼姆窒?,通過這樣的處理,小編可以解放雙眼,直接”聽文檔“,大家也趕快下載程序,一起學(xué)習(xí)起來吧!





          需要本篇的源碼,后臺(tái)輸入:pdf
          也可以添加小助手微信小助手獲得技術(shù)支持,暗號(hào):pdf


          菜鳥小助手


          推薦閱讀:


          這個(gè)GitHub 1400星的Git魔法書火了,斯坦福校友出品丨有中文版
          賊 TM 好用的 Java 工具類庫(kù)
          超全Python IDE武器庫(kù)大總結(jié),優(yōu)缺點(diǎn)一目了然!
          秋招來襲!GitHub28.5顆星!這個(gè)匯聚阿里,騰訊,百度,美團(tuán),頭條的面試題庫(kù)必須安利!
          收獲10400顆星!這個(gè)Python庫(kù)有點(diǎn)黑科技,竟然可以偽造很多'假'的數(shù)據(jù)!
          牛掰了!這個(gè)Python庫(kù)有點(diǎn)逆天了,竟然能把圖片,視頻無損清晰放大!


          點(diǎn)這里,獲取一大波福利

          瀏覽 52
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产精品国产成人国产三级 | 人妻无码精品蜜桃HD | 天天射天天操天天透人妻 | 很很日2012中文在线免费 | 性爱插入毛片免费视频 |