<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          牛逼,網(wǎng)頁轉(zhuǎn)PDF,就用這個工具

          共 2356字,需瀏覽 5分鐘

           ·

          2020-12-28 08:43

          將網(wǎng)頁轉(zhuǎn)換為pdf之前用過wkhtmltopdf這個工具,對應(yīng)的python庫是pdfkit,但是最終轉(zhuǎn)換出來的效果總是不盡如意。

          最近發(fā)現(xiàn)一個新的庫 WeasyPrint , 經(jīng)過一番測試效果非常不錯,無論是從官方網(wǎng)站的介紹還是提供的文檔,看得出作者應(yīng)該是花了不少心思來做這件事。

          最重要的是,安裝簡單,使用方便。不像pdfkit調(diào)用的都是wkhtmltopdf提供的指令,而 WeasyPrint 是一個原生的Python項目,所以特別適合做Python定制開發(fā),當(dāng)然,它也需要依賴其它第三方庫。

          安裝

          WeasyPrint 能在 Linux, macOS and Windows 多平臺支持,因為WeasyPrint需要依賴cairo, Pango 和 GDK-PixBuf ,所以這些軟件需要獨立安裝,而 WeasyPrint 可以直接通過pip安裝。

          Mac

          brew install python3 cairo pango gdk-pixbuf libffi

          Window

          Windows的安裝要稍微麻煩些, 主要是安裝 GTK+ 這個庫,下載地址:https://github.com/tschoonj/GTK-for-Windows-Runtime-Environment-Installer/releases/download/2020-11-22/gtk3-runtime-3.24.23-2020-11-22-ts-win64.exe

          安裝WeasyPrint

          pip install WeasyPrint

          不出意外的話,你現(xiàn)在就可以使用WeasyPrint這個工具了。執(zhí)行weasyprint命令, 指定要轉(zhuǎn)換的url地址和pdf文件名即可。

          我們隨便指定一個URL地址,這里以我的博客為例

          weasyprint https://foofish.net/base64.html  base64.pdf

          最后生成的效果圖


          這就完了嗎?

          肯定不是,如果只是單純的轉(zhuǎn)換一個網(wǎng)頁,直接用瀏覽器的打印功能,然后另存為PDF就可以了。沒必要繞個這么大的彎子來做這件事。

          我們之所以用它來做PDF轉(zhuǎn)換肯定是希望它能夠為我們實現(xiàn)自動化、批量化、個性化的任務(wù)。

          構(gòu)建HTML對象

          生成PDF文件前,首先需要構(gòu)建一個HTML對象,HTML對象可以通過url鏈接、文件路徑,或者是HTML文檔字符串指定

          from weasyprint import HTML

          HTML(filename='../foo.html')

          HTML(url='http://weasyprint.org')

          HTML(string='''

          The title


          Content goes here
          ''')

          生成pdf文件只需要調(diào)用html對象的write_pdf方法

          一個最簡單的例子:

          from weasyprint import HTML
          HTML('https://foofish.net/base64.html').write_pdf('base64.pdf')

          在轉(zhuǎn)換的時候,你還可以自定義樣式

          from weasyprint import HTML, CSS
          HTML('https://foofish.net/base64.html').write_pdf('base64.pdf',
          stylesheets=[CSS(string='body { font-family: serif !important }')])

          當(dāng)然不僅可以生成PDF,也可以生成PNG圖片, 只需要調(diào)用 html.write_png(“filename.png”)。

          Document對象

          此外,HTML對象的render()方法返回一個document對象,通過docuemnt對象可以拿到所有頁碼(page)數(shù)據(jù),這樣你就可以獲取指定頁的數(shù)據(jù)來生成PDF或者將多個HTML的document對象合并成一個PDF文件。

          例如,將每頁單獨生成一張圖片

          html1 = HTML("https://foofish.net/base64.html")
          document = html1.render()
          for i, page in enumerate(document.pages):
          document.copy([page]).write_png('page_%s.png' % i)

          例如:將兩個鏈接整個生成一個PDF文件


          html1 = HTML("https://foofish.net/base64.html")
          html2 = HTML("https://foofish.net/python-wsgi.html")
          pages = []
          pages.extend(html1.render().pages)
          pages.extend(html2.render().pages)
          HTML(string="").render().copy(pages).write_pdf("foofish.pdf")



          回復(fù)關(guān)鍵字“簡明python ”,立即獲取入門必備書籍簡明python教程》電子版

          回復(fù)關(guān)鍵字爬蟲”,立即獲取爬蟲學(xué)習(xí)資料

          python入門與進階
          每天與你一起成長

          推薦閱讀


          點贊和在看就是最大的支持??


          瀏覽 69
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  天天性综合 | 久久黄色免费看 | 强开小嫩苞A片黑人 | 大香蕉久操 | 欧美精品AAAAAA片 |