<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          用 Python 開發(fā)了一個 PDF 抽取表格的小工具

          共 564字,需瀏覽 2分鐘

           ·

          2022-06-21 11:03

          大家好哇
          從 PDF 里 copy 表格時,粘貼出來后格式都是錯亂的。這麻煩事交給 Python 再合適不過,所以,我開發(fā)了一個從 PDF 抽取表格另存為 Excel 文件的應(yīng)用,已把它部署到 huggingface ,同學(xué)可以直接去感受一下:

          https://huggingface.co/spaces/beihai/PDF-Table-Extractor

          使用方法

          準(zhǔn)備一個PDF(暫不支持掃描版)


          頁面中上傳PDF,也不支持200M以上的文件,如果太大,大家可以先去壓縮一下,我記得adobe官網(wǎng)有就類似小工具。


          上傳完成后,選擇表格所在PDF的頁碼,等待片刻就會出現(xiàn)“提取完成,點擊下載”


          下載Excel,格式還需要微調(diào),不過比直接復(fù)制出來的要好很多了,能節(jié)省一些時間。


          目前這個工具還在完善,比如直接抽取PDF中所有表格,敬請期待。

          實現(xiàn)方法周末再公布吧,其實經(jīng)常看我文章的同學(xué)應(yīng)該都很熟悉了吧。之前在騰訊的這個算法,我搬到了網(wǎng)上,隨便玩!一文中有介紹。

          本文代碼能在huggingface看到,其實也是剛剛調(diào)試好,覺得有用,期待三連。

          推薦閱讀

          我逃到國企了

          再也不接私活了

          Kaggle出了一本競賽書(500頁)

          機器學(xué)習(xí)基礎(chǔ):用 Lasso 做特征選

          機器學(xué)習(xí)自動補全代(hán)碼(shù)神器

          瀏覽 53
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲第一黄色视频 | 人人草,人人摸 | 欧美色图日韩 | 肏屄视频免费看 | 豆花视频在线观看观看 |