国产精品久久久久久久久久久易记,黄色以及电影毛片,黄片aaa,国产精品尤物,小黄片免费观看,蜜桃91在线,成人av三区,欧美一级在线视频

用 Python 開發(fā)了一個 PDF 抽取表格的小工具

大家好哇
從 PDF 里 copy 表格時，粘貼出來后格式都是錯亂的。這麻煩事交給 Python 再合適不過，所以，我開發(fā)了一個從 PDF 抽取表格另存為 Excel 文件的應(yīng)用，已把它部署到 huggingface ,同學(xué)可以直接去感受一下：

https://huggingface.co/spaces/beihai/PDF-Table-Extractor

使用方法

準(zhǔn)備一個PDF（暫不支持掃描版）

頁面中上傳PDF，也不支持200M以上的文件，如果太大，大家可以先去壓縮一下，我記得adobe官網(wǎng)有就類似小工具。

上傳完成后，選擇表格所在PDF的頁碼，等待片刻就會出現(xiàn)“提取完成，點擊下載”

下載Excel，格式還需要微調(diào)，不過比直接復(fù)制出來的要好很多了，能節(jié)省一些時間。

目前這個工具還在完善，比如直接抽取PDF中所有表格，敬請期待。

實現(xiàn)方法周末再公布吧，其實經(jīng)常看我文章的同學(xué)應(yīng)該都很熟悉了吧。之前在騰訊的這個算法，我搬到了網(wǎng)上，隨便玩！一文中有介紹。

本文代碼能在huggingface看到，其實也是剛剛調(diào)試好，覺得有用，期待三連。


推薦閱讀
我逃到國企了
再也不接私活了
Kaggle出了一本競賽書（500頁）
機器學(xué)習(xí)基礎(chǔ)：用 Lasso 做特征選
機器學(xué)習(xí)自動補全代(hán)碼(shù)神器

點贊

舉報