用 Python 開(kāi)發(fā)了一個(gè) PDF 抽取表格的小工具
↑ 關(guān)注 + 星標(biāo) ,每天學(xué)Python新技能
后臺(tái)回復(fù)【大禮包】送你Python自學(xué)大禮包
從 PDF 里 copy 表格時(shí),粘貼出來(lái)后格式都是錯(cuò)亂的。這麻煩事交給 Python 再合適不過(guò),所以,我開(kāi)發(fā)了一個(gè)從 PDF 抽取表格另存為 Excel 文件的應(yīng)用,已把它部署到 huggingface ,同學(xué)可以直接去感受一下:
https://huggingface.co/spaces/beihai/PDF-Table-Extractor
使用方法
準(zhǔn)備一個(gè)PDF(暫不支持掃描版)

頁(yè)面中上傳PDF,也不支持200M以上的文件,如果太大,大家可以先去壓縮一下,我記得adobe官網(wǎng)有就類(lèi)似小工具。

上傳完成后,選擇表格所在PDF的頁(yè)碼,等待片刻就會(huì)出現(xiàn)“提取完成,點(diǎn)擊下載”

下載Excel,格式還需要微調(diào),不過(guò)比直接復(fù)制出來(lái)的要好很多了,能節(jié)省一些時(shí)間。

目前這個(gè)工具還在完善,比如直接抽取PDF中所有表格,敬請(qǐng)期待。
評(píng)論
圖片
表情


