【程序源代碼】python數(shù)據(jù)提取工具
01
—
一款使用 Python 編寫的圖像內(nèi)表格數(shù)據(jù)提取工具,可以高效識別 PDF 原件、掃描件、復(fù)印件、彩色(黑白)照片、截圖內(nèi)的數(shù)據(jù)表格,提取后轉(zhuǎn)為 Excel 文件輸出。這是一款開源工具,我給它取名叫Any2Excel。顧名思義,往后的目標(biāo)就是提取任意格式文件中的數(shù)據(jù)圖表到可被結(jié)構(gòu)化處理的 Excel 文件。識別度高,操作簡單,使用場景廣泛。支持手機(jī)拍照、掃描件、原件、復(fù)印件等等
02
—
使用方法
Python PIP 依賴
pip install -r .\requirements.txt外部依賴
poppler 安裝后將其bin路徑加入系統(tǒng)變量中配置騰訊云
cp config+sample.yml config.yml后補(bǔ)全config.yml中的配置信息
—
源碼
https://gitee.com/itcode-itcode/any-to-excel
—
更多內(nèi)容請關(guān)注視頻號
聯(lián)
方
式
公眾號ID: itcode
視頻號: 程序源代碼
微信ID: itcoder
免
聲
明
—————————————

———————

————————
【你的每一份打賞就是對我最真誠的鼓勵
評論
圖片
表情
