zoro
0獲贊0關(guān)注0粉絲
Python-文字識(shí)別
首先還是要安裝tesseract OCR,即Optical Character Recognition,光學(xué)字符識(shí)別,谷歌開(kāi)發(fā)的,在免費(fèi)庫(kù)中還是非常友好的,應(yīng)用場(chǎng)景比較多,比如在爬取數(shù)據(jù)時(shí)可以識(shí)別驗(yàn)證碼等,我是因?yàn)橛幸淮笈鷴呙栉募枰D(zhuǎn)換成Excel,研究了一下,中間也遇到了很多問(wèn)題,接下來(lái)可以帶大家入個(gè)門(mén)。
第一步需要下載tesseract OCR安裝包(百度網(wǎng)上很多資源,如果搜到CSDN分析的文章里邊的下載地址還是比較靠譜的,如果懶得百度可以后臺(tái)私信無(wú)償發(fā)你),還是注意安裝位置,后邊要設(shè)置環(huán)境變量
第二步下載語(yǔ)言包,可以搜索已經(jīng)訓(xùn)練好的現(xiàn)成的語(yǔ)言包(GitHub官方搜索下載,如果下載不下來(lái)可以百度或者后臺(tái)私信無(wú)償
zoro
0
