天若OCR圖片文字自動(dòng)識(shí)別
共 845字,需瀏覽 2分鐘
·
2022-02-09 17:37
OCR概念
OCR(Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備檢查紙上打印的字符,通過檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程。
說(shuō)白了就是識(shí)別圖片上的文字,然后提取出來(lái),變成可編輯的文檔。
天若OCR文字識(shí)別
這款OCR有官方提供免費(fèi)、專業(yè)收費(fèi)兩個(gè)版本提供給用戶使用,
win版本
但是由于官網(wǎng)免費(fèi)版不能自定義接口,所以在這里建議用開源版,下面就介紹下開源版的天若OCR。
開源版-天若OCR
天若OCR文字識(shí)別開源版是吾愛破解論壇的 @shelher 基于 @天若幽心 開源的代碼 進(jìn)行完善制作而成
天若OCR開源版5.0.0 下載地址:https://github.com/AnyListen/tianruoocr/releases/tag/V5.0.0
開源版默認(rèn)有以下OCR接口:
- 搜狗OCR接口:這個(gè)接口識(shí)別效果很好,速度、準(zhǔn)確率都沒的說(shuō)!也是作者重點(diǎn)推薦的,但其對(duì)圖片的尺寸有規(guī)定,所以作者已對(duì)軟件截圖進(jìn)行了尺寸優(yōu)化,保證較小的文字也能識(shí)別。
- 百度OCR接口:其識(shí)別的精確度還可以,但是標(biāo)點(diǎn)符號(hào)識(shí)別不太準(zhǔn)確,速度一般。
- 騰訊OCR接口:也是比較準(zhǔn)確的,但速度比較慢。
- 有道OCR接口:速度很快,平均 0.3-0.4 秒就可識(shí)別出來(lái),但是接口有 IP 請(qǐng)求的限制。
天若OC配置百度COR接口
天若OCR最近會(huì)出現(xiàn)該區(qū)域未發(fā)現(xiàn)文本問題,是因?yàn)樽髡咛峁┑陌俣冉涌谶^度使用導(dǎo)致的,這里需要將作者的接口改成自己的百度接口,解決方法如下:
- 登入百度智能云,找到“文字識(shí)別”
- 按照下圖進(jìn)行OCR應(yīng)用創(chuàng)建,默認(rèn)文字識(shí)別全選,默認(rèn)設(shè)置就行
- 創(chuàng)建完畢,查看剛才的應(yīng)用,可以看到創(chuàng)建的API Key和Secret Key
- 將自己的API Key和Secret Key 分別填入天若OCR軟件的帳號(hào)和密碼中,點(diǎn)擊密鑰測(cè)試,顯示密鑰通過。
- 關(guān)鍵的一步,用F4截屏識(shí)別后,還會(huì)出現(xiàn)該區(qū)域未發(fā)現(xiàn)文本,在識(shí)別界面“右擊”-接口(默認(rèn)騰訊)-百度-中英再次截屏識(shí)別,正常。
