ocrstyle圖片識(shí)別文字
Optical Character Recognition
背景
本程序最初是想用于發(fā)票識(shí)別的,目前可以通過ocrengine和imageprocess動(dòng)態(tài)庫(kù)進(jìn)行二次開發(fā)。
功能
- 圖片識(shí)別文字的軟件。
- 支持截圖。
- 支持選擇識(shí)別的區(qū)域。
- 支持選擇識(shí)別的語言。
- 支持傾斜糾正。
- 支持保存識(shí)別的文字。
- 支持多種語言的識(shí)別,內(nèi)置了中文和英文,可以根據(jù)需要下載其它語言。
編譯環(huán)境
- ocrstyle 使用的Qt4.8開發(fā)的。
- ocrengine 使用Visual C++ Express 2008開發(fā)的。這個(gè)工程依賴third-party目錄下的Tesseract OCR開發(fā)庫(kù),目前是google維護(hù)的,當(dāng)時(shí)開發(fā)的時(shí)候官方只有VC2008的開發(fā)庫(kù),于是就用的VC2008開發(fā)了。項(xiàng)目地址:http://code.google.com/p/tesseract-ocr/。
- imageprocess 使用的Visual C++ Express 2010開發(fā)的。這個(gè)工程依賴于OpenCV。項(xiàng)目地址:http://opencv.org/
- buildscripts/ocrstyle.nsi 打包安裝包使用的NSIS。
動(dòng)態(tài)庫(kù)的接口
- ImageProcessAPI.h 主要功能:圖像的加載、灰度處理、傾斜校正、保存等。
- OCREngine.h 主要功能:配置識(shí)別的語言、傳入要識(shí)別的圖像數(shù)據(jù)、獲得文本。
思路
- 掃描的電子發(fā)票一般都有點(diǎn)傾斜,所以要對(duì)圖片進(jìn)行傾斜校正。為了方便識(shí)別需要進(jìn)行灰度處理。
- 一般是要識(shí)別發(fā)票上的部分內(nèi)容,所以要想辦法把要識(shí)別的文本區(qū)域的圖像數(shù)據(jù)傳給Tesseract OCR,然后獲得文本。
評(píng)論
圖片
表情
