器視覺算法之光學(xué)字符識別(OCR)
光學(xué)字符識別(OCR)
在非常多的應(yīng)用中都需要將檢測對象上印刷的字符識別出來。例如,產(chǎn)品的可追溯性經(jīng)常需要在每個產(chǎn)品上貼上一個序列號,因此我們必須讀取這個序列號。在其他某些應(yīng)用中,可能必須通過讀取序列號來控制生產(chǎn)流程。
光學(xué)字符識別(OCR)是在圖像中 識別字符的過程。它包含兩個任務(wù):將圖像中單個字符分割出來以及將分割得到的字符進行分類,也就是說為分割得到的區(qū)域分配一個符號標(biāo)記。
01
字符分割
將字符進行分類需要我們首先將文本分割成為單個的字符,也就是說每個字符必須對應(yīng)于一個區(qū)域。
為了分割字符,我們可以使用這個方法:使用固定 的閾值或自動選擇的閾值進行閾值分割、動態(tài)閾值分割以及提取圖像中連通區(qū)域。
使用形態(tài)學(xué)方法將同一個字符分離的部分連接起來,例如將字符“i” 的小圓點與下面的部分連接起來。
最簡單的策略是為圖像中每個預(yù)期的字符定義一個單獨的感興趣區(qū)域 (ROI)。工業(yè)應(yīng)用中有時可以使用這種策略,這是由于字體間距(寬度)固定,并且我們事先已經(jīng)知道圖像中多少個字符,例如在我們試圖在圖像中讀取一個固定長度的序列號時就可以使用這種策略。就是字符的感興趣區(qū)域(ROI)必須將需要分離的單個字符包含在內(nèi)。
02
特征提取
03
字符分類
轉(zhuǎn)自:CSDN 作者:超級大洋蔥806
End 
聲明:部分內(nèi)容來源于網(wǎng)絡(luò),僅供讀者學(xué)術(shù)交流之目的。文章版權(quán)歸原作者所有。如有不妥,請聯(lián)系刪除。




