機(jī)器視覺算法之光學(xué)字符識(shí)別(OCR)
技術(shù)來(lái)自于點(diǎn)擊下方卡片,關(guān)注“新機(jī)器視覺”公眾號(hào)
視覺/圖像重磅干貨,第一時(shí)間送達(dá)
光學(xué)字符識(shí)別(OCR)
在非常多的應(yīng)用中都需要將檢測(cè)對(duì)象上印刷的字符識(shí)別出來(lái)。例如,產(chǎn)品的可追溯性經(jīng)常需要在每個(gè)產(chǎn)品上貼上一個(gè)序列號(hào),因此我們必須讀取這個(gè)序列號(hào)。在其他某些應(yīng)用中,可能必須通過讀取序列號(hào)來(lái)控制生產(chǎn)流程。
光學(xué)字符識(shí)別(OCR)是在圖像中 識(shí)別字符的過程。它包含兩個(gè)任務(wù):將圖像中單個(gè)字符分割出來(lái)以及將分割得到的字符進(jìn)行分類,也就是說(shuō)為分割得到的區(qū)域分配一個(gè)符號(hào)標(biāo)記。
字符分割
將字符進(jìn)行分類需要我們首先將文本分割成為單個(gè)的字符,也就是說(shuō)每個(gè)字符必須對(duì)應(yīng)于一個(gè)區(qū)域。
為了分割字符,我們可以使用這個(gè)方法:使用固定 的閾值或自動(dòng)選擇的閾值進(jìn)行閾值分割、動(dòng)態(tài)閾值分割以及提取圖像中連通區(qū)域。
使用形態(tài)學(xué)方法將同一個(gè)字符分離的部分連接起來(lái),例如將字符“i” 的小圓點(diǎn)與下面的部分連接起來(lái)。
最簡(jiǎn)單的策略是為圖像中每個(gè)預(yù)期的字符定義一個(gè)單獨(dú)的感興趣區(qū)域 (ROI)。工業(yè)應(yīng)用中有時(shí)可以使用這種策略,這是由于字體間距(寬度)固定,并且我們事先已經(jīng)知道圖像中多少個(gè)字符,例如在我們?cè)噲D在圖像中讀取一個(gè)固定長(zhǎng)度的序列號(hào)時(shí)就可以使用這種策略。就是字符的感興趣區(qū)域(ROI)必須將需要分離的單個(gè)字符包含在內(nèi)。

特征提取


字符分類


