陀飛輪
0獲贊0關(guān)注0粉絲
OCR文字識別—基于CTC/Attention/ACE的三大解碼算法
歡迎關(guān)注Smarter,構(gòu)建CV世界觀
本文全面梳理一下OCR文字識別三種解碼算法,先介紹一下什么是OCR文字識別,然后介紹一下常用的特征提取方法CRNN,最后介紹3種常用的解碼算法CTC/Attention/ACE。
什么是OCR文字識別?
一般來說,文字識別之前需要先對文字進(jìn)行定位(文字檢測主要有基于物體檢測和基于分割兩種方法),文字識別就是通過輸入文字圖片,然后解碼成文字的方法。本文主要講文字識別部分,文字識別主要分成三種類型:單字分類、整詞分類和整詞識別。當(dāng)能夠定位出單字時,可以用圖像分類的方法直接對單字進(jìn)行分類;當(dāng)需要預(yù)測整詞數(shù)量較少時,可以對整詞進(jìn)行分類;當(dāng)有大量整詞需要預(yù)測并且沒有單字定位時,就需要用解碼序列的
陀飛輪
0
