圖像中的文字識別算法研究論文?
共 612字,需瀏覽 2分鐘
·
2022-02-09 17:41
以前做過一點類似的工作,不知道對你是否有幫助,你姑且參考一下:
1.OCR其實是很古老的一個技術(shù)了,我理解的OCR是印刷文本中的文字識別,或者手寫體等,目前感覺已經(jīng)沒啥做的,
2.現(xiàn)在學(xué)術(shù)界研究得比較多的是自然場景中的文字識別,如街道上的廣告牌,商場中的店鋪名,在電商場景里面,如淘寶,拼多多等需要對圖片中的文字識別,用于內(nèi)容風(fēng)控等。
3.目前圖像類的算法基本都是要利用卷積神經(jīng)網(wǎng)絡(luò)來做的,所有你只能選深度學(xué)習(xí)來做了;
4.文字識別,與文字檢測是在發(fā)論文的時候,是會區(qū)分的,你要確定你是只做檢測還是做識別,還是兩者都要做;
所以,我理解的你要做的是我說的第2種,在這個方向里面有可以具體細(xì)分,如豎版文字識別,不規(guī)則形狀文字識別等
可以推薦的資料:
- 可以關(guān)注華科的白翔老師的工作:
有論文也有code, 本科生可以先跑起來,再看看原理
2.阿里天池平臺以前有過一個電商圖片的文字檢測,文字識別的比賽,github上應(yīng)該有很多代碼可以參考,
ICPR MTWI 2018 挑戰(zhàn)賽二:網(wǎng)絡(luò)圖像的文本檢測-天池大賽-阿里云天池先簡單寫這么多吧,這都是我2年前的記憶,沒有關(guān)注最新的內(nèi)容,希望對你有幫助(不要臉的讓你點贊,收藏)
20200514新增:
https://github.com/PaddlePaddle/PaddleOCR
評論
圖片
表情
