Vedastr:基于PyTorch的場景文本識別工具箱
加入極市專業(yè)CV交流群,與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度?等名校名企視覺開發(fā)者互動交流!
同時提供每月大咖直播分享、真實項目需求對接、干貨資訊匯總,行業(yè)技術(shù)交流。關(guān)注?極市平臺?公眾號?,回復(fù)?加群,立刻申請入群~
就在明天,極市平臺與重磅邀請到ICML 2020杰出論文一作魏愷軒,為我們深度講解論文相關(guān)工作:免調(diào)試即插即用的近端優(yōu)化算法。請大家鎖定直播時間7月22日(周三)20:00。詳情戳這里,在極市平臺后臺回復(fù)“62”,即可獲取直播鏈接。本次直播由極市平臺和中國圖象圖形學(xué)學(xué)會青年工作委員聯(lián)合組織。
1. Vedastr的特性STR(Scene Text Recognition)的任務(wù)是識別文字框中的內(nèi)容。我們在做關(guān)于STR的項目時發(fā)現(xiàn),相關(guān)開源的toolbox較少,調(diào)研后發(fā)現(xiàn)現(xiàn)有的toolbox存在以下幾個問題:
模塊化程度較低
提供可配置接口較少
更新維護較少
模塊化
易拓展性
配置簡單
較完善的日志系統(tǒng)
及時的更新維護
2. Vedastr的運行方式
2.1 配置文件
optimizer = dict(type='Adam', lr=0.001)lr_scheduler = dict(type='StepLR', max_epochs=3, milestones=[100000, 200000])
2.2 Train、test和demo
Train
python tools/train.py config-pathTest
python tools/test.py config-path checkpoint-pathDemo
python tools/demo.py config-path checkpoint-path img-path3. 預(yù)訓(xùn)練模型
3.1 使用Vedastr復(fù)現(xiàn)的模型性能

TPS-ResNet-BiLSTM-Attention:What Is Wrong With Scene Text Recognition Model Comparisons?
Small-SATRN:On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention
下載 TPS-ResNet-BiLSTM-Attention
下載vedastr,按照Installation進行安裝
激活conda環(huán)境,運行demo文件,識別的結(jié)果就會顯示在你的終端窗口上
python tools/demo.py configs/tps-resnet-bilstm-attention TPS-ResNet-BiLSTM-Attention.pth input-imginput-img:


終端窗口:

Vedastr項目鏈接如下,歡迎使用和star!https://github.com/Media-Smart/vedastr
推薦閱讀
比OCR更強大的PPT圖片一鍵轉(zhuǎn)文檔重建技術(shù)
文字識別方法全面整理
ECCV2020|PlugNet:可插拔的超分辨學(xué)習(xí)單元文本識別,解決低質(zhì)量圖像識別難題
添加極市小助手微信(ID : cv-mart),備注:研究方向-姓名-學(xué)校/公司-城市(如:目標(biāo)檢測-小極-北大-深圳),即可申請加入極市技術(shù)交流群,更有每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、行業(yè)技術(shù)交流,一起來讓思想之光照的更遠吧~
△長按添加極市小助手
△長按關(guān)注極市平臺,獲取最新CV干貨
覺得有用麻煩給個在看啦~??

評論
圖片
表情
