<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Vedastr:基于PyTorch的場景文本識別工具箱

          共 1804字,需瀏覽 4分鐘

           ·

          2020-07-21 22:18

          加入極市專業(yè)CV交流群,與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度?等名校名企視覺開發(fā)者互動交流!

          同時提供每月大咖直播分享、真實項目需求對接、干貨資訊匯總,行業(yè)技術(shù)交流。關(guān)注?極市平臺?公眾號?,回復(fù)?加群,立刻申請入群~

          就在明天極市平臺與重磅邀請到ICML 2020杰出論文一作魏愷軒,為我們深度講解論文相關(guān)工作:免調(diào)試即插即用的近端優(yōu)化算法請大家鎖定直播時間7月22日(周三)20:00。詳情戳這里,在極市平臺后臺回復(fù)“62”,即可獲取直播鏈接本次直播由極市平臺和中國圖象圖形學(xué)學(xué)會青年工作委員聯(lián)合組織。

          1. Vedastr的特性
          STR(Scene Text Recognition)的任務(wù)是識別文字框中的內(nèi)容。我們在做關(guān)于STR的項目時發(fā)現(xiàn),相關(guān)開源的toolbox較少,調(diào)研后發(fā)現(xiàn)現(xiàn)有的toolbox存在以下幾個問題:
          1. 模塊化程度較低

          2. 提供可配置接口較少

          3. 更新維護較少


          基于此,我們在調(diào)研了一系列的STR相關(guān)論文的基礎(chǔ)上,構(gòu)建了一個基于PyTorch的STR的toolbox——Vedastr,具有以下幾個特性:


          1. 模塊化

          2. 易拓展性

          3. 配置簡單

          4. 較完善的日志系統(tǒng)

          5. 及時的更新維護


          Vedastr項目鏈接:https://github.com/Media-Smart/vedastr



          2. Vedastr的運行方式
          2.1 配置文件


          Vedastr提供了開放式接口,可以在config文件配置相關(guān)參數(shù)。比如,我們配置optimizer和learning rate scheduler的參數(shù):


          optimizer = dict(type='Adam', lr=0.001)lr_scheduler = dict(type='StepLR', max_epochs=3, milestones=[100000, 200000])

          2.2 Train、test和demo


          • Train

          python tools/train.py config-path


          • Test

          python tools/test.py config-path checkpoint-path

          • Demo

          python tools/demo.py config-path checkpoint-path img-path

          3. 預(yù)訓(xùn)練模型
          3.1 使用Vedastr復(fù)現(xiàn)的模型性能


          Vedastr目前支持基于attention、ctc、fc和transformer的str方法。我們復(fù)現(xiàn)了幾個STR模型,你可以在Benchmark and model zoo找到他們。下面是我們的一些復(fù)現(xiàn)指標(biāo):
          7b017014383b5461177cc230ceb13892.webp
          • TPS-ResNet-BiLSTM-Attention:What Is Wrong With Scene Text Recognition Model Comparisons?

          • Small-SATRN:On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention


          3.2 使用預(yù)訓(xùn)練模型實現(xiàn)一個demo


          舉個簡單的例子:


          1. 下載 TPS-ResNet-BiLSTM-Attention

          2. 下載vedastr,按照Installation進行安裝

          3. 激活conda環(huán)境,運行demo文件,識別的結(jié)果就會顯示在你的終端窗口上


          python tools/demo.py configs/tps-resnet-bilstm-attention TPS-ResNet-BiLSTM-Attention.pth input-img

          input-img:


          4c59f53449954a9f7d11d7789bb65d89.webp8bcc28b18a2c8dcabacec284463196b0.webp
          終端窗口:


          8455010ce9814b89660edd8a409b56e0.webp
          Vedastr項目鏈接如下,歡迎使用和star!https://github.com/Media-Smart/vedastr


          推薦閱讀



          添加極市小助手微信(ID : cv-mart),備注:研究方向-姓名-學(xué)校/公司-城市(如:目標(biāo)檢測-小極-北大-深圳),即可申請加入極市技術(shù)交流群,更有每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、行業(yè)技術(shù)交流一起來讓思想之光照的更遠吧~

          △長按添加極市小助手
          △長按關(guān)注極市平臺,獲取最新CV干貨
          覺得有用麻煩給個在看啦~??92db8d2c17e9db1446d5ddd6ebb7c30b.webp
          瀏覽 64
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  美女被操免费网站 | 大鸡吧影院 | 日本黄色操逼 | 色婷婷五月天亚洲中文字幕 | 日日夜夜天天 |