<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          GitHub Star 4.6K 百度開源力作

          共 2284字,需瀏覽 5分鐘

           ·

          2020-10-28 12:36

          導(dǎo)讀


          如果你是OCR方向的工程師,你一定需要知道這個OCR開源項目:PaddleOCR


          先看下PaddleOCR自今年開源以來,短短幾個月在GitHub上的表現(xiàn):


          • 7月,8.6M超輕量模型發(fā)布,GitHub Trending 全球趨勢榜日榜第一。

          • 8月,開源CVPR2020頂會SOTA算法,再上GitHub趨勢榜單!

          • 9月,發(fā)布PP-OCR算法,開源3.5M超超輕量模型,再下Paperswithcode 趨勢榜第一




          有圖有真相,這個含金量,廣大的Github開發(fā)者們自然懂,目前,項目累計Star數(shù)量已超過4.6K,并且仍然持續(xù)增長,這樣的成績到底是如何做到的?讓小編帶你一探究竟。


          我們先看repo里面的特性,確實是干貨滿滿,直接看官方介紹:



          數(shù)量上,這次PaddleOCR一口氣發(fā)布了三個系列模型,滿足移動端、服務(wù)器端各種場景需求。而且,多語言也妥妥安排上了,全部訓(xùn)練代碼和模型毫無保留開源。其中3.5M超輕量文字識別模型,堪稱目前業(yè)界開源的最輕量OCR模型了。


          質(zhì)量上,如此輕量的模型,效果有保障嗎?不看廣告,直接看療效。

          先看幾個常見的通用場景識別效果:



          火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片,外語都是妥妥的

          3.5M的模型能達(dá)到這個識別精度,絕對是良心之作了!


          傳送門:

          Github:https://github.com/PaddlePaddle/PaddleOCR

          論文下載鏈接:https://arxiv.org/abs/2009.09941


          快速體驗PaddleOCR的3.5M超輕量OCR模型

          • PC端快速嘗試:(打開網(wǎng)頁,選一張圖片,即可實時看到結(jié)果)


          https://www.paddlepaddle.org.cn/hub/scene/ocr



          • 手機(jī)端App安裝體驗

          PaddleOCR在百度大腦EasyEdge上開放了文字識別APP demo。

          示例效果如下(可以在github首頁找到下載二維碼)



          多個開源repo測試對比

          簡單對比一下目前主流OCR方向開源repo的核心能力:



          從性能指標(biāo)來看:


          • 針對OCR實際應(yīng)用場景,包括合同,車牌,銘牌,火車票,化驗單,表格,證書,街景文字,名片,數(shù)碼顯示屏等,收集的300張圖像,每張圖平均有17個文本框,PaddleOCR的F1-Score超過0.5,這個性能已經(jīng)很不錯了。


          從功能完備來看:


          • 預(yù)訓(xùn)練模型大小:EasyOCR目前暫無超輕量模型,chineseocr_lite最新的模型是4.7M左右,而PaddleOCR提供的3.5M無疑是目前業(yè)界已知最輕量的

          • PIP安裝:目前僅PaddleOCR和EasyOCR支持。

          • 自定義訓(xùn)練:實際業(yè)務(wù)場景中,預(yù)訓(xùn)練模型往往不能滿足需求,對于自定義訓(xùn)練和模型Finetuning,chineseocr_lite和EasyOCR都是不支持的

          • 部署方面:EasyOCR模型較大不適合端側(cè)部署,Chineseocr_lite和PaddleOCR都具備端側(cè)部署能力。


          開發(fā)者可以根據(jù)自己的實際需求,選擇適合自己的開源方案。


          對于PaddleOCR 3.5MB的超輕量模型,是如何做到的,repo中也給出了解釋。



          3.5M超輕量模型應(yīng)用了一套超輕量OCR系統(tǒng)PP-OCR,主要由DB文本檢測、檢測框矯正和CRNN文本識別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測頭部的設(shè)計、數(shù)據(jù)增強(qiáng)、學(xué)習(xí)率變換策略、正則化參數(shù)選擇、預(yù)訓(xùn)練模型使用以及模型自動裁剪量化8個方面,采用19個有效策略,對各個模塊的模型進(jìn)行效果調(diào)優(yōu)和瘦身。其中,飛槳模型壓縮庫PaddleSlim為PaddleOCR超輕量化模型的實現(xiàn)提供了核心的技術(shù)支撐。從超輕量模型8.1M的壓縮到3.5M,模型大小降低了56.79%,其中檢測模型速度提升21%,而且整體模型精度還有提升。



          除了3.5M超輕量OCR模型,PaddleOCR提供了多語言預(yù)訓(xùn)練模型(英、德、法、韓、日),支持自定義訓(xùn)練和豐富的部署方式。


          如果覺得這個項目還不錯,支持開源工作,也希望您可以star關(guān)注哦



          想了解更多,歡迎加入PaddleOCR技術(shù)交流群,第一時間獲得技術(shù)支持。

          注:小編發(fā)現(xiàn)現(xiàn)在已經(jīng)加到6群了,開發(fā)者朋友趕緊上車啊。



          招募活動預(yù)告

          10月31日,百度AI快車道將走進(jìn)南京,屆時將有PaddleOCR研發(fā)團(tuán)隊空降南京,歡迎OCR方向南京的開發(fā)者們,我們相聚江蘇保險大廈。后續(xù)的每一周我們還將走進(jìn)成都(11月7日)、西安(11月14日)、武漢、廈門、北京等城市。



          更多飛槳的相關(guān)內(nèi)容,請參閱以下內(nèi)容。

          官網(wǎng)地址:https://www.paddlepaddle.org.cn

          飛槳PaddleOCR項目地址:

          GitHub: https://github.com/PaddlePaddle/PaddleOCR

          Gitee: https://gitee.com/paddlepaddle/PaddleOCR

          飛槳PaddleSlim項目地址:

          GitHub: https://github.com/PaddlePaddle/PaddleSlim

          Gitee: https://gitee.com/paddlepaddle/PaddleSlim

          PP-OCR技術(shù)文章:

          論文下載鏈接:https://arxiv.org/abs/2009.09941


          點擊“閱讀原文”參與活動報名。

          瀏覽 81
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文在线亚洲 | 做爱综合网 | 93精品视频 | 99精品人妻无码一区二区三区 | 在线观看无码 |