<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【Python】輕松識(shí)別文字,這款Python OCR庫(kù)支持超過(guò)80種語(yǔ)言

          共 1757字,需瀏覽 4分鐘

           ·

          2021-01-13 15:33

          OCR是什么?

          有一款軟件叫掃描全能王,想必一些小伙伴聽(tīng)過(guò),這是一個(gè)OCR集成軟件,可以將圖像內(nèi)容掃描成文字。

          所以說(shuō),OCR作用是對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,獲取文字及版面信息。

          OCR的全稱(chēng)叫作“Optical Character Recognition”,即光學(xué)字符識(shí)別。

          這算是生活里最常見(jiàn)、最有用的AI應(yīng)用技術(shù)之一。

          細(xì)心觀察便可發(fā)現(xiàn),身邊到處都是OCR的身影,文檔掃描、車(chē)牌識(shí)別、證件識(shí)別、銀行卡識(shí)別、票據(jù)識(shí)別等等。

          OCR本質(zhì)是圖像識(shí)別,其包含兩大關(guān)鍵技術(shù):文本檢測(cè)和文字識(shí)別。

          先將圖像中的特征的提取并檢測(cè)目標(biāo)區(qū)域,之后對(duì)目標(biāo)區(qū)域的的字符進(jìn)行分割和分類(lèi)。

          關(guān)于EasyOCR

          Python中有一個(gè)不錯(cuò)的OCR庫(kù)-EasyOCR,在GitHub已有9700star。它可以在python中調(diào)用,用來(lái)識(shí)別圖像中的文字,并輸出為文本。

          ?

          https://github.com/JaidedAI/EasyOCR

          ?

          EasyOCR支持超過(guò)80種語(yǔ)言的識(shí)別,包括英語(yǔ)、中文(簡(jiǎn)繁)、阿拉伯文、日文等,并且該庫(kù)在不斷更新中,未來(lái)會(huì)支持更多的語(yǔ)言。

          安裝EasyOCR

          安裝過(guò)程比較簡(jiǎn)單,使用pip或者conda安裝。

          pip?install?easyocr

          如果用的PyPl源,安裝起來(lái)可能會(huì)耽誤些時(shí)間,建議大家用清華源安裝,幾十秒就能安裝好。

          使用方法

          EasyOCR的用法非常簡(jiǎn)單,分為三步:

          • 1.創(chuàng)建識(shí)別對(duì)象;
          • 2.讀取并識(shí)別圖像;
          • 3.導(dǎo)出文本。

          我們先來(lái)舉個(gè)簡(jiǎn)單的例子。

          找一張路標(biāo)圖片,保存到電腦:

          接著擼代碼:

          #?導(dǎo)入easyocr
          import?easyocr
          #?創(chuàng)建reader對(duì)象
          reader?=?easyocr.Reader(['ch_sim','en'])?
          #?讀取圖像
          result?=?reader.readtext('test.jpg')
          #?結(jié)果
          result

          輸出結(jié)果:

          可以看到路標(biāo)上的三個(gè)路名以及拼音都識(shí)別出來(lái)了!

          識(shí)別的結(jié)果包含在元組里,元組由三部分組成:邊框坐標(biāo)、文本、識(shí)別概率。

          「關(guān)于語(yǔ)言:」

          這段代碼有一段參數(shù)['ch_sim','en'],這是要識(shí)別的語(yǔ)言列表,因?yàn)槁放评镉兄形暮陀⑽模粤斜砝锾砑恿薱h_sim(簡(jiǎn)體中文)、en(英文)。

          可以一次傳遞多種語(yǔ)言,但并非所有語(yǔ)言都可以一起使用。英語(yǔ)與每種語(yǔ)言兼容,共享公共字符的語(yǔ)言通常相互兼容。

          前文我們給出了EasyOCR支持的語(yǔ)言列表,并附有參數(shù)代號(hào)。

          「關(guān)于圖像文件:」

          上面?zhèn)魅肓讼鄬?duì)路徑'test.jpg',還可以傳遞OpenCV圖像對(duì)象(numpy數(shù)組)、圖像字節(jié)文件、圖像URL。

          再讀取一張文字較多的新聞稿圖片:

          #?導(dǎo)入easyocr
          import?easyocr
          #?創(chuàng)建reader對(duì)象
          reader?=?easyocr.Reader(['ch_sim','en'])?
          #?讀取圖像
          result?=?reader.readtext('test1.jpg')
          #?結(jié)果
          result

          識(shí)別文字的準(zhǔn)確率還是很高的,接下來(lái)對(duì)文字部分進(jìn)行抽取。

          for?i?in?result:
          ????word?=?i[1]
          ????print(word)

          輸出:

          小結(jié)

          該開(kāi)源庫(kù)是作者研究了幾篇論文,復(fù)現(xiàn)出來(lái)的成果,真是一位實(shí)干家。

          檢測(cè)部分使用了CRAFT算法,識(shí)別模型為CRNN,它由3個(gè)主要組件組成:特征提取,序列標(biāo)記(LSTM)和解碼(CTC)。整個(gè)深度學(xué)習(xí)過(guò)程基于Pytorch實(shí)現(xiàn)。

          作者一直在完善EasyOCR,后續(xù)計(jì)劃一方面擴(kuò)展支持更多的語(yǔ)言,爭(zhēng)取覆蓋全球80%~90%的人口;另一方面支持手寫(xiě)識(shí)別,并提高處理速度。

          往期精彩回顧





          獲取本站知識(shí)星球優(yōu)惠券,復(fù)制鏈接直接打開(kāi):

          https://t.zsxq.com/qFiUFMV

          本站qq群704220115。

          加入微信群請(qǐng)掃碼:

          瀏覽 61
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  青青操美女视频 | 操B在线视频 | 国产精品久久久久久久毛片明星 | 久久青青国产 | 日日骚影院 |