3行Python代碼!識別圖片中的任意語言文字
二條:510頁的《Python爬蟲開發(fā)與項目實戰(zhàn)》
三條:??給Python初學(xué)者推薦的IDE!
↑?關(guān)注 + 星標(biāo)?,每天學(xué)Python新技能
后臺回復(fù)【大禮包】送你Python自學(xué)大禮包
大家好,我是龍哥!
今天給大家介紹一個超級簡單且強(qiáng)大的OCR文本識別工具:easyocr.
這個模塊支持70多種語言的即用型OCR,包括中文,日文,韓文和泰文等。

下面是這個模塊的實戰(zhàn)教程。
1.準(zhǔn)備
pip install?easyocr它會安裝除了模型文件之外的所有依賴,模型文件則會在運(yùn)行代碼的時候下載。
對于Windows,如果在安裝 Torch 或 Torchvision 時報錯了,請按照https://pytorch.org 的官方說明安裝 Torch 和 Torchvision。
如果你想使用顯卡進(jìn)行計算,你需要搜索下載CUDA,并在Pytorch網(wǎng)站上,確保選擇正確的CUDA版本。如果僅打算在CPU模式下運(yùn)行,請選擇CUDA = None。
2.實戰(zhàn)教程
這個模塊用起來真的非常簡單,三行代碼完事了:
import?easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('test.png')運(yùn)行的過程中會安裝所需要的模型文件,像下面這樣:

不過它的下載速度非常慢,而且經(jīng)常會失敗,因此這里給出第二個解決方案:先下載好模型文件,再將其放置到所需要的位置:
下載完模型后,將文件放到下面這個位置。
Windows:C:\Users\用戶名.EasyOCR\model
Linux:~/ .EasyOCR / model
如下圖所示:

重新執(zhí)行腳本不會再提醒下載模型了:
import?easyocr
reader = easyocr.Reader(['ch_sim'])
result = reader.readtext('test.png')
print(result)我隨便截了一個直播彈幕的圖片保存在腳本所在的文件夾下,命名為test.png:

結(jié)果如下:

基本上所有應(yīng)該識別的文字都識別出來了,效果非常不錯。
另外也可以看到,輸出采用列表格式,每個item分別表示對應(yīng)文字的邊界框,識別文本結(jié)果和置信度。
這個模塊還能識別多語種的情況:

我將這張圖片命名為test2.jpg,修改代碼中對應(yīng)的圖片名稱:
import?easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('test2.jpg')
print(result)效果如下:

這張圖片很復(fù)雜,而且是中英文混雜在一起的情況,但是可以看到模型除了左上角的水印,圖片中的文字基本都是識別出來了,盡管有部分文字識別錯誤,但還在可以接受的范圍之內(nèi)。
不過需要注意的是,雖然可以一次性識別許多種語言,但并非所有語言都可以一起用,通常是公共語言和一個特殊語種可以一起識別,相互兼容,比如英語和日語。
如果你的電腦沒有GPU或者顯存不足,可以加一個gpu=false的參數(shù)僅使用CPU運(yùn)行:
reader = easyocr.Reader(['ch_sim','en'], gpu = False)另外,這個模塊還支持直接使用命令行運(yùn)行,相當(dāng)方便,大家可以試試:
easyocr -l ch_sim en -f test.png --detail=1?--gpu=True我們的文章到此就結(jié)束啦,如果你喜歡今天的Python 實戰(zhàn)教程,給文章右下角點(diǎn)個贊吧??。
推薦閱讀
