darknet-ocr中文自然場景文字檢測及識別
darknet-ocr 是基于 darknet 框架,實現(xiàn) CTPN 版本自然場景文字檢測與 CNN+CTCOCR 文字識別的項目。目前支持系統(tǒng):mac/ubuntu python=3.6
實現(xiàn)功能
- [x] 文字方向檢測 0、90、180、270度檢測(支持dnn/tensorflow)
- [x] 支持(darknet/opencv dnn /keras)文字檢測,支持darknet/keras訓(xùn)練
- [x] 不定長OCR訓(xùn)練(英文、中英文) crnn\dense ocr 識別及訓(xùn)練 ,新增pytorch轉(zhuǎn)keras模型代碼(tools/pytorch_to_keras.py)
- [x] 支持darknet 轉(zhuǎn)keras, keras轉(zhuǎn)darknet, pytorch 轉(zhuǎn)keras模型
- [x] 身份證/火車票結(jié)構(gòu)化數(shù)據(jù)識別
- [x] 新增CNN+ctc模型,支持DNN模塊調(diào)用OCR,單行圖像平均時間為0.02秒以下
- [ ] CPU版本加速
- [ ] 支持基于用戶字典OCR識別
- [ ] 新增語言模型修正OCR識別結(jié)果
- [ ] 支持樹莓派實時識別方案
ocr 訓(xùn)練數(shù)據(jù)集(壓縮包解碼:chineseocr)
百度網(wǎng)盤鏈接:https://pan.baidu.com/s/1UcUKUUELLwdM29zfbztzdw 提取碼: atwn
gofile 地址:http://gofile.me/4Nlqh/uT32hAjbx 密碼 https://github.com/chineseocr/chineseocr
環(huán)境部署
GPU部署 參考:setup.md
CPU部署 參考:setup-cpu.md
下載編譯 darknet
git clone https://github.com/pjreddie/darknet.git
mv darknet chineseocr/
##編譯對GPU、cudnn的支持 修改 Makefile
#GPU=1
#CUDNN=1
#OPENCV=0
#OPENMP=0
make
修改 darknet/python/darknet.py line 48
root = '/root/'##chineseocr所在目錄
lib = CDLL(root+"chineseocr/darknet/libdarknet.so", RTLD_GLOBAL)
下載模型文件
模型文件地址:
- 百度網(wǎng)盤:https://pan.baidu.com/s/1gTW9gwJR6hlwTuyB6nCkzQ
other-links:http://gofile.me/4Nlqh/fNHlWzVWo
復(fù)制文件夾中的所有文件到models目錄
模型轉(zhuǎn)換(非必須)
pytorch ocr 轉(zhuǎn) keras ocr
python tools/pytorch_to_keras.py -weights_path models/ocr-dense.pth -output_path models/ocr-dense-keras.h5
darknet 轉(zhuǎn) keras
python tools/darknet_to_keras.py -cfg_path models/text.cfg -weights_path models/text.weights -output_path models/text.h5
keras 轉(zhuǎn) darknet
python tools/keras_to_darknet.py -cfg_path models/text.cfg -weights_path models/text.h5 -output_path models/text.weights
模型選擇
參考config.py文件
構(gòu)建 Docker 鏡像
##下載Anaconda3 python 環(huán)境安裝包(https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh) 放置在chineseocr目錄下
##建立鏡像
docker build -t chineseocr .
##啟動服務(wù)
docker run -d -p 8080:8080 chineseocr /root/anaconda3/bin/python app.py
Web 服務(wù)啟動
cd chineseocr## 進(jìn)入chineseocr目錄
python app.py 8080 ##8080端口號,可以設(shè)置任意端口
訪問服務(wù)
評論
圖片
表情
