MMOCR基于 PyTorch 的文本檢測工具
MMOCR 是基于 PyTorch 和 mmdetection 的開源工具箱,專注于文本檢測,文本識別以及相應(yīng)的下游任務(wù),如關(guān)鍵信息提取。 它是 OpenMMLab 項(xiàng)目的一部分。
主分支目前支持 PyTorch 1.6 以上的版本。
文檔:https://mmocr.readthedocs.io/en/latest/。
主要特性
-全流程
該工具箱不僅支持文本檢測和文本識別,還支持其下游任務(wù),例如關(guān)鍵信息提取。
-多種模型
該工具箱支持用于文本檢測,文本識別和關(guān)鍵信息提取的各種最新模型。
-模塊化設(shè)計(jì)
MMOCR 的模塊化設(shè)計(jì)使用戶可以定義自己的優(yōu)化器,數(shù)據(jù)預(yù)處理器,模型組件如主干模塊,頸部模塊和頭部模塊,以及損失函數(shù)。有關(guān)如何構(gòu)建自定義模型的信 息,請參考快速入門。
-眾多實(shí)用工具
該工具箱提供了一套全面的實(shí)用程序,可以幫助用戶評估模型的性能。它包括可對圖像,標(biāo)注的真值以及預(yù)測結(jié)果進(jìn)行可視化的可視化工具,以及用于在訓(xùn)練過程中評估模型的驗(yàn)證工具。它還包括數(shù)據(jù)轉(zhuǎn)換器,演示了如何將用戶自建的標(biāo)注數(shù)據(jù)轉(zhuǎn)換為 MMOCR 支持的標(biāo)注文件。
模型庫
支持的算法:
文字檢測
- DBNet (AAAI'2020)
- Mask R-CNN (ICCV'2017)
- PANet (ICCV'2019)
- PSENet (CVPR'2019)
- TextSnake (ECCV'2018)
- DRRG (CVPR'2020)
- FCENet (CVPR'2021)
文字識別
- CRNN (TPAMI'2016)
- NRTR (ICDAR'2019)
- RobustScanner (ECCV'2020)
- SAR (AAAI'2019)
- SATRN (CVPR'2020 Workshop on Text and Documents in the Deep Learning Era)
- SegOCR (Manuscript'2021)
關(guān)鍵信息提取
- SDMG-R (ArXiv'2021)
命名實(shí)體識別
- Bert-Softmax (NAACL'2019)
評論
圖片
表情
