真實教育場景手寫/表格/公式OCR數(shù)據(jù)集

向AI轉(zhuǎn)型的程序員都關注了這個號??????
機器學習AI算法工程 公眾號:datayx
TAL_OCR_MATH小學低年級算式數(shù)據(jù)集
算數(shù)數(shù)據(jù)集為小學數(shù)學1到3年級的學生手寫數(shù)學式子,共3萬圖片。每個數(shù)學式子經(jīng)過手工裁剪。每個圖像提供了對應標注。特殊數(shù)學符號標注方式請查看字符對應表。(文件87.04MB)

TAL_OCR_CHN手寫中文數(shù)據(jù)集
手寫中文數(shù)據(jù)集為30名大學生手寫的中文古詩詞,總計11739張圖片,每張圖片提供了對應的文本內(nèi)容標注。(文件183.92MB)

TAL_OCR_ENG手寫英文數(shù)據(jù)集
手寫英文數(shù)據(jù)集為學生手寫英文作文,總計1萬行英文,對應1萬張圖片,每張圖片提供了對應的文本內(nèi)容標注。(文件222.16MB)


TAL_OCR_FORMULA手寫公式數(shù)據(jù)集
手寫公式數(shù)據(jù)集為真實教育場景下學生手寫的各類公式數(shù)據(jù),總計143466張圖片,每張圖片提供了對應的文本內(nèi)容標注。(文件0.99G)

TAL_OCR_TABLE表格識別競賽訓練集
表格識別數(shù)據(jù)集為真實教育場景下學生拍照搜題的各類表格數(shù)據(jù),總計1.6w張圖片,每張圖片提供了對應的表格結構和內(nèi)容標注。(文件1.11GB)


全部數(shù)據(jù)集 獲取方式:
轉(zhuǎn)發(fā)本文至朋友圈,截圖發(fā)給本微信公眾號 datayx 即可。
機器學習算法AI大數(shù)據(jù)技術
搜索公眾號添加: datanlp
長按圖片,識別二維碼
閱讀過本文的人還看了以下文章:
基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測
《深度學習入門:基于Python的理論與實現(xiàn)》高清中文PDF+源碼
python就業(yè)班學習視頻,從入門到實戰(zhàn)項目
2019最新《PyTorch自然語言處理》英、中文版PDF+源碼
《21個項目玩轉(zhuǎn)深度學習:基于TensorFlow的實踐詳解》完整版PDF+附書代碼
PyTorch深度學習快速實戰(zhàn)入門《pytorch-handbook》
【下載】豆瓣評分8.1,《機器學習實戰(zhàn):基于Scikit-Learn和TensorFlow》
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼
汽車行業(yè)完整知識圖譜項目實戰(zhàn)視頻(全23課)
李沐大神開源《動手學深度學習》,加州伯克利深度學習(2019春)教材
筆記、代碼清晰易懂!李航《統(tǒng)計學習方法》最新資源全套!
《神經(jīng)網(wǎng)絡與深度學習》最新2018版中英PDF+源碼
重要開源!CNN-RNN-CTC 實現(xiàn)手寫漢字識別
【Keras】完整實現(xiàn)‘交通標志’分類、‘票據(jù)’分類兩個項目,讓你掌握深度學習圖像分類
VGG16遷移學習,實現(xiàn)醫(yī)學圖像識別分類工程項目
特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊
如何利用全新的決策樹集成級聯(lián)結構gcForest做特征工程并打分?
Machine Learning Yearning 中文翻譯稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在線識別手寫中文網(wǎng)站
中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學習與特征工程
不斷更新資源
深度學習、機器學習、數(shù)據(jù)分析、python
搜索公眾號添加: datayx
