點(diǎn)擊下方卡片,關(guān)注“CVer”公眾號
AI/CV重磅干貨,第一時(shí)間送達(dá)
由國內(nèi)領(lǐng)先智能文本處理企業(yè)達(dá)觀數(shù)據(jù),與上海市計(jì)算機(jī)學(xué)會聯(lián)合舉辦的智能文檔版面分析多模態(tài)數(shù)據(jù)處理算法競賽正在火熱報(bào)名階段。
作為國內(nèi)領(lǐng)先的智能文本處理企業(yè), 達(dá)觀數(shù)據(jù)已連續(xù)七年主辦了全球性人工智能算法競賽“達(dá)觀杯”,邀請高校、科技型企業(yè)和自然語言處理愛好者,共同參與和研究實(shí)際業(yè)務(wù)場景下的人工智能技術(shù)問題。屬文本處理領(lǐng)域第一賽事,累計(jì)吸引近兩萬名選手參賽,提交作品總數(shù)超三萬件。
為助力各位打榜達(dá)人更快速上手比賽,更高效優(yōu)化模型,沖擊決賽top榜,達(dá)觀數(shù)據(jù)算法團(tuán)隊(duì)為選手提供了官方baseline以供參考。本屆大賽的總獎(jiǎng)金池 5.5W元,此外,排名Top50的選手將獲得達(dá)觀數(shù)據(jù)全職和實(shí)習(xí)工作的面試直通機(jī)會,優(yōu)先錄用。初賽還有“周榜單激勵(lì)”獎(jiǎng)、“"魚躍龍門"獎(jiǎng)、“梅開二度”獎(jiǎng)等各項(xiàng)好禮等你來拿~
還沒有報(bào)名的同學(xué)點(diǎn)擊參賽鏈接或點(diǎn)擊閱讀原文進(jìn)行報(bào)名;比賽近期將舉辦線上培訓(xùn),請持續(xù)關(guān)注!
https://challenge.datacastle.cn/v3/cmptDetail.html?id=824&hmsr=cver
該baseline使用的是DINO模型,模型主要思路是將文檔版面分析任務(wù)轉(zhuǎn)換為一個(gè)純視覺的目標(biāo)檢測的任務(wù),通過模型提取圖像特征,預(yù)測文檔元素的box坐標(biāo)和元素所屬類別 ,達(dá)到版面分析的目的。
baseline使用的是DINO論文的官方實(shí)現(xiàn)版本,基于此次比賽的數(shù)據(jù),在官方提供的預(yù)訓(xùn)練權(quán)重基礎(chǔ)上迭代訓(xùn)練。目前該baseline在A榜數(shù)據(jù)集上的Average Precision (AP)@[IoU=0.50:0.95|area=all|maxDets=100 ]為0.783。
代碼整體過程分為:模型訓(xùn)練、模型評估、模型預(yù)測、預(yù)測結(jié)果可視化。選手可進(jìn)入賽事平臺,自行下載baseline以供學(xué)習(xí)參考。
論文地址 :https://arxiv.org/abs/2203.03605
https://github.com/IDEA-Research/DINO

點(diǎn)擊閱讀原文,立即報(bào)名比賽!