Google NLP Hack Series:
Intro to ASR Africa Challenge
語(yǔ)音技術(shù)可以實(shí)現(xiàn)與通過(guò)語(yǔ)音以外的方式難以獲取和使用的服務(wù)和應(yīng)用程序的交互。自動(dòng)語(yǔ)音識(shí)別 (ASR) 系統(tǒng)正在徹底改變這一領(lǐng)域的可能性,但尚未廣泛用于非洲語(yǔ)言。盡管近年來(lái) ASR 建模和數(shù)據(jù)收集方法取得了許多進(jìn)展,但最大的問(wèn)題仍然是對(duì)大量語(yǔ)音數(shù)據(jù)的需求。
此挑戰(zhàn)的目的是收集書面和口語(yǔ)數(shù)據(jù)以創(chuàng)建語(yǔ)音語(yǔ)料庫(kù),該語(yǔ)料庫(kù)可用于以對(duì)初學(xué)者友好的方式訓(xùn)練 ASR 模型。此挑戰(zhàn)是 Google NLP Hack 系列的一部分。
所有人
https://zindi.africa/competitions/google-asr-hack-series-africa-asr-data-challenge京東積累了電商零售場(chǎng)景下的海量商品的圖文數(shù)據(jù),其中商品主圖和商品標(biāo)題是最直觀、最容易觸達(dá)到用戶的數(shù)據(jù)。因此,圖文的一致性(即圖文匹配)至關(guān)重要,要求模型根據(jù)圖片和文本判斷出兩種模態(tài)數(shù)據(jù)傳遞的信息是否一致。通常,商品主圖和標(biāo)題包含大量的商品屬性信息。在實(shí)際業(yè)務(wù)中,圖片里商品的關(guān)鍵屬性與商品標(biāo)題描述的是否匹配,是影響用戶體驗(yàn)的重要因素。本賽題要求參賽隊(duì)伍利用脫敏后的京東電商平臺(tái)圖文數(shù)據(jù),通過(guò)商品圖片與商品標(biāo)題在整體以及商品關(guān)鍵屬性上的關(guān)聯(lián)程度來(lái)判斷兩者是否匹配。本次大賽面向全球開放,不限年齡國(guó)籍,高等院校在校學(xué)生(包括高職高專、本科生、研究生)以及科研機(jī)構(gòu)和企業(yè)從業(yè)人員均可報(bào)名參賽。報(bào)名&組隊(duì)(2月25日–4月21日)
初賽(3月22日–4月22日)
復(fù)賽(4月29日–5月21日)
決賽(6月中下旬)
https://www.heywhale.com/home/competition/620b34c41f3cf500170bd6ca京東商品標(biāo)題包含了商品的大量關(guān)鍵信息,商品標(biāo)題實(shí)體識(shí)別是NLP應(yīng)用中的一項(xiàng)核心基礎(chǔ)任務(wù),能為多種下游場(chǎng)景所復(fù)用,從標(biāo)題文本中準(zhǔn)確抽取出商品相關(guān)實(shí)體能夠提升檢索、推薦等業(yè)務(wù)場(chǎng)景下的用戶體驗(yàn)和平臺(tái)效率。本賽題要求選手使用模型抽取出商品標(biāo)題文本中的實(shí)體。與傳統(tǒng)的實(shí)體抽取不同,京東商品標(biāo)題文本的實(shí)體密度高、實(shí)體粒度細(xì),賽題具有特色性。本次大賽面向全球開放,不限年齡國(guó)籍,高等院校在校學(xué)生(包括高職高專、本科生、研究生)以及科研機(jī)構(gòu)和企業(yè)從業(yè)人員均可報(bào)名參賽。報(bào)名&組隊(duì)(2月25日–4月21日)
初賽(3月22日–4月22日)
復(fù)賽(4月29日–5月21日)
決賽(6月中下旬)
https://www.kesci.com/home/competition/620b34ed28270b0017b823ad