【深度學(xué)習(xí)】AAAI 2024,14000篇投稿,大家都寫了啥?
夕小瑤科技說 原創(chuàng)
作者 | python
8月16日截稿的AAAI 2024,從投稿ID看,已超14000篇投稿。這么多投稿,大家都寫了啥?今年什么話題最火?和往年相比,今年的投稿趨勢又有什么變化?
本文中,小編通過對比AAAI 2024與2021投稿論文的主題分布與標(biāo)題關(guān)鍵詞,試圖回答上述問題。數(shù)據(jù)來源包含AAAI 2021投稿論文8000余篇與AAAI 2024投稿論文11000余篇。為避免泄露作者具體的論文內(nèi)容,標(biāo)題關(guān)鍵詞分析中僅考慮同時在10篇以上論文中出現(xiàn)的高頻關(guān)鍵詞。
投稿主題分布
下面一組圖展示了AAAI 2021 與 2024的Top-5投稿主題(subject)分布。
3年間,Top-5的主題沒有變化,但順序發(fā)生了錯位。可以看出,CV領(lǐng)域的論文,從2021年的20%飛速增長到2024年的32%,AAAI已被計算機視覺占領(lǐng)。而原本AAAI占主導(dǎo)地位的ML領(lǐng)域,投稿占比從35%降低到32%,屈居CV之后。NLP 與 Data Minding的占比相對穩(wěn)定,分別是11%->10%與7%->8%。Application Domains的占比有所下降,從7%降低到4%。而因為CV領(lǐng)域的論文占比上升,其它小領(lǐng)域的論文占比從19%下降到14%。
Top-5之后的小領(lǐng)域主題分布如下面一組圖所示。整體來說,變化不太大。2021年排第二的Focus Area,是關(guān)注COVID-19與神經(jīng)符號學(xué)的一個專題,在2024年消失了。


ML論文投稿主題分布
具體到ML論文的投稿主題分布,見如下一組圖。圖中僅顯示了Top-15的sub-subject,而其他類別均被歸于others,這點與后面的圖一樣。由于小編本身對ML不太了解,不確定分布差異是否是由于主題分類變化導(dǎo)致的,在此就不做細致分析了。


CV論文投稿主題分布
下面一組圖展示了CV論文的投稿主題分布??梢钥闯?,3D CV從第三名(9%)躍居到第一名(12%),而傳統(tǒng)CV任務(wù),如目標(biāo)檢測(第1->第3)、分割(第4->第7)排名下降明顯。


NLP論文投稿主題分布
最后展示了NLP論文的投稿主題分布。在LLM影響下,2024年投稿最火的自然是LLM主體,占比從2021年的5%提高到了20%。傳統(tǒng)的強勢科目IE,占比只從14%下降到13%,下降1名,LLM時代IE可能還是有搞頭的。NLP application從第6名強勢提高到了第3名,大模型時代也給自然語言處理的應(yīng)用帶來了更多的可能。多模態(tài)也從第13名上升到4名。
而受大模型影響較大的主題有文本生成(第4名->第7名)、多語言與機器翻譯(第5名->第12名)。


標(biāo)題主題詞變化
AAAI 2021與2024,投稿標(biāo)題的高頻詞詞云圖如下圖所示。為了避免一些常見高頻詞的影響,小編除了去掉停用詞之外,還去掉了這些詞:Graph, Models, Data, Learning, Deep, Neural, Network。
可以看出,一些高頻詞在AAAI 2024依然高頻,如Image(No.3->2),Detection(No.2->1),Knowledge(No.5->3),Generation(No.10->6),Reinforcement Learning(No.4->7)。2021年較火,但2024年明顯降低了熱度的詞有:Adversarial(No.1->20)、Classification(No.6->14)、Attention(No.9->29)。而2024年更火的詞包括:Segmentation(No.11->4),Efficient(No.15->5),Diffusion(NaN->8),Transformer(No.93->9)。
ML論文標(biāo)題主題詞變化
為了更好地展示各個領(lǐng)域的主題變化,小編還分領(lǐng)域?qū)?biāo)題中的高頻詞繪制了詞云圖。ML領(lǐng)域的對比如下圖所示,可以看到Federated Learning等主題成為今年AAAI的新秀。由于小編對ML不太了解,這里就不做詳細分析了。
CV論文標(biāo)題主題詞變化
CV領(lǐng)域論文標(biāo)題的主題詞變化如下面一組圖所示,可以看出,Video,Diffusion,Transformer,Generation等詞語詞頻提升明顯。
NLP論文標(biāo)題主題詞變化
NLP領(lǐng)域論文標(biāo)題的主題詞變化如下面一組圖所示。NLP中,Large Language Models一飛沖天。除此之外,Reasoning(No.42->6),Multimodal(No.67->7),Speech(No.35->10),Question Answering(No.32->12)詞頻也提升明顯。
結(jié)束語
各位同學(xué),不知道看完這些數(shù)據(jù)分析之后,你對AAAI 2024大家都投了啥是否有點了解了呢?你是投到了熱門主題上了呢,還是還在堅持冷門主題呢?歡迎大家評論區(qū)留言討論。

往期精彩回顧
-
適合初學(xué)者入門人工智能的路線及資料下載
-
(圖文+視頻)機器學(xué)習(xí)入門系列下載
-
機器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印
-
《統(tǒng)計學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯
機器學(xué)習(xí)交流qq群772479961,加入微信群請掃碼
