點(diǎn)擊左上方藍(lán)字關(guān)注我們

一個(gè)專注于目標(biāo)檢測(cè)與深度學(xué)習(xí)知識(shí)分享的公眾號(hào)
為了調(diào)查計(jì)算機(jī)視覺領(lǐng)域業(yè)界贊助的研究所占的比例,以及它們對(duì)該領(lǐng)域產(chǎn)生的影響,加拿大約克大學(xué)的一位博士生分析了 2010 至 2019 十年間 Top-5 計(jì)算機(jī)視覺會(huì)議上發(fā)表的近 15000 篇論文,展示了業(yè)界研究的變化趨勢(shì)以及這些研究對(duì)社區(qū)的影響。 轉(zhuǎn)載自 | 機(jī)器之心
在很多領(lǐng)域,由業(yè)界贊助的科學(xué)研究與學(xué)界研究通常共存并相互影響,從研究方式上看,二者存在著顯著差異。企業(yè)開展的研究往往受到與自身業(yè)務(wù)需求和特定產(chǎn)品功能相一致的短期目標(biāo)驅(qū)動(dòng),而非純粹的學(xué)術(shù)探究。此外,工作流程也不相同:比如在機(jī)器學(xué)習(xí)研究中,學(xué)界研究者旨在開發(fā)新模型或改進(jìn)現(xiàn)有模型以建立新的 SOTA,業(yè)界研究者正好相反,他們有著固定的性能需求,想要的只是能夠滿足自己并且方便擴(kuò)展的特定模型或方法。
由于研究目標(biāo)不同,一些業(yè)界人士承認(rèn),下一個(gè)偉大的 idea 更有可能出自學(xué)界。不過也要承認(rèn),業(yè)界具有較學(xué)界多得多的可用資源和數(shù)據(jù)。

近日,加拿大約克大學(xué)的博士生 Iuliia Kotseruba 對(duì) 2010 至 2019 年計(jì)算機(jī)視覺在業(yè)界和學(xué)界的進(jìn)展進(jìn)行了詳盡的調(diào)研。這十年來,該領(lǐng)域的研究活動(dòng)一直在增長(zhǎng)。計(jì)算機(jī)視覺研究不斷增長(zhǎng)很大程度上要?dú)w功于深度學(xué)習(xí)技術(shù)的成功,而深度學(xué)習(xí)技術(shù)又得益于巨量可用的計(jì)算資源和數(shù)據(jù)??紤]到計(jì)算機(jī)視覺應(yīng)用的巨大價(jià)值,很多企業(yè)都向該領(lǐng)域的研發(fā)工作投資。因此業(yè)界贊助的研究者成為計(jì)算機(jī)視覺社區(qū)的重要組成部分,并向該領(lǐng)域主要的學(xué)術(shù)會(huì)議和期刊雜志積極投稿。此外,所有計(jì)算機(jī)視覺頂會(huì)具備了工業(yè)博覽會(huì)的特征,提供了交流和招聘機(jī)會(huì)。論文地址:https://arxiv.org/pdf/2107.04902.pdf盡管業(yè)界研究不斷增長(zhǎng)的現(xiàn)狀很難忽視,但由于缺乏相關(guān)數(shù)據(jù)和正式研究,其對(duì)計(jì)算機(jī)視覺研究的影響在很大程度上還是未知的。因此,本文主要有兩個(gè)目的,一是量化業(yè)界贊助的研究在計(jì)算機(jī)視覺領(lǐng)域的比重,二是探究業(yè)界的參與是否對(duì)該領(lǐng)域的發(fā)展方式具有可度量的影響。數(shù)據(jù)來源和統(tǒng)計(jì)2012 年,Kryzhevsky 等人提出了 AlexNet,展現(xiàn)出了卷積神經(jīng)網(wǎng)絡(luò)(CNN)在大規(guī)模圖像分類任務(wù)上相較于其他機(jī)器學(xué)習(xí)方法的優(yōu)勢(shì)。此后不久,CNN 和深度學(xué)習(xí)擴(kuò)展至了計(jì)算機(jī)視覺的很多其他領(lǐng)域以及計(jì)算機(jī)視覺以外的領(lǐng)域。在本文中,為了捕捉到引入這種機(jī)器學(xué)習(xí)范式以來的趨勢(shì),研究者從 2010 至 2019 年主要計(jì)算機(jī)視覺會(huì)議接收的論文中挖掘數(shù)據(jù)。選取的計(jì)算機(jī)視覺會(huì)議包括 CVPR、ICCV、ECCV、ACCV 和 BMVC,一共抽取了 14686 篇論文。為了分析業(yè)界在計(jì)算機(jī)視覺社區(qū)的現(xiàn)狀和影響,研究者對(duì)以下信息展開了分析:論文作者及所屬機(jī)構(gòu)、機(jī)構(gòu)類型(屬于業(yè)界還是學(xué)界)、論文及發(fā)表年份、發(fā)表會(huì)議或期刊、標(biāo)題、摘要和主題等。下表 1 是具體的統(tǒng)計(jì)數(shù)據(jù),包括學(xué)界、業(yè)界以及既屬于學(xué)界也屬于業(yè)界的論文、作者、論文引用以及代碼鏈接的數(shù)量。首先來看學(xué)界和業(yè)界研究的論文貢獻(xiàn)。總體來說,過去十年計(jì)算機(jī)視覺領(lǐng)域發(fā)表論文的數(shù)量有了顯著的增長(zhǎng)。例如,計(jì)算機(jī)視覺頂會(huì)上發(fā)表論文的數(shù)量一直以 12% 左右的年均增長(zhǎng)率穩(wěn)步上升。如下圖 1 所示,2010 年發(fā)表的論文 1000 多篇,到了 2019 年則增加到了 2500 多篇。為了確定業(yè)界對(duì)論文增長(zhǎng)的貢獻(xiàn),研究者首先統(tǒng)計(jì)了業(yè)界和學(xué)界作者在計(jì)算機(jī)視覺頂會(huì)上發(fā)表論文的占比,具體如下圖 2 所示。過去十年,所有或部分作者來自業(yè)界的論文總體占比呈增加趨勢(shì),僅由業(yè)界作者發(fā)表的論文在所有論文中的比重在 2% 到 6% 之間波動(dòng),業(yè)界和學(xué)界作者共同參與論文的數(shù)量則增加了不止一倍,從 2010 年的 15% 增至 2019 年的 37%??偟膩碚f,有業(yè)界作者參與的論文在所有論文中的比重在 2010 年低于 20%,到了 2019 年這一數(shù)字增加至了 40% 以上。其次是論文作者所屬機(jī)構(gòu)的變化。如下圖 3 所示,過去十年,業(yè)界作者的數(shù)量同樣呈現(xiàn)穩(wěn)步地增長(zhǎng)。具體來說,僅屬于業(yè)界的作者占比從 2010 年的 7% 增加至了 2019 年的 17%。同屬于業(yè)界和學(xué)界的作者的數(shù)量也從 2017 年的不到 1% 增加至了 2019 年的 9%。最重要的是該領(lǐng)域有影響力研究人員的行為,他們被定義為在作者合作網(wǎng)絡(luò)中具有最高 PageRan 分?jǐn)?shù)的 top-100 作者。結(jié)果顯示,屬于業(yè)界的頂級(jí)研究人員的占比由 2010 年的 20% 上升至 2019 年的近 60%。關(guān)于業(yè)界和學(xué)界的合作,從論文作者和所屬關(guān)系來看,都呈現(xiàn)出了更多合作的趨勢(shì)。每篇論文的作者數(shù)量逐漸增加。在學(xué)界,2010 年每篇論文平均有 3 名作者,2019 年增至 4.5 名。此外,2019 年學(xué)界 / 業(yè)界合作的論文平均有 6 名作者。單篇論文的最多作者從 2010 年的 15 名增至 2019 年的 28 名。如上圖 2 所示,這些新的合作大多出現(xiàn)在業(yè)界和學(xué)界作者之間。此外,如下圖 4 所示,學(xué)界和業(yè)界所屬的聯(lián)系也呈現(xiàn)出了區(qū)域模式。比如,來自 Google 和 Facebook 的研究人員比較多地與 CMU 和加州大學(xué)等美國(guó)頂尖大學(xué)合作。研究者發(fā)現(xiàn),業(yè)界在以下兩個(gè)方面產(chǎn)生了重大影響:一是研究主題趨勢(shì)的演化,二是過去十年的引用偏好。隱含狄利克雷分布( Latent Dirichlet Allocation,LDA)是文本數(shù)據(jù)中常用的主題發(fā)現(xiàn)方法。本研究中的文本語料庫包含 14686 篇論文的標(biāo)題和摘要。為了確定這些論文的主題演化趨勢(shì),研究者使用經(jīng)過訓(xùn)練的 LDA 模型來找出每篇文檔的熱門主題,然后每年分別針對(duì)學(xué)界和業(yè)界對(duì)每個(gè)主題進(jìn)行匯總統(tǒng)計(jì)。由于 LDA 模型生成的主題是詞集,因此研究者額外使用領(lǐng)域知識(shí)(domain knowledge,DK)對(duì)主題進(jìn)行標(biāo)記。下表 2 展示了最終的 20 個(gè)主題和對(duì)應(yīng)的 top-5 關(guān)鍵詞:研究者想要探究業(yè)界論文是否對(duì)社區(qū)產(chǎn)生更大的影響,即在有類似文章時(shí),業(yè)界論文是否更有可能被引用?研究者為此創(chuàng)建的引用網(wǎng)絡(luò)(citation network)是一個(gè)具有 14686 個(gè)節(jié)點(diǎn)和 161514 個(gè)邊的有向圖。具體地,在從論文參考文獻(xiàn)中解析出來的 60 萬個(gè)引用中,他們僅考慮 top-5 會(huì)議上的論文。結(jié)果顯示,超過 95% 的網(wǎng)絡(luò)節(jié)點(diǎn)包含在巨大的連接分支中,并且近 25% 的論文未被引用。根據(jù)引用網(wǎng)絡(luò)的數(shù)據(jù),研究者發(fā)現(xiàn)業(yè)界論文被引更加頻繁。在 top-10 被引論文中,2 篇出自業(yè)界作者,3 篇由業(yè)界和學(xué)界作者合作,5 篇出自學(xué)界作者。高被引論文主要介紹了廣泛使用的架構(gòu)(如 ResNet)、常見視覺任務(wù)(如目標(biāo)檢測(cè))的算法和常用數(shù)據(jù)集(如目標(biāo)檢測(cè)和分割數(shù)據(jù)集 COCO 和自動(dòng)駕駛數(shù)據(jù)集 KITTI)。平均來說,業(yè)界論文被引 23 次,學(xué)界 / 業(yè)界論文被引 11 次,學(xué)界論文被引 10 次。另外需要注意,在引用網(wǎng)絡(luò)中,學(xué)界論文占比 73%,僅有 4% 的論文是由業(yè)界貢獻(xiàn)的,23% 由學(xué)界 / 業(yè)界貢獻(xiàn)。因此,4% 的業(yè)界論文占了所有引用的 8%。下圖 7 展示了最高 PageRank 的 top-100 論文中,學(xué)界和業(yè)界論文的占比情況??梢钥吹?,自 2015 年以來,業(yè)界所屬論文的影響力大體呈增加趨勢(shì),2018 年業(yè)界論文更是一度超過學(xué)界論文,2019 年二者幾乎持平。此外,過去十年中 100 篇 top 論文中,有 67 篇是學(xué)界論文。為了進(jìn)一步探究業(yè)界論文的引用偏倚(citation bias),研究者研究了與論文相關(guān)的代碼 / 數(shù)據(jù)的可用性,這是因?yàn)樵撘蛩匾驯蛔C明在其他科學(xué)領(lǐng)域展現(xiàn)出了顯著的引用優(yōu)勢(shì)。如下圖 8 所示,提供代碼的論文的比例穩(wěn)步增加,并且無論是否涉及業(yè)界作者,公開發(fā)布代碼的比例和提供代碼論文的增長(zhǎng)率大致相同。因此,研究者不將該因素作為業(yè)界論文平均高引用的原因。本文僅做學(xué)術(shù)分享,如有侵權(quán),請(qǐng)聯(lián)系刪文。雙一流大學(xué)研究生團(tuán)隊(duì)創(chuàng)建,專注于目標(biāo)檢測(cè)與深度學(xué)習(xí),希望可以將分享變成一種習(xí)慣!整理不易,點(diǎn)贊三連↓