北理工研究生被爆公然抄襲?曠視研究員列出「實(shí)錘」,相似度近100%

新智元報(bào)道
新智元報(bào)道
來源:zhihu
編輯:yaxin
【新智元導(dǎo)讀】學(xué)術(shù)圈再添新瓜!昨日,曠視研究員揭露北理工研究生公然抄襲其在NeurIPS 2020的投稿。最新抄襲文章已于9月16日在arxiv上發(fā)表。原作者指出,抄襲文章與自己投稿在標(biāo)題、摘要、圖片數(shù)據(jù)幾乎完全一致。然而,這篇NeurIPS投稿究竟是如何流出,引起網(wǎng)友的廣泛猜測(cè)。
北理工碩士被指抄襲論文?
幾乎一字不差!

「北京理工大學(xué)某碩士生被指幾乎一字不差地抄襲論文?」這一話題引起大家的熱議。

原作者發(fā)文「在arxiv上看到自己的投稿署了別人的名字是什么體驗(yàn)?」,在文中對(duì)比并指出高度一致的內(nèi)容。
網(wǎng)友表示,「我看不懂,但我大為震撼」。

怎樣高度一致?
原作者為曠視的一位研究人員,被抄襲的文章是其在 NeurIPS 2020 的投稿。

用原作者的標(biāo)題搜索發(fā)現(xiàn),就在9月16日剛剛提交的論文標(biāo)題一樣,論文作者卻成了北理工和河海大學(xué)學(xué)生的名字Minghao Gao, Hailun Zhang和Yige Yan。

曠視研究員表示,「這篇文章厲害在哪里呢?厲害在文章內(nèi)容與我們 NeurIPS 2020 的投稿高度一致。我們的投稿,被泄露并被抄襲挪用了?!?/span>
標(biāo)題100%完全一致就不說了。
那么,這篇最新發(fā)表的文章究竟和原文重合度有多少呢?
為了方便查閱,原作者整理了一個(gè)對(duì)比圖庫(kù)。

第一,摘要幾乎完全一致。(第一張為曠視研究員摘要,第二張為北理工碩士)
這是需要有多大的機(jī)遇巧合,才能讓這兩篇文章的摘要如此一致?


第二,圖片完全一致。

第三,數(shù)據(jù)完全一致。
難道剛好才想到一起去了嗎?還是做的實(shí)驗(yàn)只有這一種數(shù)據(jù)?
萬千變化,只有這一種可能?

關(guān)于這些截圖,原作者表示自己只截取了「一部分」雷同之處。
「因?yàn)槿绻阉欣淄幎冀貓D,需要截圖整整 8 頁(yè)(論文共 8 頁(yè))。」

「作者們主要修改了部分措辭,并采用了 CVPR 2021 的 latex 模板,這一過程完全是主觀刻意的。我們要強(qiáng)調(diào)一點(diǎn),arxiv 文章中沒有任何一個(gè)配圖、表格、公式是新的,完全沒有做額外的實(shí)驗(yàn)?!?/span>
作者自證 NeurIPS 2020 文章投稿
通過曠視研究員郵件截圖可以看出,這篇文章 Label Assignment Distillation for Object Detection 確實(shí)是NeurIPS 2020的投稿文章。

還包括實(shí)驗(yàn)數(shù)據(jù)記錄,overleaf 歷史記錄,帶時(shí)間的聊天記錄旁證,帶時(shí)間的專利申請(qǐng)記錄等等。

原作者表示,「我們?cè)诠緝?nèi)部還形成了白皮書文檔,并對(duì)其他組展示過這個(gè)工作(有 ppt 和視頻為證),證人也非常多。」
他表示,這篇文章質(zhì)量確實(shí)一般, 連投NeurIPS 2020 和 AAAI 2021 沒有成功后,就沒有在這篇文章上耗費(fèi)精力了。
但是,不管怎么說,這篇文章還依舊屬于曠視的學(xué)術(shù)研究成果。原作者依舊擁有對(duì)其的著作權(quán)。
原作者表示,「從學(xué)術(shù)上講,做這篇文章的過程直接孵化了我們中稿 CVPR 2021 的工作對(duì)我們來講是有很大價(jià)值的。」

審稿人泄露?
話說,既然是沒有投中的文章,是怎么泄露出去并被剽竊挪用呢?
曠視研究員文中指出,最可疑的當(dāng)然是我們的審稿人,但「雙盲機(jī)制」使我們無從知曉審稿人是誰。
目前,最新發(fā)表在 arxiv 上文章的作者有 3 位,且沒有在論文中放聯(lián)系方式。
原作者通過英文名檢索,幾乎檢索不到任何信息,可見 3 位作者在學(xué)術(shù)圈并不知名。
「我們冒昧推測(cè)這 3 位中并沒有審稿人級(jí)別的人,所以泄露給他們的另有其人?!?/span>
沒有聯(lián)系方式,連溝通的渠道都沒有;幸好 arxiv 本身是可以查到上傳者郵箱的。

網(wǎng)友:只是過度引用而已
一位網(wǎng)友拋出2個(gè)問題:
1、這篇論文是怎么得到的?
2、為什么原作者過不了,二遍換個(gè)人就能過,是不是有什么操作空間?

最大的疑問莫過于,北理工碩士是如何得到這篇文章的?
按常理說,抄襲可不是小事,何況抄的一字不差,這個(gè)學(xué)歷的人一定不會(huì)不知道這個(gè)道理。
有網(wǎng)友看后,第一反應(yīng)是買論文被忽悠了,有中間人吶!

網(wǎng)友調(diào)侃道,「把論文的購(gòu)買渠道發(fā)出來,防止我們踩坑?!?/span>

「以前看arxiv找idea,現(xiàn)在看arxiv吃瓜」

「別猜了,只是過度引用而已?!?/span>

歸根結(jié)底,解釋不了被拒論文是怎么流出的。
你怎么看待這件事?
參考資料:
注:本文內(nèi)容多處引用曠視研究員「在arxiv上看到自己的投稿署了別人的名字是什么體驗(yàn)?」一文。
原文鏈接:https://zhuanlan.zhihu.com/p/411800486
原作者2020年文章鏈接:
megvii-my.sharepoint.cn/:b:/g/personal/wangjianfeng_megvii_com/EfweEkKRk4RJvbGdVhqXwawBi54pqzIdYGASOjfNpLSNVA?e=EzT8d5
https://www.zhihu.com/question/487690998
https://zhuanlan.zhihu.com/p/411800486


