IJCV論文與arXiv論文神似,arXiv,是占坑神器還是剽竊利器?

新智元報(bào)道
新智元報(bào)道
來(lái)源:Reddit
編輯:Priscilla LQ
【新智元導(dǎo)讀】論文被scoop(搶先發(fā)表)了!相信有過這種「中獎(jiǎng)」經(jīng)歷的人不在少數(shù)。自己的idea被「搶發(fā)」著實(shí)是一件讓人100%沮喪的事情。
咦,頂刊IJCV的一篇論文怎么跟2年前arXiv的一篇論文這么相似?

今天,Reddit一位好奇寶寶網(wǎng)友在「網(wǎng)上沖浪」的時(shí)候,發(fā)現(xiàn)了這一不可思議的事情。

原來(lái)事情是這樣的,Reddit網(wǎng)友發(fā)現(xiàn):一篇2017年發(fā)表的arXiv的論文和另一篇2019年發(fā)表在IJCA的論文「高度相似」,存在「大段粘貼」、「數(shù)據(jù)一樣」那種。


△ 上圖為arXiv論文發(fā)表時(shí)間為2017年,下面是IJCV上的論文,接收時(shí)間是2018年,發(fā)表時(shí)間是2019年
比如,兩篇論文的所用的數(shù)據(jù)相同,有圖為證:

再比如,摘要部分高度相似:

更仔細(xì)地看,這篇IJCV論文的主要思想,arXiv論文早就已經(jīng)解釋了,而且很充分。但這篇頂會(huì)論文并沒有在參考文獻(xiàn)中引用這篇arXiv論文。
竟然有這樣的事?!網(wǎng)友拿不定主意了,所以向廣大網(wǎng)友發(fā)起了求助:要不要「多管閑事」,聯(lián)系一下相關(guān)方來(lái)解決這個(gè)事情呢?
實(shí)習(xí)生偷偷拿了我的數(shù)據(jù)搶發(fā)論文
實(shí)習(xí)生偷偷拿了我的數(shù)據(jù)搶發(fā)論文
網(wǎng)友紛紛留言,有網(wǎng)友建議:聯(lián)系arxiv論文作者,讓他們自己解決。
也有網(wǎng)友分享了自己的經(jīng)歷:我被幾個(gè)學(xué)生scoop(搶先發(fā)表)了,后來(lái)通過幾封郵件解決了。

這個(gè)不幸被「scoop」的經(jīng)歷立即引起了網(wǎng)友圍觀:后來(lái)發(fā)生了什么?
于是,這位Reddit網(wǎng)友就現(xiàn)身說(shuō)法:
某天沖浪讀到一篇arxiv論文,和自己所做的研究非常相似,而且已經(jīng)發(fā)出來(lái)了,COOL!
一看作者——實(shí)驗(yàn)室之前的實(shí)習(xí)生......

而且這幾個(gè)實(shí)習(xí)生有實(shí)驗(yàn)室private repositories的權(quán)限。
想到這里,心里升起一種似曾相識(shí)的被「scoop」的感覺......
聯(lián)系了當(dāng)時(shí)這幾個(gè)實(shí)習(xí)生的導(dǎo)師后證實(shí),確實(shí)是他們擅自用了實(shí)驗(yàn)室的數(shù)據(jù)。
幾個(gè)實(shí)習(xí)生提出解決辦法:可以添加為合著者,但不會(huì)撤稿。
用了我的數(shù)據(jù),現(xiàn)在只是提供「合著權(quán)」?!

這遭到了這位網(wǎng)友和實(shí)驗(yàn)室其他人的強(qiáng)烈反對(duì)。
最后,由于這幾個(gè)實(shí)習(xí)生表示以后也不會(huì)待在學(xué)術(shù)界了,所以接受了「教育」后,這件事就這么不了了之。
幾個(gè)月后,被搶發(fā)的這位網(wǎng)友向期刊提交了自己的論文,并且順利發(fā)表,現(xiàn)在引用量也趕上了之前那篇arXiv論文。
當(dāng)然,當(dāng)看到他們?nèi)匀辉?/span>領(lǐng)英上宣傳自己這篇論文,被偷數(shù)據(jù)的當(dāng)事人感受可想而知......

publish or perish?
publish or perish?
不過,上面那位「建議聯(lián)系arxiv論文作者,讓他們自己解決」,也提到了科研圈「publish or perish」的事實(shí),發(fā)表或滅亡,自己選一個(gè)吧。
被搶發(fā),這并不罕見。

科研工作也講求時(shí)效性。
隨時(shí)掌握研究領(lǐng)域的最新進(jìn)展,有助于研究人員及時(shí)獲取最新消息,或者是調(diào)整自己的研究方向。
在arXiv出現(xiàn)之前,要了解同行的研究成果,就只能期刊上獲得。
但這對(duì)于一些像量子學(xué)這樣的熱門科研領(lǐng)域來(lái)說(shuō),等待論文發(fā)表在期刊上,就成為了一場(chǎng)「漫長(zhǎng)的煎熬」。
因此,當(dāng)初arXiv的出現(xiàn)就是為了預(yù)收錄物理學(xué)領(lǐng)域的論文,后來(lái)收錄領(lǐng)域逐漸擴(kuò)大到數(shù)學(xué)、計(jì)算機(jī)、非線性科學(xué)、定量生物學(xué)等領(lǐng)域。
而現(xiàn)在,arXiv除了有以上提到的功能之外,還有另一個(gè)主要的功能,那就是:
「占坑」。
不少研究人員為了證明自己論文的原創(chuàng)性,會(huì)在論文錄用前,將論文掛到arXiv上,給自己的論文打上「時(shí)間戳」。

這樣做,也是為了競(jìng)爭(zhēng):
因?yàn)椋l(shuí)將論文掛在了arXiv上,誰(shuí)就擁有了這篇論文的權(quán)力。
對(duì)于一些領(lǐng)域大神而言,arXiv這一大好處會(huì)讓他們盡快掛論文,他們?cè)诤醯氖?/span>「impact」。
然而,魯迅說(shuō)過,「凡事都有好有壞」。

對(duì)于一些不太有名的研究小組來(lái)說(shuō),將論文掛在arXiv就有很大風(fēng)險(xiǎn)了。
辛辛苦苦一年半載,哼哧哼哧做研究,開開心心掛arXiv。
回過頭來(lái),哦豁,idea被人家搶了。
等想要刊登到期刊的時(shí)候,被評(píng)委說(shuō)跟哪篇論文的相似度高,引起了爭(zhēng)議。
你說(shuō)冤不冤啊!
「天下武功,唯快不破」,這句話科研圈也適用。
究竟要不要將論文提前掛到arXiv上?各位讀者也會(huì)有這樣的糾結(jié)嗎?
同是天涯淪落人,或許你也有過類似論文被「搶發(fā)」的經(jīng)歷?最后又是怎么處理的呢?
不妨在評(píng)論區(qū)留(tu)言(cao)哦!
參考資料:
https://www.reddit.com/r/MachineLearning/comments/ojdmza/d_similarity_of_a_high_ranking_journal/
-往期精彩-



