<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          100%抄襲!ICLR 2022投稿論文剽竊兩篇頂會,連換詞都懶得換

          共 531字,需瀏覽 2分鐘

           ·

          2021-11-07 20:13

          5d5baff72c1c926ef794c745e36bf16b.webp

          本文素材轉(zhuǎn)自:新智元

          【導(dǎo)讀】ICLR 2022會議投稿出現(xiàn)抄襲事件,夸張的是數(shù)據(jù)和表格都是從以前的paper上直接拿下來的。在項目主席以嚴重的剽竊案例為由發(fā)出Desk Reject之前,作者竟然撤回了提交的內(nèi)容。這是怎么回事?

          朋友們,又到了一月好幾度的「學(xué)術(shù)不端」曝光時間了。之前什么「借鑒」idea,「英譯中」都弱爆了,甚至直接照搬都沒有這次的「別出心裁」,至少人家還是「忠實原著」的。

          隨便舉一個例子,比如下面這個是原論文的圖。

          ?

          890156c288524cbbb461e69749765541.webp

          Wang et al. EMNLP 2020

          ?

          再來看看這篇論文的圖。

          ?

          f7173a17c415861b0e87b815cc8ded05.webp

          ICLR 2022投稿

          ?

          請看兩處紅色橫線部分,莫非這就是傳說中的「抄串行」了?

          ?

          但通篇讀下來,其實嚴格來說并不是100%相似,而是99%。因為還有1%是抄或者改錯的部分(doge)。


          這么明目張膽地搞事情難道沒人管管么?


          果不其然,11月1日,一封來自ICLR 2022程序主席的Desk Reject直接懟臉了。

          ?

          99527e29909f1dc009d90f3f429ec378.webp

          ?

          • 圖1是100%復(fù)制/粘貼自[1](作者注明 「采用自」),包括圖注

          • 表1是來自[1]的截圖(作者注明「采用自」),標題是復(fù)制/粘貼的,沒有任何署名

          • 表2:和[1]差不多,但有一些替換(例如。Android <- Phone, kitchen <- room, shirt <- clothing)

          • 表3:復(fù)制了[1]中的前3行,沒有注明出處,第4行是新的(比[1]中的第4行表現(xiàn)更差)

          • 算法1是來自[2]的截圖;未注明出處

          ?

          被抄襲的兩篇論文為:

          ?

          [1]?CAT-Gen: Improving Robustness in NLP Models via Controlled Adversarial Text Generation. Wang et al. EMNLP 2020

          ?

          e72bd5b3cb9e18055974f6bafd64f912.webp

          https://arxiv.org/pdf/2010.02338.pdf

          ?

          [2]?FreeLB: Enhanced Adversarial Training for Natural Language Understanding. Zhu et al. ICLR 2020

          ?

          363f0a17fba9e7e5eb1e16aa6657d3ea.webphttps://arxiv.org/pdf/1909.11764.pdf

          ?

          其實,作者團隊在10月29日就確認撤稿了。

          ?

          但是對于學(xué)術(shù)不端的行為,怎么能放過這個「公開處刑」的機會呢!

          ?

          e7387f90bb75bf0e5238c2db50968ad8.webp

          ?

          連換詞都懶得換的「抄襲」

          ?

          雖然之前很火的「Patches are all you need」只有4頁,但是這篇論文只有「6頁」的原因,顯然是不一樣的。

          ?

          ca58dd199d14d720dc1608aa33af09b5.webphttps://openreview.net/pdf?id=EO4VJGAllb

          ?

          摘要

          ?

          讀論文嘛,首先要看看摘要部分。?


          9bedf9091e27616e35018e344e8792c2.webp

          左:CAT-Gen原文;右:Text-Gen論文


          用紅色圈出相似的地方之后,嚯,有點厲害啊。


          這篇論文向我們展示了經(jīng)典的單詞替換 +「把」字句變「被」字句。顯然,意思絲毫不變。

          ?

          甚至,摘要的前半部分還算是稍微動手改了改,后半部分直接把原文拿過來貼上。真的,是一個單詞都沒有改。(但復(fù)制的時候還挺不小心的,漏了空格和橫短線)

          ?

          引言

          ?

          引言部分居然還有點「良心發(fā)現(xiàn)」,挪用了些關(guān)鍵詞,句子嘛,倒是好好重寫了一番。

          ?

          46658a9eb5ca0a0fe018fd31eb3baef8.webp

          左:CAT-Gen原文;右:Text-Gen論文

          ?

          就是這個引用的文章,是不是重合的太多了?

          ?

          論文正文

          ?

          這上來就已經(jīng)「徹底放棄抵抗」了,大段大段直接往上糊。

          ?

          e685855b980adf03b5746f7ed11f4079.webp

          左:CAT-Gen原文;右:Text-Gen論文

          ?

          你說一個字不改也就罷了,抄還抄不全乎。

          ?

          單詞拼不對,單詞之間少空格,強迫癥看了真心頭疼,抄襲也得有點「責任心」嘛。

          ?

          這兩篇文章都提到了一個「三階段」架構(gòu),那就都拿出來看看。

          ?

          15197edf86bb83aa36f3bee4a2b8ed07.webp

          上:CAT-Gen原文;下:Text-Gen論文

          ?

          Text-Gen這篇論文的圖直接是從CAT-Gen原文復(fù)制過來的,就把箭頭的示意圖從虛線改成實線。

          ?

          但是,雖然示意圖是變了,圖中的箭頭只有一半改成了實線,另一半還是虛線。

          ?

          Text-Gen文中的算法,乍一看和CAT-Gen原文不一樣,原來是從另一篇文章FreeLB里面直接貼過來的。

          ?

          e975492d106ac26035ef7dd1f23bac01.webp

          左:FreeLB原文;右:Text-Gen論文

          ?

          右邊看上去沒有左邊清晰,那是因為Text-Gen論文這個算法部分并不是手敲進去的,而是直接從FreeLB原文截的圖。

          ?

          實驗結(jié)果


          實驗結(jié)果自然也是完全一樣。

          ?

          展示前人的工作效果時也是直接截圖。

          ?

          a6e09075a14ea213e91be5dcd08c57c5.webp

          上:CAT-Gen原文;下:Text-Gen論文

          ?

          輪到自己的工作時,Text-Gen的實驗結(jié)果表格幾乎和CAT-Gen原文一樣,就只進行了一些單詞字面的替代。(表格畫得也是潦草得很)

          ?

          1020b3338c8e02e2315f409068454d0a.webp

          上:CAT-Gen原文;下:Text-Gen論文

          ?

          這最后的定量實驗數(shù)據(jù)就更搞笑了。

          ?

          5cdc2eb87996effa0b0b37ba3fd8018c.webp

          上:CAT-Gen原文;下:Text-Gen論文

          ?

          文章都已經(jīng)是抄襲了,還要堅守最后一點「倔強」,非要用Text-Gen自己的數(shù)據(jù)作為試驗結(jié)果。Text-Gen的性能數(shù)據(jù)漂亮也就罷了,結(jié)果還不如人家原文的CAT-Gen的數(shù)據(jù)。

          ?

          連評委都在吐槽。(編都不知道編個好點的)

          ?

          ea6815c255d6960d954b6f7366688ae7.webp

          ?

          網(wǎng)友評論


          抄襲事件一出,Reddit已經(jīng)有了好多人的評論。有的網(wǎng)友覺得這個造假者的「撤稿」行為太「冠冕堂皇」。

          ?

          「難道他們內(nèi)心認可抄襲這件事是錯的,然后還是去抄襲了嗎?」

          ?

          e4e237e7cab29932002e5601243e6b2a.webp

          ?

          有的網(wǎng)友感覺這種抄襲已經(jīng)沒什么好大驚小怪的了。

          ?

          「機器學(xué)習和深度學(xué)習的論文經(jīng)常會出現(xiàn)抄襲的情況。這種事就看有沒有人去查。抄襲的人本質(zhì)上就是在賭沒有人會注意到他的抄襲。」

          ?

          66ae8dbf16c35b58f37454041434996f.webp

          ?

          另一個網(wǎng)友也非常同意「抄襲的人本質(zhì)上就是在賭沒有人會注意到他的抄襲」這個觀點。

          ?

          「許多剽竊博士學(xué)位的人發(fā)現(xiàn)他們看似是『逃脫』了辛苦,但他們的整個職業(yè)生涯都被毀掉了。」

          ?

          1a5f9eb1ac06f40136e505dc4addef28.webp

          ?

          最近的學(xué)術(shù)不端行為頻頻發(fā)生,這也是給學(xué)術(shù)研究者時時刻刻的提醒,科研工作者心中一定要牢記求真,求實,對學(xué)術(shù)誠信要有敬畏之心,絕不能踏過紅線,不要有僥幸心理,否則就是自毀前程。每位科研工作者在做好自己的工作時,要懂得尊重他人的學(xué)術(shù)成果。

          參考資料:

          https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/?

          涉事論文:https://openreview.net/pdf?id=EO4VJGAllb

          論文[1]:https://arxiv.org/pdf/2010.02338.pdf

          論文[2]:https://arxiv.org/pdf/1909.11764.pdf



          — 雙11福利 · 甄選40門AI好課1分起秒?—

          福利:甄選40門AI好課1分起秒

          時間截止2021年11月12日 中午12點

          主會場:www.julyedu.com


          c5d581c222039fb9e653fee5d9f48c40.webp




          — 推薦閱讀 —

          最新大廠面試題


          AI開源項目論文


          NLP ( 自然語言處理 )


          CV(計算機視覺)


          推薦

          閱讀原文” 進入活動主會場

          瀏覽 56
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  xxxxx网 | 亚洲AV无码一区二区三区桃色 | www.AV在线视频 | 亚洲日日久 | swagArielbb在线播放 |