如何在4-6個月產(chǎn)出論文?(含180條論文講解)
科研的本質(zhì):解決問題,創(chuàng)造新事物(新問題、新方法、新發(fā)現(xiàn)、新理論)
科研論文的 關(guān)鍵的體現(xiàn)在于將所得結(jié)果詳實(shí)記錄并進(jìn)行科學(xué)分析后,總結(jié)成果寫成論文由同行評議認(rèn)可后發(fā)表。

科研的完整過程
那么如何在4-6個月內(nèi)產(chǎn)出論文呢, 這次我和一些擔(dān)任AAAI,ACL,EMNLP等多個會議期刊的審稿人聊了聊,給大家準(zhǔn)備了以下攻略,希望對大家有所幫助。
掃碼0.01元領(lǐng)取
《4-6個月產(chǎn)出論文實(shí)操手冊》
一、如何調(diào)研確定topic
什么是好的topic,就如同尋找網(wǎng)易云音樂的小眾歌手:
01:越直觀簡單越好: 簡單意味著自己領(lǐng)域知識的學(xué)習(xí)成本低,例如NLP的文本分類,CV的人臉識別
02:越小眾越好: 越小眾,說明研究的人越少,研究競爭難度低,例如醫(yī)學(xué)和CV結(jié)合的方向,NLP和生物信息(例如藥物挖掘)的交叉方向
(一)如何調(diào)研確定topic
如何去尋找小而美的topic,要走金山里面找金子。
step0: 確定含金量最高的信息源
翻所在領(lǐng)域近三年的頂會文章 ,NLP領(lǐng)域主翻 ACL/NAACL/EMNLP 的頂會文章,CV主翻 CVPR/ECCV/ICCV 的頂會文章,機(jī)器學(xué)習(xí)主翻 NIPS/ICLR/ICML ,圖與數(shù)據(jù)挖掘主翻 KDD/WWW/SIGIR 。
step1: 只看論文標(biāo)題,確定10-20篇準(zhǔn)備看摘要的論文
瀏覽找到頂會文章的paper title list,根據(jù)直觀易懂且小眾原則排序選出10-20篇論文看摘要。
step2: 看10-20篇準(zhǔn)備看摘要的論文
找到3-5篇摘要看的懂的論文,仍然是直觀易懂且小眾排序原則。
step3: 精讀3-5篇論文,確定研究的topic,找到一個覺得我可以的topic
精讀3-5篇論文,對每篇論文所涉及的topic回答下面幾個問題:
-
這個topic目前3-5個公認(rèn)baseline以及公認(rèn)的evaluation datasets是什么;
-
這些baseline是不是卷到特別復(fù)雜;
-
datasets是不是刷到特別飽和;
-
代碼是不是自己很快可以看懂一鍵run起來。
掃碼0.01元領(lǐng)取
《4-6個月產(chǎn)出論文實(shí)操手冊》
(二)如何確定idea
空想無用,實(shí)踐才能出真知。
step0:平地不好起高樓,找到好的代碼
確定topic之后,搜索相關(guān)baseline的開源實(shí)現(xiàn)代碼,評判原則readme完善,看的不吃力,跑起來容易。
step1:紙上得來終覺淺,覺知此事要躬行
確定好的開源代碼實(shí)現(xiàn)后,對比原始論文,把對應(yīng)的實(shí)驗(yàn)都跑一遍,看看能不能復(fù)現(xiàn)論文實(shí)驗(yàn)效果。
以及對實(shí)驗(yàn)的數(shù)據(jù)集多做error analysis和case study,反復(fù)實(shí)驗(yàn)和分析數(shù)據(jù),洞見到提升點(diǎn),能找到提升點(diǎn),自然就可以產(chǎn)出idea。
step2: 多多討論,尋求合作
獨(dú)立科研能力雖然重要, 但是對于小白更需要找到好的合作者和引路人,和相關(guān)論文代碼作者多發(fā)郵件討論問題,甚至可以邀約合作。
也可以多找靠譜的師兄姐同學(xué)討論,一個人干很容易迷茫。
在討論和合作中,可以更加明確idea,當(dāng)然記住idea也要謹(jǐn)慎透露,防止idea被剽竊。
掃碼0.01元領(lǐng)取
《4-6個月產(chǎn)出論文實(shí)操手冊》
二、如何多快好省做實(shí)驗(yàn)
工程思維,快速迭代。
step0:0-1 階段,快速驗(yàn)證想法
萬事開頭難,確定idea之后,要快速實(shí)現(xiàn)idea驗(yàn)證想法沒有問題,如果沒有問題,自然一順百順。
如果有問題,解決方法如下:
首先,最小迭代原則, 自己的idea最好是在基礎(chǔ)代碼上的逐步迭代,確保實(shí)驗(yàn)不順需要分析考慮的對象最少化。
其次,勇于跳坑, 如果某次的實(shí)現(xiàn)發(fā)現(xiàn)經(jīng)過一段時間努力后沒有效果并且分析不出,及時跳坑,考慮換一個代碼baseline實(shí)現(xiàn),甚至要重新review討論idea。
step1: 1-10階段,完整solid的實(shí)驗(yàn)方案
實(shí)驗(yàn)越全面翔實(shí),論文中稿概率越大,一個統(tǒng)計數(shù)據(jù)method+實(shí)驗(yàn)部分接近論文頁數(shù)限制,基本可以中稿。
開了好頭,接下來是最見邏輯和思考的階段,初步想法驗(yàn)證后,需要擴(kuò)展實(shí)驗(yàn)和分析。
如何擴(kuò)展實(shí)驗(yàn), 借鑒baseline對應(yīng)論文的實(shí)驗(yàn)setting , 確定自己要做哪些ablation study實(shí)驗(yàn)以及補(bǔ)充哪些數(shù)據(jù)集的實(shí)驗(yàn) ;
如何進(jìn)行分析,分析最關(guān)鍵的是要解釋出自己的實(shí)驗(yàn)效果如何好,一般針對自己argue的幾個點(diǎn),給出定量的曲線統(tǒng)計實(shí)驗(yàn)或者定性的case study實(shí)驗(yàn)。
掃碼0.01元領(lǐng)取
《4-6個月產(chǎn)出論文實(shí)操手冊》
三、如何翻過論文寫作的山
先寫再改,盡量降低自己的學(xué)習(xí)曲線和執(zhí)行難度。
Tips:這份操作手冊的核心就是以平滑的學(xué)習(xí)曲線完成自己的第一篇論文,一回生二回熟,一回生很重要。
step0: 模仿式寫作
模仿實(shí)驗(yàn)中對比baseline的幾篇文章組織和寫作,優(yōu)先把intro method和experiments部分寫完,這一步先把內(nèi)容都堆砌上再說。
step1: 梳理邏輯,討論修改,明晰文章思路和邏輯
多尋求外部幫助,找到畢竟senior的人幫你看幾遍文章,找到你文章中的明顯的行文和邏輯問題;
找不到senior的人看,也可以找同等水平甚至門外漢看,這里就是跟著他們讀帶他們理解你的意思,這個過程中,自己同步可以發(fā)現(xiàn)自己的邏輯漏洞;
實(shí)在沒人看,那就是自己化身reviewr反復(fù)challenge自己。
總結(jié),這一步的修改, 是找到反饋,迭代修改幾輪,讓自己文章的主線和思路清晰起來
step2: 格式調(diào)整,語言潤色
內(nèi)容基礎(chǔ)框架和思路確定之后,就是文章的美化了。
-
首先是格式,嚴(yán)格按照所投會議或者期刊的要求調(diào)整好自己論文的格式;
-
然后語言,這里推薦quillbot,開會員直接可以幫你改寫到地道。
-
最后是圖表,圖表多學(xué)習(xí)其他頂會文章的圖表范式,美化好自己的圖表,尤其是圖,一圖勝千言
掃碼0.01元領(lǐng)取
180篇AI論文講解課
以下是論文寫作干貨詳細(xì)大綱
《180+條AI論文講解課》
論文/課件/代碼/數(shù)據(jù)集| 論文寫作必備
CV篇
CV baseline —— Alexnet
1. 圖像分割 —— FCN
2. 目標(biāo)檢測 —— YOLO V3
3. GAN —— 原生GAN
4. OCR —— CRNN
5. 輕量化網(wǎng)絡(luò) —— MobileNets
6. CV-transformer——VIT
7. 人臉識別——Eigenfaces
8. 三維重建 —— Alexnet
NLP篇
NLP baseline —— Word2Vec
1. 信息抽?。麑?shí)體識別) —— LSTM
2. 信息抽?。P(guān)系抽?。?—— CNN_for-re
3. 預(yù)訓(xùn)練模型 —— Transformer
4. 圖神經(jīng)網(wǎng)絡(luò) —— Nord2Vec
5. 文本匹配 —— DSSM
6. 機(jī)器翻譯 —— Luong NMT
7. 情感分析 —— TextRNN
8. 閱讀理解 —— MRC model
9. 對話系統(tǒng) —— jointBERT
10. 強(qiáng)化學(xué)習(xí) —— DQN
課程展示
課程展示
