<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          非正式版讀文獻(xiàn)指南:兩個月,刷了八千篇Arxiv,我發(fā)現(xiàn)……

          共 3795字,需瀏覽 8分鐘

           ·

          2021-07-27 15:55

          ↑ 點(diǎn)擊藍(lán)字 關(guān)注極市平臺

          作者丨白鹡鸰
          來源丨夕小瑤的賣萌屋
          編輯丨極市平臺

          極市導(dǎo)讀

           

          “作為一個成熟的研究生我要搞科研!”本文記錄了作者兩個月來怒刷八千篇Arxiv后的感悟:好像....沒什么用? >>加入極市CV技術(shù)交流群,走在計算機(jī)視覺的最前沿

          從五月初到現(xiàn)在,大約刷了八千篇Arxiv之后,我發(fā)現(xiàn)我有毛病。

          當(dāng)然,這是讀論文上頭時的牢騷,不是真心話,只是說,我在Arxiv上投入的精力的努力,與我預(yù)計的收獲不成正比。

          故事的起因是這樣的:

          作為一個博一的萌新,學(xué)校和導(dǎo)師不會直接讓你上手科研,而是先上上課,確保來自不同學(xué)校的同學(xué)們能夠擁有相近的知識背景,互相認(rèn)識認(rèn)識。但是,當(dāng)你的日常是上課的時候,看著學(xué)長學(xué)姐們學(xué)術(shù)討論,實驗跑得風(fēng)生水起,人總是會慌的。

          “天吶我已經(jīng)是一個成熟的研究生了,為什么每天還像本科生一樣課課課,我也要搞科研!“

          然后想想除了課程和作業(yè)報告,似乎確實沒什么整塊的時間可以靜下心來研究,最可行的只有每天看看論文了。下定決心的時候是5月,由于各種課程的大作業(yè)開始陸續(xù)下發(fā),最終,實際能干的事情,就是通過RSS訂閱[1],開始遍歷Arxiv和一些領(lǐng)域相關(guān)Journal的論文。

          在開始做這件事情的時候,我充滿了干勁和對論文的美好期許:

          “每天能夠接觸到所有研究者最新的idea和發(fā)現(xiàn),我就是時代的弄潮兒!“

          “那么多新發(fā)的方法,研究與研究之間都是相通的,可以把數(shù)理領(lǐng)域的前沿成果拿過來實現(xiàn)我們領(lǐng)域的研究問題,這效果絕對杠杠的!“

          “順帶還可以練一練英語速讀能力,文科理科兩手都抓,太機(jī)智了!“

          現(xiàn)在回頭望去,我就像個戲臺上的老將軍——渾身插滿了Flag。

          Arxiv是北京時間每天上午九點(diǎn)更新,美國時間的周末不更新。我訂閱了CS領(lǐng)域下 人工智能 AI,機(jī)器學(xué)習(xí) ML,計算機(jī)視覺 CV,信息理論 IT 四個方向的論文。平均每天加起來這些領(lǐng)域會更新150篇上下,周一會更多一點(diǎn),因此我每周大約會接收到800~900篇論文推送。5月到7月中旬,加起來推送的總量必然有8k以上。

          作為一個理智尚存的成年人,我采取的策略是首先速覽題目,對于研究相關(guān)的、或者看起來很有意思的文章,瞅一眼Abstract。如果Abstract挑不出毛病,再打開原文更詳細(xì)地閱讀。

          • 綜述類文章:這類文章的價值是介紹一個方向的研究進(jìn)展和前沿技術(shù),并總結(jié)研究難點(diǎn)痛點(diǎn),幾乎不具有創(chuàng)新性。寫得好的往往會直接投稿給期刊,因此在Arxiv上出現(xiàn)頻率不高。一篇好的綜述除了方法,更重要的是指出有待研究的空白。因此,對于只是羅列方法,總結(jié)不足的綜述我都不會進(jìn)一步閱讀。
          • 理論/觀點(diǎn)型文章:顯然,這類文章最重要的就是它的觀點(diǎn)和論證過程。一定要搞清楚文章的假設(shè)是哪些,限制在哪,如果不合理的話就不用看下去了。論證一般要么靠邏輯,要么靠公式推導(dǎo),想很快把公式搞懂顯然是不現(xiàn)實的,但可以看看是基于哪些數(shù)學(xué)方法來決定是否值得細(xì)看。
          • 方法型文章:這類文章的常見結(jié)果中包括“我們做到了xxx方面的SOTA”,但是,模型的評估指標(biāo)有哪些,和什么樣的參考如何比較得出了這個SOTA,往往暗藏玄機(jī)。所以,看一眼模型構(gòu)造,如果不是眼熟的縫合怪,再看一下實驗,實驗沒有太大問題,再瞄一眼結(jié)果,到底進(jìn)步了多少,有沒有機(jī)理分析。這些全齊活了,文章的具體方法才可能具有可信度。

          瀏覽方法是合理的,實施過程是痛苦的。我看到了五花八門標(biāo)題美麗,開頭讓人心神蕩漾,實驗結(jié)果或者方法一言難盡的文章。還有些投稿,只描述了作者想達(dá)到的效果,方法剛寫了一小段,實驗還沒跑,導(dǎo)致我最終養(yǎng)成了開文章先看眼頁數(shù),免得被畫餅欺騙感情的好習(xí)慣。

          這兩個月里,各式各樣的SOTA我見了上百篇,近期的few-shot,explanable AI,看起來都是研究熱點(diǎn)。然而最終,這大約8k篇的論文中,我挑挑揀揀,目前下載導(dǎo)入Mendeley打算好好研究的只有不到100篇。這樣做的時間成本是多少呢?

          • 假設(shè)每天我穩(wěn)定讀了150個標(biāo)題,這大約需要半個小時。
          • 這150個標(biāo)題中,有10篇能引起我的興趣,我花十五分鐘,過了一下它們的摘要。
          • 作為一個新手,我對于摘要的判斷能力還不是很強(qiáng),因此,這10篇文章中我需要仔細(xì)地閱讀5~8篇文章的intro,result,conclusion。這至少需要半個小時。
          • 最后,由于我連續(xù)讀了這么久文章,我獎勵自己就地躺平一刻鐘。

          所以,在Arxiv上刷文章,我每天需要花一個半小時左右,能夠獲取1~2篇可能有價值的文章。 而作為一個新手,我的研究嗅覺未必足夠靈敏,也就是說,在這些決定精讀的這些文章中,有50%以上的概率,在繼續(xù)閱讀1~2小時之后,我仍將一無所獲。而 如果利用這些時間有目的地定向搜索特定領(lǐng)域的文章, 參考文章的引用量,**我將更可能在同樣的時間內(nèi)了解更有價值的研究成果。

          在Arxiv上,作為一個研究領(lǐng)域的新手面臨的問題是選擇太多了,難以甄別有效信息。最初我試圖從數(shù)理領(lǐng)域獲得新的方法的設(shè)想并不成功。數(shù)理領(lǐng)域的breakthrough出現(xiàn)概率并不高,而且,想要將其他領(lǐng)域的方法遷移到自己的領(lǐng)域,一方面,獲取方法的時間成本會成倍地增長;另一方面,踩雷的風(fēng)險絕不低。

          作為一個能夠流暢讀寫論文的研究生,絕對不要指望用Arxiv能對英語水平有多少提升。 很簡單,因為Arxiv上的論文,在沒有經(jīng)過會議和期刊對語言的篩選打磨時,英語質(zhì)量著實參差不齊。目前英語詞匯量在1w左右的我感受到的瓶頸,主要來自詞匯的使用不夠多樣化導(dǎo)致的語言生硬,以及做不到快速逐行閱讀。而論文能讓人鍛煉快速閱讀的部分并不多,很多內(nèi)容都是要邊思考邊看的。論文作者也未必是Native speaker,很可能寫文章的時候也詞窮。對于這個個人問題,最近摸索的結(jié)論是,看CNN和BBC的新聞,對語言的提升效果遠(yuǎn)好于讀論文。

          總而言之,Arxiv上良莠不齊,對于研究領(lǐng)域的新手(博一博二及以下)來說,并不應(yīng)該以刷Arxiv作為信息獲取的主要渠道。我的導(dǎo)師在聽說我的計劃的時候,曾經(jīng)勸阻過我:

          “你現(xiàn)在不應(yīng)該大量漫無目的地閱讀文獻(xiàn)。而是應(yīng)該努力尋找可能給你提供新的研究靈感,或者教會你研究方法的論文?!?/em>

          也就是說,搜索特定詞條下的論文和Tutorial對我這個階段的研究生幫助會更大。Arxiv在現(xiàn)階段更適合作為檢索是否存在idea撞車的數(shù)據(jù)庫,而非圖書館。至于領(lǐng)域中的老手,刷Arxiv的時間成本應(yīng)該顯著降低(很多方法只要大致瀏覽就能理解),但若要緊跟研究潮流,每天1~2小時的閱讀應(yīng)該還是少不了的。具體細(xì)節(jié),就等我能看到他們眼中的風(fēng)景時再來和各位分享吧。

          不過呢,Arxiv上樂子還是不少的??梢赃@么說:如果回到兩個月前,我不會開始刷Arxiv;但在經(jīng)歷這么多痛苦,逐漸摸索到一些門道之后的現(xiàn)在,我還是打算繼續(xù)刷下去的。希望接下去,Arxiv能提升我甄別論文的能力,此外,我會對有價值的論文做一些筆記,從而提升自己的理解概括能力。

          本文描述的讀文獻(xiàn)方式“導(dǎo)師見打”,非搞笑人士請勿模仿!

          [1].^RSS (Really Simple Syndication) 是一種消息來源的格式規(guī)范,網(wǎng)站可以按照這種格式規(guī)范提供文章的標(biāo)題、摘要、全文等信息給訂閱用戶,用戶可以通過訂閱不同網(wǎng)站 RSS 鏈接的方式將不同的信息源進(jìn)行聚合,在一個工具里閱讀這些內(nèi)容。



          如果覺得有用,就請分享到朋友圈吧!

          △點(diǎn)擊卡片關(guān)注極市平臺,獲取最新CV干貨

          公眾號后臺回復(fù)“CVPR21檢測”獲取CVPR2021目標(biāo)檢測論文下載~


          極市干貨
          YOLO教程:一文讀懂YOLO V5 與 YOLO V4大盤點(diǎn)|YOLO 系目標(biāo)檢測算法總覽全面解析YOLO V4網(wǎng)絡(luò)結(jié)構(gòu)
          實操教程:PyTorch vs LibTorch:網(wǎng)絡(luò)推理速度誰更快?只用兩行代碼,我讓Transformer推理加速了50倍PyTorch AutoGrad C++層實現(xiàn)
          算法技巧(trick):深度學(xué)習(xí)訓(xùn)練tricks總結(jié)(有實驗支撐)深度強(qiáng)化學(xué)習(xí)調(diào)參Tricks合集長尾識別中的Tricks匯總(AAAI2021
          最新CV競賽:2021 高通人工智能應(yīng)用創(chuàng)新大賽CVPR 2021 | Short-video Face Parsing Challenge3D人體目標(biāo)檢測與行為分析競賽開賽,獎池7萬+,數(shù)據(jù)集達(dá)16671張!

          CV技術(shù)社群邀請函 #

          △長按添加極市小助手
          添加極市小助手微信(ID : cvmart4)

          備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測-深圳)


          即可申請加入極市目標(biāo)檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群


          每月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~



          覺得有用麻煩給個在看啦~  
          瀏覽 90
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操的网站| 爱爱网站日韩 | 国产十八 免费一级A片 | 人人爱操 | 91嫩草欧美久久久九九九 |