<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          萬字長文:哥大CV博士總結(jié)五年讀博生涯,即將入職新加坡國立大學(xué)任助理教授

          共 24173字,需瀏覽 49分鐘

           ·

          2021-02-09 12:42

          ↑ 點(diǎn)擊藍(lán)字?關(guān)注極市平臺

          作者丨Mike Shou
          來源丨機(jī)器之心
          編輯丨極市平臺

          極市導(dǎo)讀

          ?

          在這篇文章中,哥倫比亞大學(xué)博士Mike Shou講述了自己的五年讀博經(jīng)歷,包括如何確定研究方向、如何確定單篇論文的選題、如何做報(bào)告、如何做出職業(yè)選擇等,希望可以給正在讀博或準(zhǔn)備讀博的你提供一些啟發(fā)。?>>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺的最前沿


          作者 Mike 是 Facebook AI 研究科學(xué)家,他將加入新加坡國立大學(xué) NUS,任助理教授、獨(dú)立博導(dǎo)。他于哥倫比亞大學(xué)取得博士學(xué)位,方向?yàn)橐曨l理解和生成。?他實(shí)驗(yàn)室正招收 2021 Fall PhD、訪問博士生等。



          實(shí)驗(yàn)室網(wǎng)站:https://sites.google.com/view/showthemlab

          0. 寫在前面


          剛上大學(xué)時(shí),聽過不少學(xué)長學(xué)姐分享會(huì);申請博士時(shí),讀了不少留學(xué)申請總結(jié)。都收獲很大,讓當(dāng)時(shí)啥也不懂的我,了解了每場游戲(如何度過一個(gè)充實(shí)的本科;如何拿到心儀的 PhD offer)的 principles:有啥規(guī)則,有啥技巧,等等。

          開始讀博時(shí)候,我也去找類似的讀博經(jīng)歷分享,令我收益良多的,如熊輝老師、@田淵棟大牛和@李沐大牛的總結(jié),@林達(dá)華老師的 blog;但可惜只有這寥寥幾篇,讀博又是一個(gè)復(fù)雜的事兒,當(dāng)時(shí)的我并不能清晰地看見前面的路,遇到一些事亦因缺乏經(jīng)驗(yàn)借鑒,走了彎路。于是當(dāng)時(shí)便想著,等我畢業(yè)了,也得記下我學(xué)到的經(jīng)歷,希望能幫助到剛開始讀博,像我當(dāng)年一樣迷茫的科研新人。也借此記錄和感恩一路走來,所有幫助過我的人,best of luck。

          因?yàn)闀r(shí)間有限,文章寫的粗糙,還請多多擔(dān)待;因?yàn)槠拗?,有的問題難以講得完善全面,還請結(jié)合自身情況,辯證地借鑒相關(guān)經(jīng)驗(yàn);或跟您意見不合,全當(dāng)看小說,尋個(gè)樂子罷了。

          1. 萬事開頭難 (第一學(xué)期)


          1.1 初到紐約

          2014 年夏天,在北京國際機(jī)場,我安慰我媽說,“沒事,明年暑假我就回來啦”,萬萬沒想到,一直忙忙碌碌,一去就是 5 年…… 可能是初次留學(xué)的興奮,十幾個(gè)小時(shí)的飛行,感覺很快就過了,到了 JFK 機(jī)場,坐上紐約特色的黃色的士。去學(xué)校路上,先是皇后區(qū)的平房,后來到了曼哈頓,深磚紅色的高樓,跟想象中的國際大都市并不大一樣,倒很有歷史厚重感,日后想想也是,紐約也不能到處都如時(shí)代廣場那般呀。

          接著,辦入住,搞衛(wèi)生,小憩了一會(huì)兒,傍晚出去門口的超市買點(diǎn)吃的;第一次從 112 街,走到 Broadway 上,看著熙熙攘攘的外國人面孔,很傻的竟然笑了出來… 那會(huì)兒自然是極開心的,就是一個(gè)毛頭小子,充滿了對未來生活期待的樣子(哎,回不去的青春啊);當(dāng)然了,怎么也沒想到,接下來的一年,會(huì)如此艱難……


          1.2 差距

          開學(xué)后一系列事情,一下子讓我清清楚楚地,看到自己跟師兄們比,各個(gè)方面有著很大的差距。且不說核心業(yè)務(wù)能力了,首當(dāng)其沖自然是語言環(huán)境的變化。

          一天路上,一小哥對著我說:How are you?我想,這不是新概念英語上的經(jīng)典對話嗎,難道我真要回傳說中的 I’m fine, thank you, and you?從那兒之后,我知道了,how are you 就相當(dāng)于,吃了么您吶,并不是真的問什么,而是打招呼,跟 say hi 差不多,一般回 good good 就可以了,甚至不回,直接也回對方 how are you 都行。

          然后到了第一天來 lab,正好 Y 來面博后,老板讓他給個(gè) talk,Y 希臘口音的英語,再加上講的內(nèi)容涉及一些專業(yè)術(shù)語,幾十分鐘我?guī)缀跬耆珱]聽懂他說什么;會(huì)后跟他一對一 meet,更是尷尬的很… 后來 18 年來 FB 實(shí)習(xí),巧了 Y 是我 mentor 之一,第一天帶我吃的午飯,我們交流完全無障礙了,他也不記得當(dāng)年還見過我…… 我有個(gè)朋友總結(jié),剛來時(shí)候,跟外國人的交流,是三分靠聽,七分靠猜…… 現(xiàn)如今,即使是印度口音,只要不是說的特別差的,或者我特別不熟悉的東西,都能通暢交流了。感覺這沒啥技巧,首先要敢說,然后多跟不同的人聊天練習(xí),慢慢就好了,倒不必太過擔(dān)心,徒增壓力。但是如果英語不好的話,難以跟外國專家合作,融入核心科研圈子,對長遠(yuǎn)的發(fā)展耽誤很大,盡量在 1-2 年內(nèi)做好這個(gè)提升。

          1.3 讓老板知道你在干活

          因?yàn)槲沂潜究飘厴I(yè)直博,剛讀博那會(huì)兒,思維里還是默認(rèn),導(dǎo)師是教育培養(yǎng)學(xué)生的角色,指導(dǎo)學(xué)生做出成績;明白但沒有深刻認(rèn)識到,博士生與導(dǎo)師還有雇傭關(guān)系。第一個(gè)學(xué)期,我主要是跟著師兄們做,跟導(dǎo)師大概一個(gè)月 meet 一次,每周有 weekly report。開學(xué)時(shí),老板把我分給一個(gè)師兄帶,參與他的項(xiàng)目 A,是個(gè)很好的學(xué)習(xí)機(jī)會(huì),但是發(fā)不了 paper。

          11 月,CVPR 投稿的季節(jié),另一個(gè)師兄找到我?guī)兔ψ鲰?xiàng)目 B,這個(gè)項(xiàng)目準(zhǔn)備投 CVPR,做出來的話可以 co-author。于是我那段時(shí)間都撲在做 B 上,終于實(shí)現(xiàn)了其中一個(gè)核心的模塊。CVPR 投稿完的那周,正好導(dǎo)師約 meet,我想 B 的事情做完了,下面精力就都是做原本的 A 了,meet 對我來說,主要目的是確定下接下來的 plan 唄。正好搞 CVPR 之前,項(xiàng)目 A 的師兄讓我 reproduce 一篇 nips 文章的方法,用到項(xiàng)目 A 的 data 上,于是,我準(zhǔn)備的 slides 主要介紹那篇 nips 和怎么用到項(xiàng)目 A 上。結(jié)果 meeting 結(jié)束,導(dǎo)師很不高興,覺得我這幾周沒有 progress。記得那天導(dǎo)師辦公室沒開燈,冬天下午五點(diǎn)的紐約,天已經(jīng)黑了,周圍一片黑壓壓的,更顯壓抑。

          我當(dāng)時(shí)挺驚訝的,因?yàn)樵€以為在導(dǎo)師印象中,是我參與了 B 的 CVPR 投稿,很 impress 呢。我后來仔細(xì)反思了下,雖然這幾周我對 B 也算是嘔心瀝血,weekly report 里也有提,但是,一來我只是 coauthor,對于 B 工作整體而言算不上 main contributor;二來導(dǎo)師很忙,不能 assume 對方完全了解并且記得你做過的一點(diǎn)一滴。同時(shí),我也明白了這個(gè) meeting 的目的既是討論 research ideas,但也是 review progress,我首先得讓導(dǎo)師明白,我這段時(shí)間有在好好干活。現(xiàn)在的我,不會(huì)只提項(xiàng)目 A 之后我想怎么做,會(huì)同時(shí)準(zhǔn)備一頁 slide 總結(jié)下我對 B 的貢獻(xiàn)。

          1.4 自己的感受沒那么重要

          我們系第一個(gè)學(xué)期末就要博士資格考試。這個(gè)考試,各個(gè)學(xué)校稱呼不同,大概就是博士生通過這個(gè)考試,才證明有能力,qualify 繼續(xù)讀博士。我們系給大家兩次機(jī)會(huì),第一學(xué)期末第一次考,沒通過的第三學(xué)期末再考一次,要是還沒考過,就只能卷鋪蓋走人了。而且這考試還真不是走過場,每次大概掛三分之一的人,所以真真切切見到周圍有人因?yàn)?qualify 沒過走人的。

          我本科學(xué)的 CS,博士因?yàn)?fellowship 是 EE 發(fā)的,所以在 EE 系。這可愁壞我了,因?yàn)榭嫉氖?EE 的基礎(chǔ) topics,電路,DSP,網(wǎng)絡(luò)啥的我大都一竅不通。于是第一個(gè)學(xué)期的課,我選了門 DSP,準(zhǔn)備好好從頭學(xué)。這是硬課,再加上平常主要精力還得放在 lab 的項(xiàng)目上,第一學(xué)期壓力巨大。記得有一天,晚上睡覺做了噩夢,夢到不知什么怪物,驚醒,醒來想到各種 tasks 各種 due,頓時(shí)只想繼續(xù)回到夢中,相比而言,還是怪物比較可愛…… 這時(shí)候,只好把自己的感受擱置一邊,累、苦,想這些又有什么用呢,只能更加平添煩惱。該做什么就去做,告訴自己干就完了,結(jié)束后反而發(fā)現(xiàn),過程其實(shí)也就那樣,有時(shí)候我們只是過度看重了自己的感受,夸大了困難的程度,其實(shí)自己的感受沒那么重要,只要身體本身還撐得住。

          qualify 考試在 1 月初。12 中旬,忙完了期末考試,去 Chinatown 吃了頓好的,回家看了部電影,然后跟導(dǎo)師請好假,專心復(fù)習(xí) qualify。大概有三周的復(fù)習(xí)時(shí)間,除了 DSP,其他的 topics 完全從零開始學(xué)。后來覺得,這考試的目的,不是考的知識本身,而考的是學(xué)習(xí)能力。復(fù)習(xí)的過程是很慘了,時(shí)值圣誕節(jié)假期,朋友圈各式各樣在佛羅里達(dá)坐游輪的,迪士尼看煙花的,回國火鍋小燒烤的;而那年的紐約還尤其的冷,家里的暖氣開到最大,還是冷的不行,我只能早出晚歸的去圖書館;路面凍得白花花的,公車開過揚(yáng)起白沙,從家里 112 街到圖書館 114 街只有 5 分鐘,但卻那么漫長;每天幾條褲子疊著穿,有天開始一度冷到零下負(fù)十幾度,我剛出門一會(huì)兒就趕緊回來,在牛仔褲外面又套了件運(yùn)動(dòng)褲…… 所幸最后考試通過了,小秘告訴我竟然考了第三,震驚,真是功夫不負(fù)有心人訥……


          1.5 上課沒那么重要

          第一學(xué)期,選 DSP,純?yōu)榱丝?qualify exam 修的,跟我日后的研究,基本不搭噶。我第一學(xué)期還修了機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)我之前沒有系統(tǒng)學(xué)過,學(xué)完還是受益良多。但為了達(dá)到學(xué)分要求,我博士期間,被迫修了 14 門課,第四年還在上課…… 我的感覺是,CV 是實(shí)踐科學(xué),上課沒那么重要,很多時(shí)候甚至是浪費(fèi)時(shí)間。我覺得值得選課去學(xué)的,可能就是機(jī)器學(xué)習(xí),算法,就夠了。搞 CV 方向的,與其上門 CV,還不如自學(xué)網(wǎng)上教程,親身參與幾個(gè)項(xiàng)目,學(xué)的更快,對書上的知識有更深刻的理解。我覺得上課最大的作用,就是去了解這門學(xué)科,有哪些基本的概念和算法(所謂把 unknown unknown 變成 known unknown),哪天你要用到他們了,需要把 known unknown 變成 known known 的時(shí)候,知道在 Google 里輸入啥關(guān)鍵詞去搜。

          當(dāng)然如果有時(shí)間,上些基礎(chǔ)型的硬課,自然沒啥;但對于博士生,時(shí)間本就緊張,就得做做平衡了,選些 seminar 的課比較好,一般主要就是讀論文,做 project。我后面陸陸續(xù)續(xù)帶了很多低年級的學(xué)生,很多人學(xué)期伊始,覺得要多學(xué)些知識,選的都是硬課,學(xué)期過半,發(fā)現(xiàn)作業(yè)做不完,科研沒時(shí)間,兩頭耽誤,都是后悔不已…

          2. 方向比努力重要


          2.1 PhD 選題

          第一學(xué)期在課業(yè),科研,qualify 考試,適應(yīng)國外環(huán)境,種種碾壓之下,總算過去了…… 雖然痛苦,但只是工作量大,努力使勁就好了…… 第二個(gè)學(xué)期開始,2015 年于我,關(guān)鍵詞是迷茫,努力努力但怎么也使不上勁的那種……

          第二學(xué)期開始,重心主要集中在 research 上了,跟導(dǎo)師的 meeting 也從一月一次變成了每周一次,有幸得導(dǎo)師親自調(diào)教各種真正做科研的能力了。導(dǎo)師給我定了個(gè)新的項(xiàng)目,深度學(xué)習(xí)下的 incremental learning。這其實(shí)是個(gè)很難的問題,現(xiàn)在 5 年后來看,都沒有被很好的解決;亦沒有一個(gè)標(biāo)準(zhǔn)的 benchmark,也就是說,其實(shí)大家還沒有定義好這個(gè)問題;記得導(dǎo)師那會(huì)兒說,if you can formulate this problem,這個(gè)問題就已經(jīng)解決 70% 了。

          結(jié)果忙忙碌碌幾個(gè)月,研究了很多文獻(xiàn),做了很多實(shí)驗(yàn),還是沒有太大的進(jìn)展,就是感覺很迷茫了,不知道下一步該干嘛。幸運(yùn)的是,到 5 月份,導(dǎo)師讓我跟師兄一起參加一個(gè)叫 THUMOS 的比賽,這其實(shí)又是個(gè)新的項(xiàng)目了;開始我還覺得,已經(jīng)忙不過來了,哪有時(shí)間再多一個(gè)項(xiàng)目,后來慶幸參與了這次比賽,開始了我做 video 這個(gè)方向的科研生涯。

          那會(huì)兒 video 領(lǐng)域,大家主要做 classification,而且是幾秒的短視頻;THUMOS 是長視頻,而且不光有 action classification task,還要一個(gè) task 是 action detection,檢測你所感興趣片段的開始 / 結(jié)束時(shí)間。參加比賽時(shí),我跟著師兄主要搞 classification,邊做邊學(xué),上手了處理視頻的模型和框架,收獲很大。比賽完后,我發(fā)現(xiàn) classification 大家搞的火熱,而 detection,同樣很重要的一個(gè)課題,卻沒有人研究過基于深度學(xué)習(xí)的方法,于是就有了我的第一篇 CVPR 文章,收到了很多 follow-up。我自己也算是找到了自己的研究方向,不再迷茫。

          我覺得這段經(jīng)歷,對新手很有參考價(jià)值,很多時(shí)候光努力不夠,方向更重要。新手如何選博士幾年的 topic,有兩個(gè)問題值得思考

          能不能快速上手?有幾個(gè)簡單的評判標(biāo)準(zhǔn):

          • state-of-the-art 的 paper 有沒有開源的代碼?目的是你能迅速復(fù)現(xiàn) baseline,熟悉整體 pipeline(如怎樣預(yù)處理,后處理),加深對實(shí)現(xiàn)和細(xì)節(jié)的理解

          • 有沒有對這個(gè) topic 有 hands-on 經(jīng)驗(yàn)的師兄,或者 community 里面 approachable 的前輩?目的是,當(dāng)你遇到實(shí)現(xiàn)上的細(xì)節(jié)問題,可以及時(shí)咨詢和得到反饋

          • 這個(gè) topic 有沒有比賽,或者標(biāo)準(zhǔn)的 benchmark?目的是,有大家已經(jīng)定義好的數(shù)據(jù),實(shí)驗(yàn) setup,評價(jià)標(biāo)準(zhǔn);這樣,你有可以直接比較的 baseline,outperform baseline 的時(shí)候也容易被人認(rèn)可


          能不能有大的 impact?這里我指的是博士期間的大方向,由一系列單項(xiàng)的工作或者 paper 構(gòu)成。單篇 paper 通常有三種類型:(1)First work:開創(chuàng)了一個(gè) topic,比如 RCNN 于 object detection(2)Last work:基本解決了一個(gè) topic,比如 Faster-RCNN,YoLo 于 object detection(3)Improve 類型,介于 First 和 Last 之間的。

          Last 很難,Improve 常見但影響力不夠深遠(yuǎn),對于新手而言,博士的早期工作,在有能力做出來和有 impact 之間的 trade-off 比較好的,估計(jì)是 First 了,不一定非要是第一篇,只要是某個(gè) topic 里面開創(chuàng)性工作的那一批之一,都是不錯(cuò)的。這個(gè)早期工作之后,你會(huì)對這個(gè)問題哪里要改進(jìn),有很清楚的認(rèn)識,因?yàn)?improvement room 大,也會(huì)有很多 ideas。同樣,早期的時(shí)候怎么選這樣一個(gè) topic 呢:相關(guān)的比賽是這一兩年新開的嗎,相關(guān)的 benchmark 是這一兩年出來的嗎,上面的結(jié)果提升空間大嗎(現(xiàn)在是 20% 還是已經(jīng) 80% 了)?

          2.2 單篇 Paper 選題


          前面說的 PhD 選題是大方向上的,具體到每一篇 paper,選擇的 principle 和重點(diǎn)則不太一樣。來 Facebook 后從馬爺爺那知道了一個(gè)著名的 Heilmeier 問題系列,是指導(dǎo)老師們申項(xiàng)目的,我覺得稍微改改,便很適用于我們考慮,某一篇 paper 的選題,合不合適:

          1. What are you trying to do??Articulate your objectives using absolutely no jargon.

          2. How is it done today, and what are the limits of current practice?

          3. Who cares??[Support other’s research? Shape research landscape? Power applications in industry?]

          4. What's new in your approach?and why do you think it will be successful?

          5. If you're successful,?what difference will it make??[e.g. Contributions in theory/modeling? Improve accuracy by 5% on dataset A, B, C…?]

          6. What are the risks and the payoffs? [Further, how would you mitigate the risks? If your proposed method does not work, what could be alternative design? These can end up as discussions such as ablation studies in your paper.]

          7. How much will it cost? [e.g. How many GPUs do your experiments require? How long is each training process? How about data storage?]

          8. How long will it take? [How many hours are you going to work on this per week? When is the submission DDL? Can you make it?]

          9. What are the midterm and final "exams" to check for success?


          3. 談?wù)?Presentation


          Presentation 分為做報(bào)告,還有就是寫 paper

          3.1 談?wù)勛鰣?bào)告

          14 年,剛來哥大那會(huì)兒,每周五是我們組會(huì),導(dǎo)師讓我在組會(huì)上 present RCNN,這是我第一次給導(dǎo)師作報(bào)告,而且是在全組面前報(bào)告,自然想要好好表現(xiàn)。我對 object detection 之前完全沒了解過,于是 paper 讀了一遍又一遍,文中用到的前人技術(shù)不懂,便找到前人的文章去學(xué)怎么回事。感覺自己學(xué)到好多,自我感動(dòng),覺得花了這么大工夫,一定到時(shí)候會(huì)讓導(dǎo)師刮目相看。

          結(jié)果就是啪啪打臉:導(dǎo)師極其嚴(yán)謹(jǐn),當(dāng)我解釋了 A,解釋了 B,問我已經(jīng)有 A 了為啥還要 B;我大腦一片空白,嘗試著解釋了半天,導(dǎo)師表示聽不懂,這是可想而知的,因?yàn)槠鋵?shí)我自己也并沒有搞清楚為啥;當(dāng)時(shí)自己讀 paper 的思維模式其實(shí)只是,memorize 怎么做怎么做,但沒有去搞清楚要這么做背后的原理;另外當(dāng)時(shí) slides 準(zhǔn)備的也不夠好??傊Y(jié)果是,這次報(bào)告搞砸了。還好事后,師兄們繼續(xù)跟我討論,讓我對技術(shù)原理有了更深刻的認(rèn)識;有的師兄更用親身經(jīng)歷安慰我,說當(dāng)年他剛來的時(shí)候,第一次匯報(bào)工作連 slides 都沒做,干講,導(dǎo)師自然也是沒能聽懂。

          之后幾年,從導(dǎo)師身上學(xué)到了很多 presentation 的技巧:

          • 如果可能的話,事先了解你的聽眾背景,是跟你做同一個(gè) topic 的,還是同一個(gè)大領(lǐng)域但不同 topic 的,還是完全其他專業(yè)背景的。需要根據(jù)聽眾背景,定制和調(diào)整:比如,需不需要多介紹些背景?需不需要更深入技術(shù)細(xì)節(jié)?等等

          • 一頁 slide 盡可能 focus 在一個(gè)點(diǎn)上,不要信息量過大,否則聽眾很容易 lost

          • 盡可能多用圖片表達(dá),不要大段大段的列文字,A picture is worth a thousand words

          • 上面這兩點(diǎn),其實(shí) principle 都是盡量讓要講的內(nèi)容簡單明了,因?yàn)楹芏鄷r(shí)候我們在聽 talk,這樣被動(dòng)接受的時(shí)候,接受新知識的能力是比主動(dòng)接受時(shí)候(比如看 paper)低的。

          • 當(dāng)聽眾問問題的時(shí)候,If you don’t know the answer, just say don’t know.

          • 如果是跟 mentor 日常討論的 slides,因?yàn)闀?huì)討論到很細(xì)節(jié)的東西,有些圖 PPT 畫起來,很花時(shí)間,而且通常這樣細(xì)節(jié)的圖還挺多,所以可以就 ipad 上面手畫一畫,截個(gè)圖放到 PPT 里就好了;如果是正式一點(diǎn)的 presentation,寫 slides 跟寫 paper 的 principle 有點(diǎn)像,不要太 focus 在細(xì)節(jié)上,更重要的是講清楚 motivation,為什么這樣設(shè)計(jì),細(xì)枝末節(jié)的不關(guān)鍵的內(nèi)容,放在 backup slides 里面。


          19 年 CVPR,Doctoral Consortium 有幸 mentor 是斯坦福的一位大牛教授,她也提到了 presentation 的重要性,說她們 lab 有個(gè)開玩笑的說法,一份 slides 交給她去改,no pixel left…… 為了分享如何能讓報(bào)告聽起來有興趣,她畫了下面這張圖,讓聽眾情感(亦是興趣高低,注意力程度)隨著時(shí)間的變化,有三個(gè)高潮:首先,介紹你的問題,通常這時(shí)候大家都會(huì)引發(fā)興趣;但聽著聽著大家注意力就不集中了,這時(shí)候就到了圖中第一個(gè)低谷,這時(shí)候需要指出來這個(gè)問題有哪些 challenge,大家的興趣就又被激發(fā)了;等大家興趣來了,精力集中的時(shí)候,介紹你的一部分工作 work 1;等介紹完第一個(gè)工作,大家又疲勞了,這時(shí)候指出來,即使有這個(gè) work 1,問題還不能被解決,因?yàn)橛?remaining challenge;接著大家又被調(diào)動(dòng)了興致,可以開始介紹 work 2。


          3.2 談?wù)剬?paper

          在 2.2 里面講了對某一篇 paper,如何選題和做規(guī)劃。那真的到了寫 paper 的時(shí)候,我自己有幾點(diǎn)如何讓文章寫的更好的體會(huì):

          • 先給一個(gè) Talk。寫 paper 最難的是構(gòu)思 storyline,而最好的完成這一步的方法就是先對你的工作做一個(gè) slides,給周圍的人 present 一遍。這個(gè)過程中,你會(huì)梳理好自己的思路,畫好文中的 figure,準(zhǔn)備好實(shí)驗(yàn)結(jié)果的 table,周圍的人還可以給你提意見,幫助你完善,等這個(gè) talk 給完了,后面寫 paper 就會(huì)順暢自然了。其實(shí)我現(xiàn)在,如果準(zhǔn)備投一個(gè) paper,當(dāng)做了一段時(shí)間后,就會(huì)按照最終 presentation 的思路,準(zhǔn)備 slides,用在每周給老板們 report 時(shí)。開頭先快速 review 一下做的 task 和提出的方法,remind 一下 context,然后重點(diǎn) focus 在那周做的新東西上,所以每周匯報(bào)的 slides 可能 80% 都是跟上一周一樣的,然后新的方法和實(shí)驗(yàn)結(jié)果的那幾頁 slides 是新的,有比較多的細(xì)節(jié)。

          • 用 Google doc 做語法檢查。剛寫好的 paper 有 typo 和語法錯(cuò)誤是很難避免的,但常常會(huì)被 reviewer 揪著不放。大家寫 paper 如今大都在 overleaf 上,但 overleaf 的查錯(cuò)還是不夠好,建議可以寫完 paper 后,貼到 Google doc 里面。幾年前開始,估計(jì)是由于 deep learning 對 Google NLP 的改進(jìn)很大,感覺 Google 自動(dòng)改的質(zhì)量已經(jīng)非常高了。

          • Rationale 很重要。不光是要講清楚你怎么做的,更要 justify 你問什么這么做;不光要講你的結(jié)果比 baseline 好,更要解釋為什么好;讀者看到的不應(yīng)是一個(gè) “使用手冊”。有時(shí)候我們寫 paper,花了很多篇幅寫了很多實(shí)現(xiàn)細(xì)節(jié),但是更重要的是,解釋 “為什么”,這個(gè)背后的邏輯和 insights。

          • 大部分 paper 都是提出一個(gè)新的方法,這類方法型 paper?似乎都可以套下面這個(gè)框架:




          • Introduction:可以分為以下幾個(gè)部分:


          • Problem definition

          • Previous methods and their limits

          • 簡單描述你是提出了什么技術(shù)來 overcome 上面的 limits

          • 一個(gè)圖,非常 high-level 的解釋前人工作的 limits 和你的工作怎么解決了這些 limits,最好讓人 30?秒內(nèi)完全看懂

          • 最后一段如今大都是,In summary, this paper makes three contributions: First work to 解決什么 limits;提出了什么 novel 的技術(shù);outperform 了 state-of-the-art 多少


          • Related Work:一般三五個(gè) subsection,分別 review 下相關(guān)的 topics,同樣不光講 previous work 做了啥,更要講自己的方法跟前人工作有啥不同




          • Method


          • 這是文章的主體,按照你覺得最容易讓別人看懂的方式來講

          • 可以第一個(gè) subsection 是 overview,formulate 一下你的 problem 給出 notation,配一個(gè)整體 framework 的圖,圖里面的字體不能太大或者太小看不清,要有些細(xì)節(jié),讓人光看圖就能明白你的方法是怎么回事,但不要過于復(fù)雜,讓人在不超過 2 分鐘的時(shí)間看完這張圖

          • 然后幾個(gè) subsection 具體介紹你的方法或者模型;如果 testing 跟 training 不太一樣,最后一個(gè) subsection 介紹 inference 時(shí)候的不同,通常是一些 post-processing 操作



          • Experiment


          • Datasets

          • Implementation details such as pre-processing process, training recipe

          • Evaluation metrics

          • Comparisons with state-of-the-art

          • Detailed analysis

          • Alternative design choice exploration

          • Ablation studies

          • Visualization examples


          • Conclusion (and Future Work)


          • Abstract:是全文的精簡版,建議在 paper 寫完第一稿差不多成型了,有定下來的成熟的 storyline 了,再去寫 abstract;大概就是用一兩句話分別概括 paper 里面每個(gè) section,然后串起來


          另外 paper 提交時(shí)候,可以交 supplementary materials,雖然 reviewer 并不被要求強(qiáng)制看這個(gè),但其實(shí)給我們機(jī)會(huì),去 include 更多文章技術(shù)細(xì)節(jié)、實(shí)驗(yàn)結(jié)果的好地方;在后面 rebuttal 階段,通常篇幅有限制,但如果你已經(jīng)在?supp 里面未雨綢繆,可以省很多空間,refer reviewer 去看你 supp 里面的內(nèi)容就好了。

          說到 rebuttal,我還是比較幸運(yùn)的,從導(dǎo)師那學(xué)到很多。導(dǎo)師已經(jīng)是功成名就,業(yè)界泰斗那種,起初我以為他這個(gè)級別會(huì)對我們是放養(yǎng);但我在哥大投自己第一篇一作 paper 的時(shí)候,導(dǎo)師可以說是手把手帶我入門了。還記得 16 年 CVPR review 出來后,導(dǎo)師找我討論 rebuttal,我那會(huì)兒對寫 rebuttal 并沒有什么經(jīng)驗(yàn),也不知道可以用 R1 代表 review 1 等等。那天 meeting 開始已經(jīng)晚上 7 點(diǎn)了,估計(jì)導(dǎo)師還沒吃飯,我兩就挨著坐在他辦公室里,對著他的電腦,討論 reviewer 提的一個(gè)一個(gè)問題。因?yàn)楹芏鄷r(shí)候其實(shí) reviewer 表達(dá)問題并不準(zhǔn)確,他教我分析每個(gè)問題背后 reviewer 真正關(guān)注的點(diǎn)是什么。邊討論,導(dǎo)師邊直接敲下我們討論的 notes,meeting 完后,我看這 notes 基本上就可以算是個(gè) rebuttal 的初稿了,比我 meet 前準(zhǔn)備的 draft 強(qiáng)多了……

          4. 記四次開會(huì)



          2016 年,拉斯維加斯。

          博士期間我參加了四年的 CVPR,這是我們行業(yè)的盛事了。學(xué)術(shù)會(huì)議通常,主會(huì) 3-4 天,有 oral 環(huán)節(jié),大家可以聽臺上人輪流做報(bào)告,有 poster 環(huán)節(jié),一個(gè)大場館列滿一排排的 poster stand,每篇 poster 有作者在旁邊講解和答疑,oral 和 poster 環(huán)節(jié)交替進(jìn)行。大場館在 poster 周圍有各個(gè)公司的展臺,一方面展示技術(shù),一方面更多是在招人。主會(huì)前后一兩天,有 tutorial 和 workshop,通常會(huì)有大佬來介紹最新的工作,因?yàn)楝F(xiàn)在 paper 大家很多早就掛在 Arxiv 上看過了,很多人覺得 workshop 比主會(huì)更有聽的價(jià)值。

          若用一個(gè)詞形容 16 年參加 CVPR 的體驗(yàn),那就是興奮了。首先 Vegas 就足夠讓人興奮了,一座沙漠中建起來的夢幻城市,各式各樣的酒店,威尼斯人,凱撒皇宮,艾弗爾鐵塔,每換一個(gè)酒店就像到了一個(gè)新的國家。三年后畢業(yè)旅行,我?guī)О謰寔?,故地重游依舊是很驚艷。


          然后這也是第一次見到許多業(yè)界大佬們的真身。當(dāng)時(shí)在灣區(qū)實(shí)習(xí),候機(jī)的時(shí)候就發(fā)現(xiàn)周圍都是同行。第一天晚上跟著師兄逛賭城大道,一個(gè)很高的老外來跟我們打招呼握手,我后來才意識到是現(xiàn)在在 Tesla 的 Andrej,之前本科的時(shí)候還郵件問過他 DBN 的問題,沒想到竟然是他… 后面陸陸續(xù)續(xù)看到各種在 Paper 上面名字很熟悉的真人,很興奮了…

          這次開會(huì),我才知道了,開會(huì)的目的不光是聽報(bào)告學(xué)知識,也是 social 認(rèn)識人的機(jī)會(huì),我們需要融入到這個(gè) community 里去。從優(yōu)秀的人身上我們可以學(xué)到很多;每人各有所長,有機(jī)會(huì)合作的話,可以雙贏;每個(gè)人都有盲區(qū),需以他人為鏡。而這些的前提就是,你要成為這個(gè)優(yōu)秀圈子的一員,跟他們有交流。當(dāng)時(shí)杜老板剛畢業(yè)加入 Facebook,因?yàn)槲业墓ぷ骰谒闹暗?C3D,在路上看到他,鼓起勇氣跟他打了個(gè)招呼,杜老板很 nice 的跟我聊了一會(huì)兒,也是從那之后跟他們組有了些合作,我去年畢業(yè)后也加入了這個(gè)組。

          不過那年,我對 social 的認(rèn)識也就僅限于此了,我甚至不知道公司還有 party。不過好處是認(rèn)識的人不多,沒有太多的招呼要打,可以集中精力開會(huì)學(xué)習(xí),這一年算是我開會(huì)最認(rèn)真的一年了,基本上把所有 poster 都過了一遍。另外,我也是第一次講 poster,這個(gè)環(huán)節(jié)一般兩小時(shí),站著不停說話其實(shí)蠻累的,建議可以備點(diǎn)零食,水在旁邊。

          2017 年,夏威夷。

          感謝組織,第二年又免費(fèi)去了個(gè)度假勝地…… 不過這一年,因?yàn)橐呀?jīng)入行了,開會(huì)過程很忙碌。這年有幸中了篇 oral,導(dǎo)師很重視,前后 slides 改了很多遍,rehearsal 了好幾回。為了聽眾體驗(yàn)比較好,可以看著聽眾有眼神交流,同時(shí)看起來 professional,導(dǎo)師要我脫稿。從西雅圖飛夏威夷的飛機(jī)上,就一直在背稿子,然后一直反復(fù) rehearsal…… 報(bào)告前還是很緊張忐忑的,臺下坐著得有一千人,講 12 分鐘,3 分鐘 QA,不過上臺后似乎因?yàn)榧芯υ趫?bào)告本身,反而淡定了…… 話說這種事情,感覺都是第一次很緊張,經(jīng)歷過了,以后就好了;記得第一年只是做 poster 展示,我事前也很緊張,但經(jīng)歷過后,這第二年做 poster 展示時(shí)就非常淡定了。

          報(bào)告給完后,因?yàn)樽詈笠惶煊袀€(gè) workshop 要給個(gè) talk,slides 還沒做,只能繼續(xù)宅在酒店準(zhǔn)備…… 悲催的整個(gè)開會(huì)期間,很多時(shí)間都呆在酒店,都沒啥時(shí)間出去轉(zhuǎn)轉(zhuǎn),只能默默給大家朋友圈點(diǎn)贊,也沒有機(jī)會(huì)向第一年一樣認(rèn)認(rèn)真真看 poster 了…… 所以很佩服大佬們,他們又要到處給 talk,要跟各種人 meet,是怎么安排開會(huì)時(shí)間的……

          前面說到公司 party,在會(huì)議期間晚上,一般大公司都會(huì)組織自家的 party 供大家 social。雖然很多時(shí)候是大型尬聊現(xiàn)場,但公司很多員工會(huì)來,為來年招 intern 或者正式員工做宣傳;很多學(xué)生會(huì)來,可以了解不同的組做些什么,有沒有 headcount,intern 有沒有 returning full-time offer;當(dāng)然,還有就是有 free food 包晚飯,而且 Party 的場地很多時(shí)候是有特色的景點(diǎn),印象中去年,微軟是在一艘大輪船上(感謝張老師 carry),F(xiàn)acebook 是在水族館。

          很多時(shí)候這些 party 為了控制人流量,會(huì)要求 invitation。會(huì)議前公司們會(huì)給你發(fā)郵件 invite,可能是 HR 看到你要來 present paper,可能是某個(gè)公司 researcher 想要跟你面對面聊聊,也可以你直接聯(lián)系公司的朋友,提前把你加到 list 上。有時(shí)候沒有 invite,有認(rèn)識的公司朋友,也可能直接帶進(jìn)去,或者人不多了,就直接不限制了。另外,第一年開會(huì)的新人,可能看到別人去 Party 自己沒有 invite 會(huì)失落,但其實(shí) duck 不必哈,找上落單的小伙伴,去周圍景點(diǎn)好好玩玩,這可能是今后所有開的會(huì)里,可以自由支配晚上的時(shí)間,想去玩啥就玩啥,不用去尬聊的唯一一次了,好好珍惜!

          2018 年,鹽湖城。

          這一年我博士第四年結(jié)束,開會(huì)的主要任務(wù)就是找工作了。前面說到,poster 場館有很多公司的展臺,前兩年我也就去拿拿文化衫就走了,這一年則不然,因?yàn)檎古_有 HR 給你介紹公司的招聘流程,當(dāng)場收簡歷,也有站臺的員工,可以直接了解他們組的情況。當(dāng)然,這樣可能還是比較 general 的招聘,即使有員工,很可能跟你也不是做同一個(gè)小方向的,一般來說大公司里面偏 production 的組在這里認(rèn)識的機(jī)會(huì)比較多;如果想找偏 research 的組,還是通過你 paper 認(rèn)識你的同行,師兄弟朋友們的介紹,效率相對高些,可以約他們在展臺或者 Party 上見面聊。對于找 postdoc 的同學(xué),很多老師會(huì)約在開會(huì)期間見面,甚至面試,所以可以提前 reach out 約好。

          2019 年,洛杉磯長灘。

          洛杉磯也是我很喜歡的一個(gè)城市,因?yàn)槲乙恢庇袀€(gè)影視夢,所以很喜歡好萊塢,這大概就是我為什么堅(jiān)定做 video 方向的初衷了。長灘其實(shí)離 LA 市區(qū)挺遠(yuǎn)的,算是一個(gè)度假小城市了,甚至有自己的機(jī)場。長灘市最著名的景點(diǎn)就是 literally 的長灘了,有很多游艇一列一列地停著,蠻壯觀的。


          19 年這會(huì)兒我已經(jīng)畢業(yè)了,剛加入 Facebook,不用逛公司了解找工作的情況,倒是又可以認(rèn)認(rèn)真真開會(huì)了。另外,對于畢業(yè)生,會(huì)有個(gè) Doctoral Consortium,強(qiáng)烈建議申請,他們會(huì)組織畢業(yè)生和業(yè)界大佬一對一吃飯,是個(gè)很難得的學(xué)習(xí)機(jī)會(huì),畢竟除了自己導(dǎo)師,很少有其他老師能花一個(gè)小時(shí)跟你單獨(dú)聊各種 research 和 career 上的問題了吧。

          5. 記三次實(shí)習(xí)



          2016 年,博二暑假,灣區(qū),Santa Clara。

          來紐約連軸干了兩年,暑假要去師兄在加州的 start-up 幫忙,總算要換一種生活方式了,開心!那會(huì)兒對傳說中的硅谷還沒有概念,還不知道 San Jose(圣何塞)J 發(fā) H 的音。因?yàn)榧~約就是跟所有國際大都市一樣,高樓大廈生活便利,其實(shí)沒有體驗(yàn)過典型的,所謂美帝鄉(xiāng)村生活;灣區(qū)則是,住宅區(qū)里一棟棟的自家 house 挨著,四層就算是高樓了,每一片兒有個(gè) plaza,聚集各種飯店超市;到灣區(qū)第一天,被感嘆說像是第一天來美國的……

          這次實(shí)習(xí)很短,兩個(gè)月,因?yàn)槭?start-up,工資不高;租的地方?jīng)]有床,睡了兩個(gè)月地鋪,住家附近有條小河,蚊蟲很多,對蟲子極度反感的我在地鋪上整了個(gè)蚊帳;天天上班打車是打不起的,只好買了輛自行車騎車上班,單程半小時(shí)還好,天氣炎熱也還好,最恐怖的是在一個(gè)上高速分叉口,得過個(gè)馬路,沒有紅綠燈,只能招手示意,過來的車常有大貨車,而且車流量大,經(jīng)常得攔下一列車,每次都膽戰(zhàn)心驚……

          不過整體工作生活還是充滿新鮮感的。工作上是純 production,了解了很多 prod 的 system design;雖然早九晚七,但不用像在學(xué)校搞 research 晚上和周末還要加班,所以覺得很輕松;師兄們?nèi)艘埠芎茫瑤е覀內(nèi)ミ^了優(yōu)勝美地,三番市區(qū)玩??傮w感覺就是讓我緊繃的科研神經(jīng)放松了一段時(shí)間,也了解了另一種很不一樣的美帝生活,習(xí)慣了吃早茶,印度菜,越南粉。

          2017 年,博三暑假,西雅圖,Redmond。

          這個(gè)暑假是過去幾年里,過的最開心也收獲很大、非常充實(shí)的一個(gè)暑假了。這一年在微軟,是 research intern;大公司確實(shí)流程比較正規(guī),開始的時(shí)候有 orientation 帶你入門,公司各種 facility 也是不錯(cuò)。

          我的 mentor 已經(jīng)是很 senior 了,是組里的 manager,但還是非常 hands-on,自己還寫 code 做實(shí)驗(yàn),所以對技術(shù)的見解非常深入;人也很 nice,甚至還有時(shí)幫我一起 debug 算法,學(xué)習(xí)到很多。當(dāng)時(shí)我在一個(gè)華人比較多的組,其他的 full-time 也很 nice,我們工作上有問題都耐心跟我們討論,生活上帶我們嘗試各個(gè)樓不同的午餐。我們在的是 99 號樓,都說 99 很難吃,導(dǎo)致我至今還沒嘗過 99 的午餐…… 組里每周會(huì)有 intern 輪著做 presentation,介紹自己的進(jìn)展,大家都很自覺,所以,雖然說大家都很 nice,但因?yàn)橄胍谶@三個(gè)月里做出東西來,自己給自己的壓力還是比較大的。這種壓力我覺得是好的,積極的壓力。

          這次實(shí)習(xí)后,我就習(xí)慣了用 Windows 系統(tǒng),VS 編程,onedrive,自己 macbook 上裝著 Windows(這個(gè)習(xí)慣來 FB 后被打破了,現(xiàn)在又換回來蘋果原生系統(tǒng))…… 微軟沒發(fā)筆記本,而是臺式機(jī),所以周末來公司的 intern 還不少,再加上西雅圖公交系統(tǒng)發(fā)達(dá),去公司很方便,我晚上和周末基本都會(huì)在公司;也因此認(rèn)識了一群小伙伴,因?yàn)槲④浲砩喜蛷d不開,所以常常坐小伙伴的車,去外面一起吃晚飯,然后再回來干活。夏天的西雅圖天氣很好很舒服,二十來度吧,晚上九點(diǎn)多天還是亮的,是全年最好的季節(jié),其他時(shí)候則都是雨季了。

          2018 年,博四暑假,灣區(qū),Menlo Park。

          這一年回到灣區(qū),在 Facebook,體驗(yàn)是最 fancy,最累的一個(gè)暑假了。

          原以為之前我已經(jīng)了解灣區(qū)了,但 16 年其實(shí)是在 Sunnyvale,Santa Clara 這塊,靠東邊,偏熱;18 年 FB 在 Menlo Park,公司公寓在紅木城,這塊靠西邊,溫度跟西雅圖夏天差不多,很舒服,跟 16 年常活動(dòng)的區(qū)域還是有點(diǎn)遠(yuǎn)的。說 fancy 是因?yàn)椋?7 年在微軟,我覺得有免費(fèi)的咖啡和椰子汁就很不錯(cuò)了;來了 FB,好么,喝的吃的種樣繁多,微軟就顯得小巫見大巫了;FB 樓里各種有個(gè)性標(biāo)識的墻,intern program 組織的活動(dòng)也多,認(rèn)識了很多玩得來的小伙伴。在這也學(xué)了很多 “黑話”,什么 movefast 啦,什么 what does success look like 啦……


          但同時(shí)也是最累的一個(gè)暑假了,一來因?yàn)?open space 辦公室,大家都坐在一塊兒,業(yè)界大佬就在身邊,自然也會(huì)想向他們學(xué)習(xí),做的優(yōu)秀;二來 FB 有 mid-term 和 final review,一般你的 mentor 們會(huì)給你寫 feedback,打分,然后有個(gè)叫 calibration 的環(huán)節(jié),上面的老板們會(huì)把所有 intern 放在一起比較,調(diào)整分?jǐn)?shù),要看你跟你的 peers 比怎么樣。所以好幾次,忙到晚上 3-4 點(diǎn),早上 8 點(diǎn)就得起來趕班車……

          6. 沒那么簡單的事


          6.1 Project vs. Paper

          剛?cè)雽W(xué)時(shí),我單純的覺得,好好做 research 就好了;但事實(shí)上,能夠?qū)P淖?research 的時(shí)間其實(shí)是沒有想象的那么多的,是要擠出來的,甚至去開會(huì)回來,報(bào)銷填表準(zhǔn)備材料這種雜事,小事,都得折騰掉好幾個(gè)小時(shí)……

          但更 tricky 的是平衡 project 和 paper 之間的關(guān)系。如果你比較幸運(yùn),有國家的 Fellowship/Scholarship,或者系里的 Fellowship/Scholarship(有的是以 TA 的形式),不用做所謂的 RA,再或者 sponsor 你的 project 是純以發(fā) paper 為 KPI 的,而且并不 care 你做的是什么 topic,那你可能沒有這方面的苦惱。

          但是,通常老師們申請 grant,很多 grant,尤其是金額大的 project,通常甲方心里都有一個(gè)確定的想解決的問題,向老師征求 proposal,即問題的解決方案,proposal 里面會(huì)規(guī)劃好每個(gè)半年甚至每個(gè)季度做什么 task。當(dāng)然,這里說的 project 不包括那種純粹是給外面公司做工程的 project,倒還都是 research project。經(jīng)常項(xiàng)目開始的時(shí)候,因?yàn)?proposal 是以前定好的,如今環(huán)境、state-of-the-art 都不一樣了,跟當(dāng)下情況不符;或者甲方想解決的問題比較 practical,是個(gè)沒有 formulate 好的 research problem,或者不是 community 關(guān)心的偏基礎(chǔ)的 research task。

          舉個(gè)例子,你想做的 topic 是 object detection,community 關(guān)心的 dataset 是 VOC,COCO,但你的甲方關(guān)心的可能是某個(gè)領(lǐng)域的 object detection,比如 detect 某種野生動(dòng)物,比如 detect 不同微生物。經(jīng)常遇到的是,你提出的方法在 VOC,COCO 上面很 work,但在微生物的 dataset 上面效果不佳,這樣雖然可以發(fā) paper,但是 project 卻沒有進(jìn)展。有些項(xiàng)目,在開始的時(shí)候會(huì) fund 好幾個(gè) team,然后讓大家比賽,比如在項(xiàng)目內(nèi)部有個(gè) detect 微生物的 benchmark,讓你們 PK,第一年結(jié)束,淘汰掉最差的那個(gè) team,第二年繼續(xù) PK,再末端淘汰。你要是 project 沒有進(jìn)展,導(dǎo)致你導(dǎo)師的項(xiàng)目被砍了,就問你怕不怕…… 因此,很多同學(xué)就走了另一個(gè)極端,花很多精力做項(xiàng)目,hack 這些 project 的上的 number,很多時(shí)候漲點(diǎn)最快的方法是,collect 更好的 training data,用更復(fù)雜的網(wǎng)絡(luò),漸漸變成了解決工程問題,開發(fā)了個(gè)很牛的系統(tǒng),但是沒有 novelty 發(fā) paper。

          這種情況下,人的本性,會(huì)覺得麻煩,就偏頗一方。但這其實(shí)是偷懶,千萬不可。要 align 雙方的興趣,要注意平衡,trade-off,一方面要 project 有進(jìn)展,對 sponsor 負(fù)責(zé),另一方面更要對自己負(fù)責(zé),發(fā) paper 做有 impact 的工作。比如,盡量 focus 在模型本身,找到有 novelty,在 project benchmark 和學(xué)術(shù)界 standard benchmark 上效果都好的方法。以及,通常一個(gè) project 開始的時(shí)候有很多 engineering 的活兒,可以暫時(shí)放一放純 paper research,等 system 搭起來了,后面就是不斷 improve 核心算法,這個(gè)時(shí)候精力更多放在 paper 這邊。

          拿我自己舉例子,15 年底,我開始 take charge of 一個(gè)新的項(xiàng)目,于是 16 年上半年,基本都在為這個(gè)項(xiàng)目搭初步的 system,從前端網(wǎng)站到后臺數(shù)據(jù)庫,從設(shè)備采購到 system infra,從 object detection 到 multi-modal;等系統(tǒng)差不多搭起來了,我在項(xiàng)目工程上就可以花很少的時(shí)間,也有 progress 去每月 report,于是 16 年下半年,基本在做 paper,當(dāng)然 topic 做的技術(shù)是將來能 improve 項(xiàng)目 system 一個(gè)核心模塊的;到了 17 年上半年,系統(tǒng)要開發(fā)新的模塊,又是花了三個(gè)月在項(xiàng)目工程上;再之后直到博士畢業(yè),都是盡量找到 common interest,一個(gè)新的模型,對 project 的 system 效果有幫助,亦有大的 paper research 價(jià)值。

          6.2 new dataset 和 new task 不是 low-hanging fruit

          剛讀博時(shí)候,受周圍人影響,很多人都說 release 一個(gè)新的 dataset 沒有什么技術(shù)含量,輕輕松松發(fā) paper 還能賺一票引用,是個(gè) low-hanging fruit。但當(dāng)我參與到一個(gè)新的 dataset 的創(chuàng)建過程后,才發(fā)現(xiàn)這是一個(gè)非常 tedious 的工作,有很多的臟活累活,很多細(xì)節(jié)的地方需要考慮。之前 v1 版本 data,可能因?yàn)橐粋€(gè)細(xì)節(jié)沒考慮好,需要重新 collect 或者 annotate,費(fèi)時(shí)又費(fèi)錢,經(jīng)常要迭代好幾個(gè)版本。所以 create new dataset 一點(diǎn)也不簡單,可能比提出一種新方法的 paper,花的時(shí)間還要長。

          同樣,以前以為提出一個(gè)新的 task(所謂挖坑)是個(gè) low-hanging fruit,但真正做過之后才知道,也沒那么容易的。17 年底,導(dǎo)師讓我做 live detection,也就是,只根據(jù)過去和當(dāng)下,監(jiān)測當(dāng)下發(fā)生了什么事件。我發(fā)現(xiàn)之前的工作都沒有很好地 evaluate 這個(gè)問題,formulation 上有問題,實(shí)際做的是 per-frame labeling 或者 early classification,于是決定提出一個(gè)新的 task,專門 evaluate detection 本身。投完 paper 信誓滿滿,結(jié)果被 CVPR 拒了。reviewer 們一方面指出了一個(gè)我之前忽略的點(diǎn),另一方面指出對于有的 application,per-frame 就可以夠用,不能直接說 per-frame 用來 detection 有問題,而僅僅是對于有的應(yīng)用場景,per-frame 用來 detection 有問題。為此,要大改 paper 的定位。過程是痛苦的,但正因這個(gè)痛苦讓工作更加完善,我們才能成長升華,最后這個(gè)工作重投 ECCV 被大家認(rèn)可了。

          對于 new dataset 或者 new task 的工作,怎么樣才能做的盡量完善,減少迭代次數(shù)呢?我的一個(gè)經(jīng)驗(yàn)是,這種項(xiàng)目,盡可能 involve 多的 experienced experts 參與討論,及時(shí)跟大家溝通,collect 不同人的想法。每個(gè)人看問題角度不同,放在一起就會(huì)比較完善,群眾的智慧是大智慧。

          6.3 沒那么難

          說了沒那么簡單的事,再說說沒那么難的事。

          萬事開頭難,難在邁出第一步。當(dāng)開始做 survey 入門時(shí),發(fā)現(xiàn)這么多文獻(xiàn)要看,會(huì)覺得難;當(dāng)想好 idea 準(zhǔn)備去實(shí)現(xiàn),發(fā)現(xiàn)要準(zhǔn)備 data,要實(shí)現(xiàn)的東西一步又一步,會(huì)覺得難;當(dāng)開始寫 paper,構(gòu)思完每個(gè) section,發(fā)現(xiàn)這么多內(nèi)容要寫,會(huì)覺得難……

          但實(shí)際上,當(dāng)我們一點(diǎn)一點(diǎn)去完成的時(shí)候,會(huì)發(fā)現(xiàn)完成的速度遠(yuǎn)比我們想象的快,文獻(xiàn)一個(gè)星期可以看完經(jīng)典從而入門,paper 一個(gè)星期可以有個(gè)初稿,idea 實(shí)現(xiàn)起來一個(gè)星期可以 coding 完,甚至跑出實(shí)驗(yàn)結(jié)果…… 其實(shí)沒那么難,就是耐下性子,腳踏實(shí)地,干就完了。

          7. 畢業(yè)后何去何從



          7.1 想清楚

          一般大家就是三種選擇吧:去公司,去創(chuàng)業(yè),去學(xué)校。這個(gè)問題經(jīng)常會(huì)被歸為,想去學(xué)術(shù)界還是工業(yè)界,但我覺得職業(yè)本身的區(qū)別,可能沒有那么重要,重要的是想清楚

          最想要什么?最喜歡做什么?最擅長什么?未來幾年,哪個(gè)選擇能最大地支持自己的需求?

          7.1.1. 最想要什么?

          面對不同的選擇,第一步要做的,就是想清楚,未來幾年在這個(gè)新的崗位上,你的最大的需求是什么?比如說(1)急著用錢,要錢多穩(wěn)定的工作;(2)家庭壓力大,未來幾年需要個(gè)人時(shí)間多的工作;(3)做自己喜歡做的事情,并在自己喜歡的事業(yè)上有進(jìn)展。顯然(1)的話是去大公司寫碼;(2)和(3)的話公司和學(xué)校都可以,(2)的話去一些老牌的養(yǎng)老型的大公司,或者壓力小一些的學(xué)校,(3)的話去發(fā)展快速 ing 的公司,或者 top 的學(xué)校;但如果是(1)和(2),恐怕都不能選創(chuàng)業(yè)(特別牛的大佬除外)。

          7.1.2. 最喜歡做什么?

          人生奮斗一輩子,最重要的還是要開心,只有做自己喜歡的事情才會(huì)開心;也只有如此,才能一直一直做下去,做出有影響力的工作。讓自己開心的事情因人而異:有的人喜歡編程,寫一輩子代碼是最開心的,在大公司經(jīng)常看到年紀(jì)很大,還在寫代碼做 individual contributor 的,人家就喜歡這個(gè);有的人喜歡開車,去自動(dòng)駕駛行業(yè)最為開心;像我的話,喜歡看視頻,拍視頻,剪輯視頻,所以做和視頻理解與生成有關(guān)的工作最讓我開心。

          通常一份工作,都是由各種各樣的 component 組成的,并不只是非黑即白的。比如說自動(dòng)駕駛公司,跟編程有關(guān),跟車有關(guān),跟視頻有關(guān),跟上面三種人都關(guān),只要有 common interest,能最大地滿足你的需求就行;試想,對于第一種人(最喜歡的事情是編程)來說,讓他在自動(dòng)駕駛公司寫代碼可以,但是當(dāng) VP 做管理或者搞商業(yè)啥的,他可能并不開心。而我的話,一路走來,從哥大讀博研究視頻算法,到 Facebook 搭建視頻工業(yè)平臺,再到業(yè)余生活中,拍片子制作視頻… 在視頻生態(tài)鏈的每個(gè)環(huán)節(jié),我都很開心。

          總之,不同的人,看重的東西不一樣,擅長的東西不一樣,選擇本身并無好壞之分。所有的選擇,總有好的一面,也有壞的一面;只要適合自己,都是最好的選擇,開心就好??赡芪ㄒ灰⒁獾木褪?,不同時(shí)間段,各種影響你做決定的因素的權(quán)重是在變化的,年紀(jì)大了我們可能會(huì)更看重家庭和穩(wěn)定;有的事情年輕的時(shí)候不做,以后可能就沒有機(jī)會(huì)去嘗試了;魚和熊掌不可兼得,需要取舍。

          7.1.3. Long-term vs. Short-term

          考慮畢業(yè)后這幾年選什么樣的工作時(shí)候,一方面想遠(yuǎn)一點(diǎn),你的 long-term 事業(yè),或者說可以一直做一直快樂的事情是什么?另一方面,畢業(yè)后這幾年 short-term 來說,是不是曲線救國,短期做的不一定是你喜歡的事情,但是長遠(yuǎn)來說對你 long-term 目標(biāo)是不是幫助更大?

          7.2 如何找教職?

          目前來說,畢業(yè)直接找到教職的難度還是比較大的,很多人會(huì)先做個(gè) PostDoc,可以一方面積累新的 paper,一方面積累新的 connection。同時(shí)博后期間,可以有更多時(shí)間,準(zhǔn)備更充分地找教職。找教職的話,qu qing 學(xué)長寫了個(gè)總結(jié),非常全面,強(qiáng)推,最近在 update,估計(jì)要過一段時(shí)間放出來,大家 stay tuned 哈:https://qingqu06.github.io/pdf/Job_Search.pdf

          7.3 如何賺大錢?

          最快賺大錢的方式就是創(chuàng)業(yè)了,當(dāng)然 new grad 選擇這個(gè)的比較少,要考慮你有沒有時(shí)間,精力,資金上的壓力和限制?有沒有一個(gè)好的 business model?作為技術(shù)出身的我們,有沒有好的商業(yè)合伙人,mentor?

          另外一條路,最多人選的,就是在公司做 production,升職加薪,最終財(cái)富自由的。經(jīng)常有人問要不要讀博?我覺得,如果是想走公司這條路的,其實(shí)讀兩年的 master 可能就夠了,save 下來的三年,在公司里面選個(gè)發(fā)展前景好的組(整個(gè) org growth 快,從而 headcount 多的組),可能升職加薪的速度更快。當(dāng)然讀了博士,手握幾篇 paper,是工作能力的證明,找工作更容易,是個(gè)敲門磚,否則簡歷關(guān)可能就被刷了;博士大家庭的師兄師姐,做相同 topic 的 peers,都是將來有用的資源;這個(gè)問題也很復(fù)雜,我這里就不展開聊了。

          但是,想走公司一路快速升職這條路的,盡量不要抱著又搞想 research,又想做出大的 product impact,早期公司里都沒有用 deep learning 的時(shí)候是可以大展手腳的,但公司已經(jīng)解決了 deep learning 從 0 到 1 的局面后,再抱著這種思路,可行,但可能升職速度不是最快的,尤其在是未來這十年。大佬們總結(jié)這是 “拿著錘子找釘子”,更應(yīng)從 product 的痛點(diǎn)出發(fā),找到最有價(jià)值的釘子,而不是最適合你錘子的釘子。

          當(dāng)然 research 對于大公司,一直也是不可或缺的一部分,不光是 branding,吸引人才儲備人才;更有一些 long-term, high impact 的難點(diǎn)技術(shù)攻關(guān),可能需要 3-5 年長度的持續(xù)研發(fā)投入,畢竟 product 關(guān)注的是短期半年內(nèi)的效益,很多 high impact 的東西,在半年內(nèi)看不到價(jià)值,但 3-5 年后則有巨大的商業(yè)價(jià)值;另一種普遍的模式,就是 research scientist 自己,因?yàn)橄矚g,有搞研究的熱情,通常會(huì)選擇跟學(xué)校合作,帶 intern 做純 paper 的工作,然后自己負(fù)責(zé)將 paper 轉(zhuǎn)化落地到產(chǎn)品里;亦或,公司出數(shù)據(jù)和算力,學(xué)校出人才,合作雙贏。

          說到升職,再給大家科普一下,比如在 Facebook,碩士畢業(yè)是 3,博士畢業(yè)是 4,往上升 5,6,到 6 后可以轉(zhuǎn) manager。朋友打趣說,工業(yè)界升職路線就是,技術(shù)(engineer)——產(chǎn)品(manager)——銷售(business)-——投資(chao gu,劃掉,capital)。這個(gè)路線將來也是要做選擇的,某一天可能你覺得賺的已經(jīng)夠了,沒興趣再賺了,就提前退休養(yǎng)老了。在灣區(qū) plaza,你看著一個(gè)中年人,穿著簡樸,平平凡凡,但經(jīng)??赡芫褪浅壐晃獭?/span>

          但如果不退休的話,不管是在學(xué)校還是公司,四五十歲估計(jì)都是比較 senior 了,需要負(fù)責(zé)的事兒多,壓力大,經(jīng)常晚上周末要加班;像我導(dǎo)師這種功成名就的,還是時(shí)常收到他晚上 1 點(diǎn),或者早上 7 點(diǎn)發(fā)的郵件。當(dāng)然,有的人退休了又覺得無聊,這就回到開頭說的,想清楚,想要什么,喜歡什么,擅長什么了。

          8. 雜七雜八



          Change topic every 5 years

          畢業(yè)那會(huì)兒,導(dǎo)師說他剛畢業(yè)來哥大時(shí),師爺跟他說,you need to change topic every 5 years。感覺很有道理。如果在博士開始那會(huì)兒,開始做一個(gè) topic,做了 5 年,基本這個(gè) topic 就會(huì)飽和了,很難再有大的 impact。這個(gè)時(shí)間點(diǎn),差不多剛畢業(yè)參加工作:如果還是 research 崗,我們就需要像剛開始讀博士一樣,重新選一個(gè)新的有 impact 的 topic 開始做;如果是轉(zhuǎn) production,轉(zhuǎn) business,那本身就是很不一樣的 topic 了。樹挪死,人挪活,大概就是這個(gè)道理。

          Work vs. Life

          這也是個(gè)復(fù)雜,需要具體問題具體分析的議題,就不展開聊了。我就簡單分享一下,我所得到的一些 advise 和一些自己的淺薄體會(huì)。

          (1)三選二:還記得博士入學(xué)典禮上,院長跟我們分享說:未來幾年的生活將由三件事組成,工作 / 學(xué)習(xí),睡覺,social / 玩;但是,在某個(gè)具體的時(shí)間,通常只能三選二,因?yàn)闀r(shí)間和精力是有限的。像我自己的話,博士第一學(xué)期,以及每段實(shí)習(xí)期間,選擇的是工作和玩,放棄睡覺時(shí)間;博士第二學(xué)期開始,則是工作和睡覺為主,常常宅家不怎出去。就是按照自己的需求,在每個(gè)特定的時(shí)間段,在這三者中做出你的選擇,對你自己負(fù)責(zé),不會(huì)后悔的選擇,然后該學(xué)學(xué),該睡睡,該玩玩。

          (2)身體會(huì)變的:最近前浪后浪的話題很火,其實(shí)很有道理,真的很多有影響力的工作,就是人在年輕時(shí)候,精力充沛,瑣事不多情況下,才能做出來的。剛來哥大的時(shí)候,課業(yè)負(fù)擔(dān)和科研任務(wù)都很重,還要參加些 social 活動(dòng),好幾次晚上參加完活動(dòng),回到家通宵寫代碼,7 點(diǎn)半天亮了睡兩小時(shí),然后 9 點(diǎn)半啥事沒有地去上課。?,F(xiàn)在想想那會(huì)真的是年輕,現(xiàn)在讓我通個(gè)宵,第二天工作效率絕對超低。。

          (3)做你喜歡做的工作:公司里面經(jīng)常提到所謂 work life balance,以前我以為這就是對應(yīng)工作與娛樂,但現(xiàn)在意識到,其實(shí) work 也分 work input 和 work fun,life 也分 life input 和 life fun,其實(shí) input 才是工作,fun 才是娛樂。input 需要我們付出精力,疫情期間注意消毒洗手,這就是 life 里多出來的 input;fun 就是帶給我們的快樂和開心,工作中做成一件事,帶來的成就感也是 fun。如果要讓自己過的更快樂,也就回到上一章說的,盡量做自己喜歡做的事情,增加 work fun 吧。

          談?wù)劰嗨?/span>

          有的時(shí)候,經(jīng)常聽到有人評價(jià)一個(gè)工作,太水了。誠然,有些工作是水,但如果被頂會(huì)接收了,我相信它還是有它的價(jià)值。有的時(shí)候,減一減戾氣,多看到事物好的一面,這樣我們看這篇 paper 的時(shí)間,才沒有浪費(fèi),而是學(xué)到了東西,不是嗎?然后,有的新手剛?cè)腴T的時(shí)候,發(fā)的第一篇文章雖是頂會(huì),但可能比較 naive,不過只要這篇文章,能給讀者帶來一些 insights,讓人學(xué)到東西,我還是支持這樣的新手之作的,因?yàn)榇_實(shí)積累是需要時(shí)間和過程的,中間這樣被頂會(huì)認(rèn)可,其實(shí)能很好地激勵(lì)新手去 continue 科研之路。

          常懷感激之心

          一路上得到很多前輩幫助,非常感激。在來到 Facebook 后,學(xué)會(huì)心懷感激,感覺是個(gè)很明顯的公司文化:每個(gè)月組里的 all hands 有 shoutout session,讓大家在全組面前,表達(dá)對工作中幫助了自己的人的感謝;公司有 #thanks hub, 可以給幫你的人寫感謝 note,而且這個(gè) note,對方的 manager 會(huì)看到;而且,很多時(shí)候,感覺是很小的事情,大家也會(huì)互相道謝;每次開完會(huì),大家也會(huì)互相道謝。簡單的一句 thank you 真的可以讓人幸福感增加不少,畢竟很多時(shí)候別人并沒有義務(wù)非要幫助我們,這讓大家更愿意互幫互助,感覺是個(gè)特別好的文化。

          Principles For Success by Ray Dalio

          疫情期間,看到美聯(lián)儲降息,我想去了解這背后的原理,看了些經(jīng)濟(jì)學(xué)的文章,知道了 Ray,然后看到了他這個(gè)成功方法論。給大家強(qiáng)烈安利,非常有價(jià)值,也適用于各種人,網(wǎng)上有個(gè)半小時(shí)精簡版,看這個(gè)就足夠了 https://www.youtube.com/watch?v=B9XGUpQZY38

          庚子年 · 歲末

          Mike 于 舊金山

          [ 后記: 慚愧在各位老師、大佬面前班門弄斧了;若是對于有的同學(xué)有點(diǎn)幫助,我就很高興了;但不可避免的,因?yàn)闀r(shí)間有限,文章寫的粗糙,還請多多擔(dān)待;因?yàn)槠拗?,有的問題難以講得完善全面,還請結(jié)合自身情況,辯證地借鑒相關(guān)經(jīng)驗(yàn);或跟您意見不合,全當(dāng)看小說,尋個(gè)樂子罷了;順祝大家新春愉快,平安喜樂,萬事勝意;希望疫情早日過去,世界和平… ]

          原文鏈接:https://zhuanlan.zhihu.com/p/338193330


          推薦閱讀


          添加極市小助手微信(ID : cvmart2),備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測-深圳),即可申請加入極市目標(biāo)檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群:月大咖直播分享、真實(shí)項(xiàng)目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動(dòng)交流~

          △長按添加極市小助手

          △長按關(guān)注極市平臺,獲取最新CV干貨

          覺得有用麻煩給個(gè)在看啦~??
          瀏覽 118
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日本免费黄视频 | 大香蕉在线网亚洲欧洲中文字 | 天天夜夜爽 | 高清免费在线中文Aⅴ | 传媒精品入口 |