<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          我在哥大讀博的五年,萬字總結(jié)

          共 22454字,需瀏覽 45分鐘

           ·

          2021-02-04 23:47

          大家好,我是有道哥。


          最近逛知乎,無意間逛到一篇哥大師兄的讀博總結(jié),我花了 1 個(gè)小時(shí)看完了,內(nèi)容非常干貨,滿滿的?1.6w?字,特此分享給大家一起共讀。


          0. 寫在前面

          「開始寫這邊總結(jié)的時(shí)候是三月,紐約成了疫情震中,看著新聞報(bào)道里的中央公園,中國城,第五大道,往事浮現(xiàn),于是開始寫這篇回顧。陸陸續(xù)續(xù)一直沒寫完,轉(zhuǎn)眼年底了,加州疫情更糟。前幾天看新聞?wù)fCathedral教堂發(fā)生槍擊案,震驚。這教堂就在我當(dāng)時(shí)住的學(xué)校公寓旁邊,每天出門都可以看到。遂又憶起每天上學(xué)的時(shí)光,于是決定把這篇總結(jié)寫完,希望疫情早日控制住,一切安好?!?/p>

          剛上大學(xué)時(shí),聽過不少學(xué)長學(xué)姐分享會(huì);申請博士時(shí),讀了不少留學(xué)申請總結(jié)。都收獲很大,讓當(dāng)時(shí)啥也不懂的我,了解了每場游戲(如何度過一個(gè)充實(shí)的本科;如何拿到心儀的PhD offer)的principles:有啥規(guī)則,有啥技巧,等等。

          開始讀博時(shí)候,我也去找類似的讀博經(jīng)歷分享,令我收益良多的,如熊輝老師, 田淵棟大牛和李沐大牛的總結(jié),林達(dá)華老師的blog;但可惜只有這寥寥幾篇,讀博又是一個(gè)復(fù)雜的事兒,當(dāng)時(shí)的我并不能清晰地看見前面的路,遇到一些事亦因缺乏經(jīng)驗(yàn)借鑒,走了彎路。于是當(dāng)時(shí)便想著,等我畢業(yè)了,也得記下我學(xué)到的經(jīng)歷,希望能幫助到剛開始讀博,像我當(dāng)年一樣迷茫的科研新人。也借此記錄和感恩一路走來,所有幫助過我的人,best of luck。

          因?yàn)闀r(shí)間有限,文章寫的粗糙,還請多多擔(dān)待;因?yàn)槠拗疲械膯栴}難以講得完善全面,還請結(jié)合自身情況,辯證地借鑒相關(guān)經(jīng)驗(yàn);或跟您意見不合,全當(dāng)看小說,尋個(gè)樂子罷了。

          1. 萬事開頭難 (第一學(xué)期)

          1.1 初到紐約

          2014年夏天,在北京國際機(jī)場,我安慰我媽說,“沒事,明年暑假我就回來啦”,萬萬沒想到,一直忙忙碌碌,一去就是5年……可能是初次留學(xué)的興奮,十幾個(gè)小時(shí)的飛行,感覺很快就過了,到了JFK機(jī)場,坐上紐約特色的黃色的士。去學(xué)校路上,先是皇后區(qū)的平房,后來到了曼哈頓,深磚紅色的高樓,跟想象中的國際大都市并不大一樣,倒很有歷史厚重感,日后想想也是,紐約也不能到處都如時(shí)代廣場那般呀。

          接著,辦入住,搞衛(wèi)生,小憩了一會(huì)兒,傍晚出去門口的超市買點(diǎn)吃的;第一次從112街,走到Broadway上,看著熙熙攘攘的外國人面孔,很傻的竟然笑了出來…那會(huì)兒自然是極開心的,就是一個(gè)毛頭小子,充滿了對未來生活期待的樣子(哎,回不去的青春?。?;當(dāng)然了,怎么也沒想到,接下來的一年,會(huì)如此艱難……

          1.2 差距

          開學(xué)后一系列事情,一下子讓我清清楚楚地,看到自己跟師兄們比,各個(gè)方面有著很大的差距。且不說核心業(yè)務(wù)能力了,首當(dāng)其沖自然是語言環(huán)境的變化。

          一天路上,一小哥對著我說:How are you?我想,這不是新概念英語上的經(jīng)典對話嗎,難道我真要回傳說中的I’m fine, thank you, and you?從那兒之后,我知道了,how are you就相當(dāng)于,吃了么您吶,并不是真的問什么,而是打招呼,跟say hi差不多,一般回good good就可以了,甚至不回,直接也回對方how are you都行。

          然后到了第一天來lab,正好Y來面博后,老板讓他給個(gè)talk,Y希臘口音的英語,再加上講的內(nèi)容涉及一些專業(yè)術(shù)語,幾十分鐘我?guī)缀跬耆珱]聽懂他說什么;會(huì)后跟他一對一meet,更是尷尬的很…后來18年來FB實(shí)習(xí),巧了Y是我mentor之一,第一天帶我吃的午飯,我們交流完全無障礙了,他也不記得當(dāng)年還見過我……我有個(gè)朋友總結(jié),剛來時(shí)候,跟外國人的交流,是三分靠聽,七分靠猜……現(xiàn)如今,即使是印度口音,只要不是說的特別差的,或者我特別不熟悉的東西,都能通暢交流了。感覺這沒啥技巧,首先要敢說,然后多跟不同的人聊天練習(xí),慢慢就好了,倒不必太過擔(dān)心,徒增壓力。但是如果英語不好的話,難以跟外國專家合作,融入核心科研圈子,對長遠(yuǎn)的發(fā)展耽誤很大,盡量在1-2年內(nèi)做好這個(gè)提升。

          1.3 讓老板知道你在干活

          因?yàn)槲沂潜究飘厴I(yè)直博,剛讀博那會(huì)兒,思維里還是默認(rèn),導(dǎo)師是教育培養(yǎng)學(xué)生的角色,指導(dǎo)學(xué)生做出成績;明白但沒有深刻認(rèn)識到,博士生與導(dǎo)師還有雇傭關(guān)系。第一個(gè)學(xué)期,我主要是跟著師兄們做,跟導(dǎo)師大概一個(gè)月meet一次,每周有weekly report。開學(xué)時(shí),老板把我分給一個(gè)師兄帶,參與他的項(xiàng)目A,是個(gè)很好的學(xué)習(xí)機(jī)會(huì),但是發(fā)不了paper。

          11月,CVPR投稿的季節(jié),另一個(gè)師兄找到我?guī)兔ψ鲰?xiàng)目B,這個(gè)項(xiàng)目準(zhǔn)備投CVPR,做出來的話可以co-author。于是我那段時(shí)間都撲在做B上,終于實(shí)現(xiàn)了其中一個(gè)核心的模塊。CVPR投稿完的那周,正好導(dǎo)師約meet,我想B的事情做完了,下面精力就都是做原本的A了,meet對我來說,主要目的是確定下接下來的plan唄。正好搞CVPR之前,項(xiàng)目A的師兄讓我reproduce一篇nips文章的方法,用到項(xiàng)目A的data上,于是,我準(zhǔn)備的slides主要介紹那篇nips和怎么用到項(xiàng)目A上。結(jié)果meeting結(jié)束,導(dǎo)師很不高興,覺得我這幾周沒有progress。記得那天導(dǎo)師辦公室沒開燈,冬天下午五點(diǎn)的紐約,天已經(jīng)黑了,周圍一片黑壓壓的,更顯壓抑。

          我當(dāng)時(shí)挺驚訝的,因?yàn)樵€以為在導(dǎo)師印象中,是我參與了B的CVPR投稿,很impress呢。我后來仔細(xì)反思了下,雖然這幾周我對B也算是嘔心瀝血,weekly report里也有提,但是,一來我只是coauthor,對于B工作整體而言算不上main contributor;二來導(dǎo)師很忙,不能assume對方完全了解并且記得你做過的一點(diǎn)一滴。同時(shí),我也明白了這個(gè)meeting的目的既是討論research ideas,但也是review progress,我首先得讓導(dǎo)師明白,我這段時(shí)間有在好好干活。現(xiàn)在的我,不會(huì)只提項(xiàng)目A之后我想怎么做,會(huì)同時(shí)準(zhǔn)備一頁slide總結(jié)下我對B的貢獻(xiàn)。

          1.4 自己的感受沒那么重要

          我們系第一個(gè)學(xué)期末就要博士資格考試。這個(gè)考試,各個(gè)學(xué)校稱呼不同,大概就是博士生通過這個(gè)考試,才證明有能力,qualify繼續(xù)讀博士。我們系給大家兩次機(jī)會(huì),第一學(xué)期末第一次考,沒通過的第三學(xué)期末再考一次,要是還沒考過,就只能卷鋪蓋走人了。而且這考試還真不是走過場,每次大概掛三分之一的人,所以真真切切見到周圍有人因?yàn)閝ualify沒過走人的。

          我本科學(xué)的CS,博士因?yàn)閒ellowship是EE發(fā)的,所以在EE系。這可愁壞我了,因?yàn)榭嫉氖荅E的基礎(chǔ)topics,電路,DSP,網(wǎng)絡(luò)啥的我大都一竅不通。于是第一個(gè)學(xué)期的課,我選了門DSP,準(zhǔn)備好好從頭學(xué)。這是硬課,再加上平常主要精力還得放在lab的項(xiàng)目上,第一學(xué)期壓力巨大。記得有一天,晚上睡覺做了噩夢,夢到不知什么怪物,驚醒,醒來想到各種tasks各種due,頓時(shí)只想繼續(xù)回到夢中,相比而言,還是怪物比較可愛……這時(shí)候,只好把自己的感受擱置一邊,累、苦,想這些又有什么用呢,只能更加平添煩惱。該做什么就去做,告訴自己干就完了,結(jié)束后反而發(fā)現(xiàn),過程其實(shí)也就那樣,有時(shí)候我們只是過度看重了自己的感受,夸大了困難的程度,其實(shí)自己的感受沒那么重要,只要身體本身還撐得住。

          qualify考試在1月初。12中旬,忙完了期末考試,去Chinatown吃了頓好的,回家看了部電影,然后跟導(dǎo)師請好假,專心復(fù)習(xí)qualify。大概有三周的復(fù)習(xí)時(shí)間,除了DSP,其他的topics完全從零開始學(xué)。后來覺得,這考試的目的,不是考的知識本身,而考的是學(xué)習(xí)能力。復(fù)習(xí)的過程是很慘了,時(shí)值圣誕節(jié)假期,朋友圈各式各樣在佛羅里達(dá)坐游輪的,迪士尼看煙花的,回國火鍋小燒烤的;而那年的紐約還尤其的冷,家里的暖氣開到最大,還是冷的不行,我只能早出晚歸的去圖書館;路面凍得白花花的,公車開過揚(yáng)起白沙,從家里112街到圖書館114街只有5分鐘,但卻那么漫長;每天幾條褲子疊著穿,有天開始一度冷到零下負(fù)十幾度,我剛出門一會(huì)兒就趕緊回來,在牛仔褲外面又套了件運(yùn)動(dòng)褲……所幸最后考試通過了,小秘告訴我竟然考了第三,震驚,真是功夫不負(fù)有心人訥……

          1.5 上課沒那么重要

          第一學(xué)期,選DSP,純?yōu)榱丝紂ualify exam修的,跟我日后的研究,基本不搭噶。我第一學(xué)期還修了機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)我之前沒有系統(tǒng)學(xué)過,學(xué)完還是受益良多。但為了達(dá)到學(xué)分要求,我博士期間,被迫修了14門課,第四年還在上課……我的感覺是,CV是實(shí)踐科學(xué),上課沒那么重要,很多時(shí)候甚至是浪費(fèi)時(shí)間。我覺得值得選課去學(xué)的,可能就是機(jī)器學(xué)習(xí),算法,就夠了。搞CV方向的,與其上門CV,還不如自學(xué)網(wǎng)上教程,親身參與幾個(gè)項(xiàng)目,學(xué)的更快,對書上的知識有更深刻的理解。我覺得上課最大的作用,就是去了解這門學(xué)科,有哪些基本的概念和算法(所謂把unknown unknown變成known unknown),哪天你要用到他們了,需要把known unknown變成known known的時(shí)候,知道在Google里輸入啥關(guān)鍵詞去搜。

          當(dāng)然如果有時(shí)間,上些基礎(chǔ)型的硬課,自然沒啥;但對于博士生,時(shí)間本就緊張,就得做做平衡了,選些seminar的課比較好,一般主要就是讀論文,做project。我后面陸陸續(xù)續(xù)帶了很多低年級的學(xué)生,很多人學(xué)期伊始,覺得要多學(xué)些知識,選的都是硬課,學(xué)期過半,發(fā)現(xiàn)作業(yè)做不完,科研沒時(shí)間,兩頭耽誤,都是后悔不已…

          2. 方向比努力重要

          2.1 PhD選題

          第一學(xué)期在課業(yè),科研,qualify考試,適應(yīng)國外環(huán)境,種種碾壓之下,總算過去了……雖然痛苦,但只是工作量大,努力使勁就好了……第二個(gè)學(xué)期開始,2015年于我,關(guān)鍵詞是迷茫,努力努力但怎么也使不上勁的那種……

          第二學(xué)期開始,重心主要集中在research上了,跟導(dǎo)師的meeting也從一月一次變成了每周一次,有幸得導(dǎo)師親自調(diào)教各種真正做科研的能力了。導(dǎo)師給我定了個(gè)新的項(xiàng)目,深度學(xué)習(xí)下的incremental learning。這其實(shí)是個(gè)很難的問題,現(xiàn)在5年后來看,都沒有被很好的解決;亦沒有一個(gè)標(biāo)準(zhǔn)的benchmark,也就是說,其實(shí)大家還沒有定義好這個(gè)問題;記得導(dǎo)師那會(huì)兒說,if you can formulate this problem,這個(gè)問題就已經(jīng)解決70% 了。

          結(jié)果忙忙碌碌幾個(gè)月,研究了很多文獻(xiàn),做了很多實(shí)驗(yàn),還是沒有太大的進(jìn)展,就是感覺很迷茫了,不知道下一步該干嘛。幸運(yùn)的是,到5月份,導(dǎo)師讓我跟師兄一起參加一個(gè)叫THUMOS的比賽,這其實(shí)又是個(gè)新的項(xiàng)目了;開始我還覺得,已經(jīng)忙不過來了,哪有時(shí)間再多一個(gè)項(xiàng)目,后來慶幸參與了這次比賽,開始了我做video這個(gè)方向的科研生涯。

          那會(huì)兒video領(lǐng)域,大家主要做classification,而且是幾秒的短視頻;THUMOS是長視頻,而且不光有action classification task,還要一個(gè)task是action detection,檢測你所感興趣片段的開始/結(jié)束時(shí)間。參加比賽時(shí),我跟著師兄主要搞classification,邊做邊學(xué),上手了處理視頻的模型和框架,收獲很大。比賽完后,我發(fā)現(xiàn)classification大家搞的火熱,而detection,同樣很重要的一個(gè)課題,卻沒有人研究過基于深度學(xué)習(xí)的方法,于是就有了我的第一篇CVPR文章,收到了很多follow-up。我自己也算是找到了自己的研究方向,不再迷茫。

          我覺得這段經(jīng)歷,對新手很有參考價(jià)值,很多時(shí)候光努力不夠,方向更重要。新手如何選博士幾年的topic,有兩個(gè)問題值得思考:

          能不能快速上手??有幾個(gè)簡單的評判標(biāo)準(zhǔn):

          • state-of-the-art的paper有沒有開源的代碼?目的是你能迅速復(fù)現(xiàn)baseline,熟悉整體pipeline(如怎樣預(yù)處理,后處理),加深對實(shí)現(xiàn)和細(xì)節(jié)的理解
          • 有沒有對這個(gè)topic有hands-on經(jīng)驗(yàn)的師兄,或者community里面approachable的前輩?目的是,當(dāng)你遇到實(shí)現(xiàn)上的細(xì)節(jié)問題,可以及時(shí)咨詢和得到反饋
          • 這個(gè)topic有沒有比賽,或者標(biāo)準(zhǔn)的benchmark?目的是,有大家已經(jīng)定義好的數(shù)據(jù),實(shí)驗(yàn)setup,評價(jià)標(biāo)準(zhǔn);這樣,你有可以直接比較的baseline,outperform baseline的時(shí)候也容易被人認(rèn)可

          能不能有大的impact??這里我指的是博士期間的大方向,由一系列單項(xiàng)的工作或者paper構(gòu)成。單篇paper通常有三種類型:(1)First work:開創(chuàng)了一個(gè)topic,比如RCNN于object detection(2)Last work:基本解決了一個(gè)topic,比如Faster-RCNN,YoLo于object detection(3)Improve類型,介于First和Last之間的。

          Last很難,Improve常見但影響力不夠深遠(yuǎn),對于新手而言,博士的早期工作,在有能力做出來和有impact之間的trade-off比較好的,估計(jì)是First了,不一定非要是第一篇,只要是某個(gè)topic里面開創(chuàng)性工作的那一批之一,都是不錯(cuò)的。這個(gè)早期工作之后,你會(huì)對這個(gè)問題哪里要改進(jìn),有很清楚的認(rèn)識,因?yàn)閕mprovement room大,也會(huì)有很多ideas。同樣,早期的時(shí)候怎么選這樣一個(gè)topic呢:相關(guān)的比賽是這一兩年新開的嗎,相關(guān)的benchmark是這一兩年出來的嗎,上面的結(jié)果提升空間大嗎(現(xiàn)在是20%還是已經(jīng)80%了)?

          2.2 單篇Paper選題

          前面說的PhD選題是大方向上的,具體到每一篇paper,選擇的principle和重點(diǎn)則不太一樣。來Facebook后從馬爺爺那知道了一個(gè)著名的Heilmeier問題系列,是指導(dǎo)老師們申項(xiàng)目的,我覺得稍微改改,便很適用于我們考慮,某一篇paper的選題,合不合適:

          1. What are you trying to do??Articulate your objectives using absolutely no jargon.
          2. How is it done today, and what are the limits of current practice?
          3. Who cares??[Support other’s research? Shape research landscape? Power applications in industry?]
          4. What's new in your approach?and why do you think it will be successful?
          5. If you're successful,?what difference will it make? [e.g. Contributions in theory/modeling? Improve accuracy by 5% on dataset A, B, C…?]
          6. What are the risks and the payoffs? [Further, how would you mitigate the risks? If your proposed method does not work, what could be alternative design? These can end up as discussions such as ablation studies in your paper.]
          7. How much will it cost??[e.g. How many GPUs do your experiments require? How long is each training process? How about data storage?]
          8. How long will it take??[How many hours are you going to work on this per week? When is the submission DDL? Can you make it?]
          9. What are the midterm and final "exams" to check for success?

          3. 談?wù)凱resentation

          Presentation分為做報(bào)告,還有就是寫paper

          3.1 談?wù)勛鰣?bào)告

          14年,剛來哥大那會(huì)兒,每周五是我們組會(huì),導(dǎo)師讓我在組會(huì)上present RCNN,這是我第一次給導(dǎo)師作報(bào)告,而且是在全組面前報(bào)告,自然想要好好表現(xiàn)。我對object detection之前完全沒了解過,于是paper讀了一遍又一遍,文中用到的前人技術(shù)不懂,便找到前人的文章去學(xué)怎么回事。感覺自己學(xué)到好多,自我感動(dòng),覺得花了這么大工夫,一定到時(shí)候會(huì)讓導(dǎo)師刮目相看。

          結(jié)果就是啪啪打臉:導(dǎo)師極其嚴(yán)謹(jǐn),當(dāng)我解釋了A,解釋了B,問我已經(jīng)有A了為啥還要B;我大腦一片空白,嘗試著解釋了半天,導(dǎo)師表示聽不懂,這是可想而知的,因?yàn)槠鋵?shí)我自己也并沒有搞清楚為啥;當(dāng)時(shí)自己讀paper的思維模式其實(shí)只是,memorize怎么做怎么做,但沒有去搞清楚要這么做背后的原理;另外當(dāng)時(shí)slides準(zhǔn)備的也不夠好??傊Y(jié)果是,這次報(bào)告搞砸了。還好事后,師兄們繼續(xù)跟我討論,讓我對技術(shù)原理有了更深刻的認(rèn)識;有的師兄更用親身經(jīng)歷安慰我,說當(dāng)年他剛來的時(shí)候,第一次匯報(bào)工作連slides都沒做,干講,導(dǎo)師自然也是沒能聽懂。

          之后幾年,從導(dǎo)師身上學(xué)到了很多presentation的技巧:

          • 如果可能的話,事先了解你的聽眾背景,是跟你做同一個(gè)topic的,還是同一個(gè)大領(lǐng)域但不同topic的,還是完全其他專業(yè)背景的。需要根據(jù)聽眾背景,定制和調(diào)整:比如,需不需要多介紹些背景?需不需要更深入技術(shù)細(xì)節(jié)?等等
          • 一頁slide盡可能focus在一個(gè)點(diǎn)上,不要信息量過大,否則聽眾很容易lost
          • 盡可能多用圖片表達(dá),不要大段大段的列文字,A picture is worth a thousand words
          • 上面這兩點(diǎn),其實(shí)principle都是盡量讓要講的內(nèi)容簡單明了,因?yàn)楹芏鄷r(shí)候我們在聽talk,這樣被動(dòng)接受的時(shí)候,接受新知識的能力是比主動(dòng)接受時(shí)候(比如看paper)低的。
          • 當(dāng)聽眾問問題的時(shí)候,If you don’t know the answer, just say don’t know.
          • 如果是跟mentor日常討論的slides,因?yàn)闀?huì)討論到很細(xì)節(jié)的東西,有些圖PPT畫起來,很花時(shí)間,而且通常這樣細(xì)節(jié)的圖還挺多,所以可以就ipad上面手畫一畫,截個(gè)圖放到PPT里就好了;如果是正式一點(diǎn)的presentation,寫slides跟寫paper的principle有點(diǎn)像,不要太focus在細(xì)節(jié)上,更重要的是講清楚motivation,為什么這樣設(shè)計(jì),細(xì)枝末節(jié)的不關(guān)鍵的內(nèi)容,放在backup slides里面。

          19年CVPR,Doctoral Consortium有幸mentor是斯坦福的一位大牛教授,她也提到了presentation的重要性,說她們lab有個(gè)開玩笑的說法,一份slides交給她去改,no pixel left……為了分享如何能讓報(bào)告聽起來有興趣,她畫了下面這張圖,讓聽眾情感(亦是興趣高低,注意力程度)隨著時(shí)間的變化,有三個(gè)高潮:首先,介紹你的問題,通常這時(shí)候大家都會(huì)引發(fā)興趣;但聽著聽著大家注意力就不集中了,這時(shí)候就到了圖中第一個(gè)低谷,這時(shí)候需要指出來這個(gè)問題有哪些challenge,大家的興趣就又被激發(fā)了;等大家興趣來了,精力集中的時(shí)候,介紹你的一部分工作work 1;等介紹完第一個(gè)工作,大家又疲勞了,這時(shí)候指出來,即使有這個(gè)work 1,問題還不能被解決,因?yàn)橛衦emaining challenge;接著大家又被調(diào)動(dòng)了興致,可以開始介紹work 2。

          3.2 談?wù)剬憄aper

          在2.2里面講了對某一篇paper,如何選題和做規(guī)劃。那真的到了寫paper的時(shí)候,我自己有幾點(diǎn)如何讓文章寫的更好的體會(huì):

          • 先給一個(gè)Talk。寫paper最難的是構(gòu)思storyline,而最好的完成這一步的方法就是先對你的工作做一個(gè)slides,給周圍的人present一遍。這個(gè)過程中,你會(huì)梳理好自己的思路,畫好文中的figure,準(zhǔn)備好實(shí)驗(yàn)結(jié)果的table,周圍的人還可以給你提意見,幫助你完善,等這個(gè)talk給完了,后面寫paper就會(huì)順暢自然了。其實(shí)我現(xiàn)在,如果準(zhǔn)備投一個(gè)paper,當(dāng)做了一段時(shí)間后,就會(huì)按照最終presentation的思路,準(zhǔn)備slides,用在每周給老板們r(jià)eport時(shí)。開頭先快速review一下做的task和提出的方法,remind一下context,然后重點(diǎn)focus在那周做的新東西上,所以每周匯報(bào)的slides可能80%都是跟上一周一樣的,然后新的方法和實(shí)驗(yàn)結(jié)果的那幾頁slides是新的,有比較多的細(xì)節(jié)。
          • 用Google doc做語法檢查。剛寫好的paper有typo和語法錯(cuò)誤是很難避免的,但常常會(huì)被reviewer揪著不放。大家寫paper如今大都在overleaf上,但overleaf的查錯(cuò)還是不夠好,建議可以寫完paper后,貼到Google doc里面。幾年前開始,估計(jì)是由于deep learning對Google NLP的改進(jìn)很大,感覺Google自動(dòng)改的質(zhì)量已經(jīng)非常高了。
          • Rationale很重要。不光是要講清楚你怎么做的,更要justify你問什么這么做;不光要講你的結(jié)果比baseline好,更要解釋為什么好;讀者看到的不應(yīng)是一個(gè)“使用手冊”。有時(shí)候我們寫paper,花了很多篇幅寫了很多實(shí)現(xiàn)細(xì)節(jié),但是更重要的是,解釋“為什么”,這個(gè)背后的邏輯和insights。
          • 大部分paper都是提出一個(gè)新的方法,這類方法型paper似乎都可以套下面這個(gè)框架:
          • Introduction:可以分為以下幾個(gè)部分:
          • Problem definition
          • Previous methods and their limits
          • 簡單描述你是提出了什么技術(shù)來overcome上面的limits
          • 一個(gè)圖,非常high-level的解釋前人工作的limits和你的工作怎么解決了這些limits,最好讓人30秒內(nèi)完全看懂
          • 最后一段如今大都是,In summary, this paper makes three contributions:
          • First work to解決什么limits
          • 提出了什么novel的技術(shù)
          • outperform了state-of-the-art多少
          • Related Work:一般三五個(gè)subsection,分別review下相關(guān)的topics,同樣不光講previous work做了啥,更要講自己的方法跟前人工作有啥不同
          • Method
          • 這是文章的主體,按照你覺得最容易讓別人看懂的方式來講可以第一個(gè)subsection是overview,formulate一下你的problem給出notation,配一個(gè)整體framework的圖,圖里面的字體不能太大或者太小 ? ? * 看不清,要有些細(xì)節(jié),讓人光看圖就能明白你的方法是怎么回事,但不要過于復(fù)雜,讓人在不超過2分鐘的時(shí)間看完這張圖
          • 然后幾個(gè)subsection具體介紹你的方法或者模型;如果testing跟training不太一樣,最后一個(gè)subsection介紹inference時(shí)候的不同,通常是一些post-processing操作
          • Experiment
          • Datasets
          • Implementation details such as pre-processing process, training recipe
          • Evaluation metrics
          • Comparisons with state-of-the-art
          • Detailed analysis
          • Alternative design choice exploration
          • Ablation studies
          • Visualization examples
          • Conclusion (and Future Work)
          • Abstract:是全文的精簡版,建議在paper寫完第一稿差不多成型了,有定下來的成熟的storyline了,再去寫abstract;大概就是用一兩句話分別概括paper里面每個(gè)section,然后串起來

          另外paper提交時(shí)候,可以交supplementary materials,雖然reviewer并不被要求強(qiáng)制看這個(gè),但其實(shí)給我們機(jī)會(huì),去include更多文章技術(shù)細(xì)節(jié)、實(shí)驗(yàn)結(jié)果的好地方;在后面rebuttal階段,通常篇幅有限制,但如果你已經(jīng)在supp里面未雨綢繆,可以省很多空間,refer reviewer去看你supp里面的內(nèi)容就好了。

          說到rebuttal,我還是比較幸運(yùn)的,從導(dǎo)師那學(xué)到很多。導(dǎo)師已經(jīng)是功成名就,業(yè)界泰斗那種,起初我以為他這個(gè)級別會(huì)對我們是放養(yǎng);但我在哥大投自己第一篇一作paper的時(shí)候,導(dǎo)師可以說是手把手帶我入門了。還記得16年CVPR review出來后,導(dǎo)師找我討論rebuttal,我那會(huì)兒對寫rebuttal并沒有什么經(jīng)驗(yàn),也不知道可以用R1代表review 1等等。那天meeting開始已經(jīng)晚上7點(diǎn)了,估計(jì)導(dǎo)師還沒吃飯,我兩就挨著坐在他辦公室里,對著他的電腦,討論reviewer提的一個(gè)一個(gè)問題。因?yàn)楹芏鄷r(shí)候其實(shí)reviewer表達(dá)問題并不準(zhǔn)確,他教我分析每個(gè)問題背后reviewer真正關(guān)注的點(diǎn)是什么。邊討論,導(dǎo)師邊直接敲下我們討論的notes,meeting完后,我看這notes基本上就可以算是個(gè)rebuttal的初稿了,比我meet前準(zhǔn)備的draft強(qiáng)多了……

          4. 記四次開會(huì)

          2016年,拉斯維加斯。

          博士期間我參加了四年的CVPR,這是我們行業(yè)的盛事了。學(xué)術(shù)會(huì)議通常,主會(huì)3-4天,有oral環(huán)節(jié),大家可以聽臺上人輪流做報(bào)告,有poster環(huán)節(jié),一個(gè)大場館列滿一排排的poster stand,每篇poster有作者在旁邊講解和答疑,oral和poster環(huán)節(jié)交替進(jìn)行。大場館在poster周圍有各個(gè)公司的展臺,一方面展示技術(shù),一方面更多是在招人。主會(huì)前后一兩天,有tutorial和workshop,通常會(huì)有大佬來介紹最新的工作,因?yàn)楝F(xiàn)在paper大家很多早就掛在Arxiv上看過了,很多人覺得workshop比主會(huì)更有聽的價(jià)值。

          若用一個(gè)詞形容16年參加CVPR的體驗(yàn),那就是興奮了。首先Vegas就足夠讓人興奮了,一座沙漠中建起來的夢幻城市,各式各樣的酒店,威尼斯人,凱撒皇宮,艾弗爾鐵塔,每換一個(gè)酒店就像到了一個(gè)新的國家。三年后畢業(yè)旅行,我?guī)О謰寔?,故地重游依舊是很驚艷。

          然后這也是第一次見到許多業(yè)界大佬們的真身。當(dāng)時(shí)在灣區(qū)實(shí)習(xí),候機(jī)的時(shí)候就發(fā)現(xiàn)周圍都是同行。第一天晚上跟著師兄逛賭城大道,一個(gè)很高的老外來跟我們打招呼握手,我后來才意識到是現(xiàn)在在Tesla的Andrej,之前本科的時(shí)候還郵件問過他DBN的問題,沒想到竟然是他…后面陸陸續(xù)續(xù)看到各種在Paper上面名字很熟悉的真人,很興奮了…

          這次開會(huì),我才知道了,開會(huì)的目的不光是聽報(bào)告學(xué)知識,也是social認(rèn)識人的機(jī)會(huì),我們需要融入到這個(gè)community里去。從優(yōu)秀的人身上我們可以學(xué)到很多;每人各有所長,有機(jī)會(huì)合作的話,可以雙贏;每個(gè)人都有盲區(qū),需以他人為鏡。而這些的前提就是,你要成為這個(gè)優(yōu)秀圈子的一員,跟他們有交流。當(dāng)時(shí)杜老板剛畢業(yè)加入Facebook,因?yàn)槲业墓ぷ骰谒闹暗腃3D,在路上看到他,鼓起勇氣跟他打了個(gè)招呼,杜老板很nice的跟我聊了一會(huì)兒,也是從那之后跟他們組有了些合作,我去年畢業(yè)后也加入了這個(gè)組。

          不過那年,我對social的認(rèn)識也就僅限于此了,我甚至不知道公司還有party。不過好處是認(rèn)識的人不多,沒有太多的招呼要打,可以集中精力開會(huì)學(xué)習(xí),這一年算是我開會(huì)最認(rèn)真的一年了,基本上把所有poster都過了一遍。另外,我也是第一次講poster,這個(gè)環(huán)節(jié)一般兩小時(shí),站著不停說話其實(shí)蠻累的,建議可以備點(diǎn)零食,水在旁邊。

          2017年,夏威夷。

          感謝組織,第二年又免費(fèi)去了個(gè)度假勝地……不過這一年,因?yàn)橐呀?jīng)入行了,開會(huì)過程很忙碌。這年有幸中了篇oral,導(dǎo)師很重視,前后slides改了很多遍,rehearsal了好幾回。為了聽眾體驗(yàn)比較好,可以看著聽眾有眼神交流,同時(shí)看起來professional,導(dǎo)師要我脫稿。從西雅圖飛夏威夷的飛機(jī)上,就一直在背稿子,然后一直反復(fù)rehearsal……報(bào)告前還是很緊張忐忑的,臺下坐著得有一千人,講12分鐘,3分鐘QA,不過上臺后似乎因?yàn)榧芯υ趫?bào)告本身,反而淡定了……話說這種事情,感覺都是第一次很緊張,經(jīng)歷過了,以后就好了;記得第一年只是做poster 展示,我事前也很緊張,但經(jīng)歷過后,這第二年做poster展示時(shí)就非常淡定了。

          報(bào)告給完后,因?yàn)樽詈笠惶煊袀€(gè)workshop要給個(gè)talk,slides還沒做,只能繼續(xù)宅在酒店準(zhǔn)備……悲催的整個(gè)開會(huì)期間,很多時(shí)間都呆在酒店,都沒啥時(shí)間出去轉(zhuǎn)轉(zhuǎn),只能默默給大家朋友圈點(diǎn)贊,也沒有機(jī)會(huì)向第一年一樣認(rèn)認(rèn)真真看poster了……所以很佩服大佬們,他們又要到處給talk,要跟各種人meet,是怎么安排開會(huì)時(shí)間的……

          前面說到公司party,在會(huì)議期間晚上,一般大公司都會(huì)組織自家的party供大家social。雖然很多時(shí)候是大型尬聊現(xiàn)場,但公司很多員工會(huì)來,為來年招intern或者正式員工做宣傳;很多學(xué)生會(huì)來,可以了解不同的組做些什么,有沒有headcount,intern有沒有returning full-time offer;當(dāng)然,還有就是有free food包晚飯,而且Party的場地很多時(shí)候是有特色的景點(diǎn),印象中去年,微軟是在一艘大輪船上(感謝張老師carry),F(xiàn)acebook是在水族館。

          很多時(shí)候這些party為了控制人流量,會(huì)要求invitation。會(huì)議前公司們會(huì)給你發(fā)郵件invite,可能是HR看到你要來present paper,可能是某個(gè)公司researcher想要跟你面對面聊聊,也可以你直接聯(lián)系公司的朋友,提前把你加到list上。有時(shí)候沒有invite,有認(rèn)識的公司朋友,也可能直接帶進(jìn)去,或者人不多了,就直接不限制了。另外,第一年開會(huì)的新人,可能看到別人去Party自己沒有invite會(huì)失落,但其實(shí)duck不必哈,找上落單的小伙伴,去周圍景點(diǎn)好好玩玩,這可能是今后所有開的會(huì)里,可以自由支配晚上的時(shí)間,想去玩啥就玩啥,不用去尬聊的唯一一次了,好好珍惜!

          2018年,鹽湖城。

          這一年我博士第四年結(jié)束,開會(huì)的主要任務(wù)就是找工作了。前面說到,poster場館有很多公司的展臺,前兩年我也就去拿拿文化衫就走了,這一年則不然,因?yàn)檎古_有HR給你介紹公司的招聘流程,當(dāng)場收簡歷,也有站臺的員工,可以直接了解他們組的情況。當(dāng)然,這樣可能還是比較general的招聘,即使有員工,很可能跟你也不是做同一個(gè)小方向的,一般來說大公司里面偏production的組在這里認(rèn)識的機(jī)會(huì)比較多;如果想找偏research的組,還是通過你paper認(rèn)識你的同行,師兄弟朋友們的介紹,效率相對高些,可以約他們在展臺或者Party上見面聊。對于找postdoc的同學(xué),很多老師會(huì)約在開會(huì)期間見面,甚至面試,所以可以提前reach out約好。

          2019年,洛杉磯長灘。

          洛杉磯也是我很喜歡的一個(gè)城市,因?yàn)槲乙恢庇袀€(gè)影視夢,所以很喜歡好萊塢,這大概就是我為什么堅(jiān)定做video方向的初衷了。長灘其實(shí)離LA市區(qū)挺遠(yuǎn)的,算是一個(gè)度假小城市了,甚至有自己的機(jī)場。長灘市最著名的景點(diǎn)就是literally的長灘了,有很多游艇一列一列地停著,蠻壯觀的。

          19年這會(huì)兒我已經(jīng)畢業(yè)了,剛加入Facebook,不用逛公司了解找工作的情況,倒是又可以認(rèn)認(rèn)真真開會(huì)了。另外,對于畢業(yè)生,會(huì)有個(gè)Doctoral Consortium,強(qiáng)烈建議申請,他們會(huì)組織畢業(yè)生和業(yè)界大佬一對一吃飯,是個(gè)很難得的學(xué)習(xí)機(jī)會(huì),畢竟除了自己導(dǎo)師,很少有其他老師能花一個(gè)小時(shí)跟你單獨(dú)聊各種research和career上的問題了吧。

          5. 記三次實(shí)習(xí)

          2016年,博二暑假,灣區(qū),Santa Clara。

          來紐約連軸干了兩年,暑假要去師兄在加州的start-up幫忙,總算要換一種生活方式了,開心!那會(huì)兒對傳說中的硅谷還沒有概念,還不知道San Jose(圣何塞)J發(fā)H的音。因?yàn)榧~約就是跟所有國際大都市一樣,高樓大廈生活便利,其實(shí)沒有體驗(yàn)過典型的,所謂美帝鄉(xiāng)村生活;灣區(qū)則是,住宅區(qū)里一棟棟的自家house挨著,四層就算是高樓了,每一片兒有個(gè)plaza,聚集各種飯店超市;到灣區(qū)第一天,被感嘆說像是第一天來美國的……

          這次實(shí)習(xí)很短,兩個(gè)月,因?yàn)槭莝tart-up,工資不高;租的地方?jīng)]有床,睡了兩個(gè)月地鋪,住家附近有條小河,蚊蟲很多,對蟲子極度反感的我在地鋪上整了個(gè)蚊帳;天天上班打車是打不起的,只好買了輛自行車騎車上班,單程半小時(shí)還好,天氣炎熱也還好,最恐怖的是在一個(gè)上高速分叉口,得過個(gè)馬路,沒有紅綠燈,只能招手示意,過來的車常有大貨車,而且車流量大,經(jīng)常得攔下一列車,每次都膽戰(zhàn)心驚……

          不過整體工作生活還是充滿新鮮感的。工作上是純production,了解了很多prod的system design;雖然早九晚七,但不用像在學(xué)校搞research晚上和周末還要加班,所以覺得很輕松;師兄們?nèi)艘埠芎?,帶著我們?nèi)ミ^了優(yōu)勝美地,三番市區(qū)玩??傮w感覺就是讓我緊繃的科研神經(jīng)放松了一段時(shí)間,也了解了另一種很不一樣的美帝生活,習(xí)慣了吃早茶,印度菜,越南粉。

          2017年,博三暑假,西雅圖,Redmond。

          這個(gè)暑假是過去幾年里,過的最開心也收獲很大、非常充實(shí)的一個(gè)暑假了。這一年在微軟,是research intern;大公司確實(shí)流程比較正規(guī),開始的時(shí)候有orientation帶你入門,公司各種facility也是不錯(cuò)。

          我的mentor已經(jīng)是很senior了,是組里的manager,但還是非常hands-on,自己還寫code做實(shí)驗(yàn),所以對技術(shù)的見解非常深入;人也很nice,甚至還有時(shí)幫我一起debug算法,學(xué)習(xí)到很多。當(dāng)時(shí)我在一個(gè)華人比較多的組,其他的full-time也很nice,我們工作上有問題都耐心跟我們討論,生活上帶我們嘗試各個(gè)樓不同的午餐。我們在的是99號樓,都說99很難吃,導(dǎo)致我至今還沒嘗過99的午餐……組里每周會(huì)有intern輪著做presentation,介紹自己的進(jìn)展,大家都很自覺,所以,雖然說大家都很nice,但因?yàn)橄胍谶@三個(gè)月里做出東西來,自己給自己的壓力還是比較大的。這種壓力我覺得是好的,積極的壓力。

          這次實(shí)習(xí)后,我就習(xí)慣了用Windows系統(tǒng),VS編程,onedrive,自己macbook上裝著Windows(這個(gè)習(xí)慣來FB后被打破了,現(xiàn)在又換回來蘋果原生系統(tǒng))……微軟沒發(fā)筆記本,而是臺式機(jī),所以周末來公司的intern還不少,再加上西雅圖公交系統(tǒng)發(fā)達(dá),去公司很方便,我晚上和周末基本都會(huì)在公司;也因此認(rèn)識了一群小伙伴,因?yàn)槲④浲砩喜蛷d不開,所以常常坐小伙伴的車,去外面一起吃晚飯,然后再回來干活。夏天的西雅圖天氣很好很舒服,二十來度吧,晚上九點(diǎn)多天還是亮的,是全年最好的季節(jié),其他時(shí)候則都是雨季了。

          2018年,博四暑假,灣區(qū),Menlo Park。

          這一年回到灣區(qū),在Facebook,體驗(yàn)是最fancy,最累的一個(gè)暑假了。

          原以為之前我已經(jīng)了解灣區(qū)了,但16年其實(shí)是在Sunnyvale,Santa Clara這塊,靠東邊,偏熱;18年FB在Menlo Park,公司公寓在紅木城,這塊靠西邊,溫度跟西雅圖夏天差不多,很舒服,跟16年?;顒?dòng)的區(qū)域還是有點(diǎn)遠(yuǎn)的。說fancy是因?yàn)椋?7年在微軟,我覺得有免費(fèi)的咖啡和椰子汁就很不錯(cuò)了;來了FB,好么,喝的吃的種樣繁多,微軟就顯得小巫見大巫了;FB樓里各種有個(gè)性標(biāo)識的墻,intern program組織的活動(dòng)也多,認(rèn)識了很多玩得來的小伙伴。在這也學(xué)了很多“黑話”,什么movefast啦,什么what does success look like啦……

          但同時(shí)也是最累的一個(gè)暑假了,一來因?yàn)閛pen space辦公室,大家都坐在一塊兒,業(yè)界大佬就在身邊,自然也會(huì)想向他們學(xué)習(xí),做的優(yōu)秀;二來FB有mid-term和final review,一般你的mentor們會(huì)給你寫feedback,打分,然后有個(gè)叫calibration的環(huán)節(jié),上面的老板們會(huì)把所有intern放在一起比較,調(diào)整分?jǐn)?shù),要看你跟你的peers比怎么樣。所以好幾次,忙到晚上3-4點(diǎn),早上8點(diǎn)就得起來趕班車……

          6. 沒那么簡單的事

          6.1 Project vs. Paper

          剛?cè)雽W(xué)時(shí),我單純的覺得,好好做research就好了;但事實(shí)上,能夠?qū)P淖鰎esearch的時(shí)間其實(shí)是沒有想象的那么多的,是要擠出來的,甚至去開會(huì)回來,報(bào)銷填表準(zhǔn)備材料這種雜事,小事,都得折騰掉好幾個(gè)小時(shí)……

          但更tricky的是平衡project和paper之間的關(guān)系。如果你比較幸運(yùn),有國家的Fellowship/Scholarship,或者系里的Fellowship/Scholarship(有的是以TA的形式),不用做所謂的RA,再或者sponsor你的project是純以發(fā)paper為KPI的,而且并不care你做的是什么topic,那你可能沒有這方面的苦惱。

          但是,通常老師們申請grant,很多grant,尤其是金額大的project,通常甲方心里都有一個(gè)確定的想解決的問題,向老師征求proposal,即問題的解決方案,proposal里面會(huì)規(guī)劃好每個(gè)半年甚至每個(gè)季度做什么task。當(dāng)然,這里說的project不包括那種純粹是給外面公司做工程的project,倒還都是research project。經(jīng)常項(xiàng)目開始的時(shí)候,因?yàn)閜roposal是以前定好的,如今環(huán)境、state-of-the-art都不一樣了,跟當(dāng)下情況不符;或者甲方想解決的問題比較practical,是個(gè)沒有formulate好的research problem,或者不是community關(guān)心的偏基礎(chǔ)的research task。

          舉個(gè)例子,你想做的topic是object detection,community關(guān)心的dataset是VOC,COCO,但你的甲方關(guān)心的可能是某個(gè)領(lǐng)域的object detection,比如detect某種野生動(dòng)物,比如detect不同微生物。經(jīng)常遇到的是,你提出的方法在VOC,COCO上面很work,但在微生物的dataset上面效果不佳,這樣雖然可以發(fā)paper,但是project卻沒有進(jìn)展。有些項(xiàng)目,在開始的時(shí)候會(huì)fund好幾個(gè)team,然后讓大家比賽,比如在項(xiàng)目內(nèi)部有個(gè)detect微生物的benchmark,讓你們PK,第一年結(jié)束,淘汰掉最差的那個(gè)team,第二年繼續(xù)PK,再末端淘汰。你要是project沒有進(jìn)展,導(dǎo)致你導(dǎo)師的項(xiàng)目被砍了,就問你怕不怕……因此,很多同學(xué)就走了另一個(gè)極端,花很多精力做項(xiàng)目,hack這些project的上的number,很多時(shí)候漲點(diǎn)最快的方法是,collect更好的training data,用更復(fù)雜的網(wǎng)絡(luò),漸漸變成了解決工程問題,開發(fā)了個(gè)很牛的系統(tǒng),但是沒有novelty發(fā)paper。

          這種情況下,人的本性,會(huì)覺得麻煩,就偏頗一方。但這其實(shí)是偷懶,千萬不可。要align雙方的興趣,要注意平衡,trade-off,一方面要project有進(jìn)展,對sponsor負(fù)責(zé),另一方面更要對自己負(fù)責(zé),發(fā)paper做有impact的工作?比如,盡量focus在模型本身,找到有novelty,在project benchmark和學(xué)術(shù)界standard benchmark上效果都好的方法。以及,通常一個(gè)project開始的時(shí)候有很多engineering的活兒,可以暫時(shí)放一放純paper research,等system搭起來了,后面就是不斷improve核心算法,這個(gè)時(shí)候精力更多放在paper這邊。

          拿我自己舉例子,15年底,我開始take charge of一個(gè)新的項(xiàng)目,于是16年上半年,基本都在為這個(gè)項(xiàng)目搭初步的system,從前端網(wǎng)站到后臺數(shù)據(jù)庫,從設(shè)備采購到system infra,從object detection到multi-modal;等系統(tǒng)差不多搭起來了,我在項(xiàng)目工程上就可以花很少的時(shí)間,也有progress去每月report,于是16年下半年,基本在做paper,當(dāng)然topic做的技術(shù)是將來能improve項(xiàng)目system一個(gè)核心模塊的;到了17年上半年,系統(tǒng)要開發(fā)新的模塊,又是花了三個(gè)月在項(xiàng)目工程上;再之后直到博士畢業(yè),都是盡量找到common interest,一個(gè)新的模型,對project的system效果有幫助,亦有大的paper research價(jià)值。

          6.2 new dataset和new task不是low-hanging fruit

          剛讀博時(shí)候,受周圍人影響,很多人都說release一個(gè)新的dataset沒有什么技術(shù)含量,輕輕松松發(fā)paper還能賺一票引用,是個(gè)low-hanging fruit。但當(dāng)我參與到一個(gè)新的dataset的創(chuàng)建過程后,才發(fā)現(xiàn)這是一個(gè)非常tedious的工作,有很多的臟活累活,很多細(xì)節(jié)的地方需要考慮。之前v1版本data,可能因?yàn)橐粋€(gè)細(xì)節(jié)沒考慮好,需要重新collect或者annotate,費(fèi)時(shí)又費(fèi)錢,經(jīng)常要迭代好幾個(gè)版本。所以create new dataset一點(diǎn)也不簡單,可能比提出一種新方法的paper,花的時(shí)間還要長。

          同樣,以前以為提出一個(gè)新的task(所謂挖坑)是個(gè)low-hanging fruit,但真正做過之后才知道,也沒那么容易的。17年底,導(dǎo)師讓我做live detection,也就是,只根據(jù)過去和當(dāng)下,監(jiān)測當(dāng)下發(fā)生了什么事件。我發(fā)現(xiàn)之前的工作都沒有很好地evaluate這個(gè)問題,formulation上有問題,實(shí)際做的是per-frame labeling或者early classification,于是決定提出一個(gè)新的task,專門evaluate detection本身。投完paper信誓滿滿,結(jié)果被CVPR拒了。reviewer們一方面指出了一個(gè)我之前忽略的點(diǎn),另一方面指出對于有的application,per-frame就可以夠用,不能直接說per-frame用來detection有問題,而僅僅是對于有的應(yīng)用場景,per-frame用來detection有問題。為此,要大改paper的定位。過程是痛苦的,但正因這個(gè)痛苦讓工作更加完善,我們才能成長升華,最后這個(gè)工作重投ECCV被大家認(rèn)可了。

          對于new dataset或者new task的工作,怎么樣才能做的盡量完善,減少迭代次數(shù)呢?我的一個(gè)經(jīng)驗(yàn)是,這種項(xiàng)目,盡可能involve多的experienced experts參與討論,及時(shí)跟大家溝通,collect不同人的想法。?每個(gè)人看問題角度不同,放在一起就會(huì)比較完善,群眾的智慧是大智慧。

          6.3 沒那么難

          說了沒那么簡單的事,再說說沒那么難的事。

          萬事開頭難,難在邁出第一步。當(dāng)開始做survey入門時(shí),發(fā)現(xiàn)這么多文獻(xiàn)要看,會(huì)覺得難;當(dāng)想好idea準(zhǔn)備去實(shí)現(xiàn),發(fā)現(xiàn)要準(zhǔn)備data,要實(shí)現(xiàn)的東西一步又一步,會(huì)覺得難;當(dāng)開始寫paper,構(gòu)思完每個(gè)section,發(fā)現(xiàn)這么多內(nèi)容要寫,會(huì)覺得難……

          但實(shí)際上,當(dāng)我們一點(diǎn)一點(diǎn)去完成的時(shí)候,會(huì)發(fā)現(xiàn)完成的速度遠(yuǎn)比我們想象的快,文獻(xiàn)一個(gè)星期可以看完經(jīng)典從而入門,paper一個(gè)星期可以有個(gè)初稿,idea實(shí)現(xiàn)起來一個(gè)星期可以coding完,甚至跑出實(shí)驗(yàn)結(jié)果……其實(shí)沒那么難,就是耐下性子,腳踏實(shí)地,干就完了。

          7. 畢業(yè)后何去何從

          7.1 想清楚

          一般大家就是三種選擇吧:去公司,去創(chuàng)業(yè),去學(xué)校。這個(gè)問題經(jīng)常會(huì)被歸為,想去學(xué)術(shù)界還是工業(yè)界,但我覺得職業(yè)本身的區(qū)別,可能沒有那么重要,重要的是想清楚

          最想要什么?最喜歡做什么?最擅長什么?未來幾年,哪個(gè)選擇能最大地支持自己的需求?

          面對不同的選擇,第一步要做的,就是想清楚,未來幾年在這個(gè)新的崗位上,你的最大的需求是什么?比如說(1)急著用錢,要錢多穩(wěn)定的工作;(2)家庭壓力大,未來幾年需要個(gè)人時(shí)間多的工作;(3)做自己喜歡做的事情,并在自己喜歡的事業(yè)上有進(jìn)展。顯然(1)的話是去大公司寫碼;(2)和(3)的話公司和學(xué)校都可以,(2)的話去一些老牌的養(yǎng)老型的大公司,或者壓力小一些的學(xué)校,(3)的話去發(fā)展快速ing的公司,或者top的學(xué)校;但如果是(1)和(2),恐怕都不能選創(chuàng)業(yè)(特別牛的大佬除外)。

          7.1.2. 最喜歡做什么?

          人生奮斗一輩子,最重要的還是要開心,只有做自己喜歡的事情才會(huì)開心;也只有如此,才能一直一直做下去,做出有影響力的工作。?讓自己開心的事情因人而異:有的人喜歡編程,寫一輩子代碼是最開心的,在大公司經(jīng)??吹侥昙o(jì)很大,還在寫代碼做individual contributor的,人家就喜歡這個(gè);有的人喜歡開車,去自動(dòng)駕駛行業(yè)最為開心;像我的話,喜歡看視頻,拍視頻,剪輯視頻,所以做和視頻理解與生成有關(guān)的工作最讓我開心。

          通常一份工作,都是由各種各樣的component組成的,并不只是非黑即白的。比如說自動(dòng)駕駛公司,跟編程有關(guān),跟車有關(guān),跟視頻有關(guān),跟上面三種人都關(guān),只要有common interest,能最大地滿足你的需求就行;試想,對于第一種人(最喜歡的事情是編程)來說,讓他在自動(dòng)駕駛公司寫代碼可以,但是當(dāng)VP做管理或者搞商業(yè)啥的,他可能并不開心。而我的話,一路走來,從哥大讀博研究視頻算法,到Facebook搭建視頻工業(yè)平臺,再到業(yè)余生活中,拍片子制作視頻…在視頻生態(tài)鏈的每個(gè)環(huán)節(jié),我都很開心。

          總之,不同的人,看重的東西不一樣,擅長的東西不一樣,選擇本身并無好壞之分。所有的選擇,總有好的一面,也有壞的一面;只要適合自己,都是最好的選擇,開心就好??赡芪ㄒ灰⒁獾木褪牵煌瑫r(shí)間段,各種影響你做決定的因素的權(quán)重是在變化的,年紀(jì)大了我們可能會(huì)更看重家庭和穩(wěn)定;有的事情年輕的時(shí)候不做,以后可能就沒有機(jī)會(huì)去嘗試了;魚和熊掌不可兼得,需要取舍。

          7.1.3. Long-term vs. Short-term

          考慮畢業(yè)后這幾年選什么樣的工作時(shí)候,一方面想遠(yuǎn)一點(diǎn),你的long-term事業(yè),或者說可以一直做一直快樂的事情是什么?另一方面,畢業(yè)后這幾年short-term來說,是不是曲線救國,短期做的不一定是你喜歡的事情,但是長遠(yuǎn)來說對你long-term目標(biāo)是不是幫助更大?

          7.2 如何找教職?

          目前來說,畢業(yè)直接找到教職的難度還是比較大的,很多人會(huì)先做個(gè)PostDoc,可以一方面積累新的paper,一方面積累新的connection。同時(shí)博后期間,可以有更多時(shí)間,準(zhǔn)備更充分地找教職。

          7.3 如何賺大錢?

          最快賺大錢的方式就是創(chuàng)業(yè)了,當(dāng)然new grad選擇這個(gè)的比較少,要考慮你有沒有時(shí)間,精力,資金上的壓力和限制?有沒有一個(gè)好的business model?作為技術(shù)出身的我們,有沒有好的商業(yè)合伙人,mentor?

          另外一條路,最多人選的,就是在公司做production,升職加薪,最終財(cái)富自由的。經(jīng)常有人問要不要讀博?我覺得,如果是想走公司這條路的,其實(shí)讀兩年的master可能就夠了,save下來的三年,在公司里面選個(gè)發(fā)展前景好的組(整個(gè)org growth快,從而headcount多的組),可能升職加薪的速度更快。當(dāng)然讀了博士,手握幾篇paper,是工作能力的證明,找工作更容易,是個(gè)敲門磚,否則簡歷關(guān)可能就被刷了;博士大家庭的師兄師姐,做相同topic的peers,都是將來有用的資源;這個(gè)問題也很復(fù)雜,我這里就不展開聊了。

          但是,想走公司一路快速升職這條路的,盡量不要抱著又搞想research,又想做出大的product impact,早期公司里都沒有用deep learning的時(shí)候是可以大展手腳的,但公司已經(jīng)解決了deep learning從0到1的局面后,再抱著這種思路,可行,但可能升職速度不是最快的,尤其在是未來這十年。大佬們總結(jié)這是“拿著錘子找釘子”,更應(yīng)從product的痛點(diǎn)出發(fā),找到最有價(jià)值的釘子,而不是最適合你錘子的釘子。

          當(dāng)然research對于大公司,一直也是不可或缺的一部分,不光是branding,吸引人才儲(chǔ)備人才;更有一些long-term, high impact的難點(diǎn)技術(shù)攻關(guān),可能需要3-5年長度的持續(xù)研發(fā)投入,畢竟product關(guān)注的是短期半年內(nèi)的效益,很多high impact的東西,在半年內(nèi)看不到價(jià)值,但3-5年后則有巨大的商業(yè)價(jià)值;另一種普遍的模式,就是research scientist自己,因?yàn)橄矚g,有搞研究的熱情,通常會(huì)選擇跟學(xué)校合作,帶intern做純paper的工作,然后自己負(fù)責(zé)將paper轉(zhuǎn)化落地到產(chǎn)品里;亦或,公司出數(shù)據(jù)和算力,學(xué)校出人才,合作雙贏。

          說到升職,再給大家科普一下,比如在Facebook,碩士畢業(yè)是3,博士畢業(yè)是4,往上升5,6,到6后可以轉(zhuǎn)manager。朋友打趣說,工業(yè)界升職路線就是,技術(shù)(engineer)——產(chǎn)品(manager)——銷售(business)-——投資(chao gu,劃掉,capital)。這個(gè)路線將來也是要做選擇的,某一天可能你覺得賺的已經(jīng)夠了,沒興趣再賺了,就提前退休養(yǎng)老了。在灣區(qū)plaza,你看著一個(gè)中年人,穿著簡樸,平平凡凡,但經(jīng)??赡芫褪浅壐晃獭?/p>

          但如果不退休的話,不管是在學(xué)校還是公司,四五十歲估計(jì)都是比較senior了,需要負(fù)責(zé)的事兒多,壓力大,經(jīng)常晚上周末要加班;像我導(dǎo)師這種功成名就的,還是時(shí)常收到他晚上1點(diǎn),或者早上7點(diǎn)發(fā)的郵件。當(dāng)然,有的人退休了又覺得無聊,這就回到開頭說的,想清楚,想要什么,喜歡什么,擅長什么了。

          8. 雜七雜八

          Change topic every 5 years

          畢業(yè)那會(huì)兒,導(dǎo)師說他剛畢業(yè)來哥大時(shí),師爺跟他說,you need to change topic every 5 years。感覺很有道理。如果在博士開始那會(huì)兒,開始做一個(gè)topic,做了5年,基本這個(gè)topic就會(huì)飽和了,很難再有大的impact。這個(gè)時(shí)間點(diǎn),差不多剛畢業(yè)參加工作:如果還是research崗,我們就需要像剛開始讀博士一樣,重新選一個(gè)新的有impact的topic開始做;如果是轉(zhuǎn)production,轉(zhuǎn)business,那本身就是很不一樣的topic了。樹挪死,人挪活,大概就是這個(gè)道理。

          Work vs. Life

          這也是個(gè)復(fù)雜,需要具體問題具體分析的議題,就不展開聊了。我就簡單分享一下,我所得到的一些advise和一些自己的淺薄體會(huì)。

          (1)三選二:還記得博士入學(xué)典禮上,院長跟我們分享說:未來幾年的生活將由三件事組成,工作/學(xué)習(xí),睡覺,social/玩;但是,在某個(gè)具體的時(shí)間,通常只能三選二,因?yàn)闀r(shí)間和精力是有限的。像我自己的話,博士第一學(xué)期,以及每段實(shí)習(xí)期間,選擇的是工作和玩,放棄睡覺時(shí)間;博士第二學(xué)期開始,則是工作和睡覺為主,常常宅家不怎出去。就是按照自己的需求,在每個(gè)特定的時(shí)間段,在這三者中做出你的選擇,對你自己負(fù)責(zé),不會(huì)后悔的選擇,然后該學(xué)學(xué),該睡睡,該玩玩。

          (2)身體會(huì)變的:最近前浪后浪的話題很火,其實(shí)很有道理,真的很多有影響力的工作,就是人在年輕時(shí)候,精力充沛,瑣事不多情況下,才能做出來的。剛來哥大的時(shí)候,課業(yè)負(fù)擔(dān)和科研任務(wù)都很重,還要參加些social活動(dòng),好幾次晚上參加完活動(dòng),回到家通宵寫代碼,7點(diǎn)半天亮了睡兩小時(shí),然后9點(diǎn)半啥事沒有地去上課?!,F(xiàn)在想想那會(huì)真的是年輕,現(xiàn)在讓我通個(gè)宵,第二天工作效率絕對超低。。

          (3)做你喜歡做的工作:公司里面經(jīng)常提到所謂work life balance,以前我以為這就是對應(yīng)工作與娛樂,但現(xiàn)在意識到,其實(shí)work也分work input和work fun,life也分life input和life fun,其實(shí)input才是工作,fun才是娛樂。input需要我們付出精力,疫情期間注意消毒洗手,這就是life里多出來的input;fun就是帶給我們的快樂和開心,工作中做成一件事,帶來的成就感也是fun。如果要讓自己過的更快樂,也就回到上一章說的,盡量做自己喜歡做的事情,增加work fun吧。

          談?wù)劰嗨?/span>

          有的時(shí)候,經(jīng)常聽到有人評價(jià)一個(gè)工作,太水了。誠然,有些工作是水,但如果被頂會(huì)接收了,我相信它還是有它的價(jià)值。有的時(shí)候,減一減戾氣,多看到事物好的一面,這樣我們看這篇paper的時(shí)間,才沒有浪費(fèi),而是學(xué)到了東西,不是嗎?然后,有的新手剛?cè)腴T的時(shí)候,發(fā)的第一篇文章雖是頂會(huì),但可能比較naive,不過只要這篇文章,能給讀者帶來一些insights,讓人學(xué)到東西,我還是支持這樣的新手之作的,因?yàn)榇_實(shí)積累是需要時(shí)間和過程的,中間這樣被頂會(huì)認(rèn)可,其實(shí)能很好地激勵(lì)新手去continue科研之路。

          常懷感激之心

          一路上得到很多前輩幫助,非常感激。在來到Facebook后,學(xué)會(huì)心懷感激,感覺是個(gè)很明顯的公司文化:每個(gè)月組里的all hands有shoutout session,讓大家在全組面前,表達(dá)對工作中幫助了自己的人的感謝;公司有#thanks hub, 可以給幫你的人寫感謝note,而且這個(gè)note,對方的manager會(huì)看到;而且,很多時(shí)候,感覺是很小的事情,大家也會(huì)互相道謝;每次開完會(huì),大家也會(huì)互相道謝。簡單的一句thank you真的可以讓人幸福感增加不少,畢竟很多時(shí)候別人并沒有義務(wù)非要幫助我們,這讓大家更愿意互幫互助,感覺是個(gè)特別好的文化。

          庚子年 · 歲末

          Mike 于 舊金山

          「后記: 慚愧在各位老師、大佬面前班門弄斧了;若是對于有的同學(xué)有點(diǎn)幫助,我就很高興了;但不可避免的,因?yàn)闀r(shí)間有限,文章寫的粗糙,還請多多擔(dān)待;因?yàn)槠拗?,有的問題難以講得完善全面,還請結(jié)合自身情況,辯證地借鑒相關(guān)經(jīng)驗(yàn);或跟您意見不合,全當(dāng)看小說,尋個(gè)樂子罷了;順祝大家新春愉快,平安喜樂,萬事勝意;希望疫情早日過去,世界和平…」

          知乎:https://zhuanlan.zhihu.com/p/338193330

          作者:Showthem

          本文僅供學(xué)習(xí)參考,如有侵權(quán)請聯(lián)系刪除!

          推薦閱讀:

          完全整理 | 365篇高質(zhì)技術(shù)文章目錄整理

          算法之美 : 棧和隊(duì)列

          主宰這個(gè)世界的10大算法

          徹底理解cookie、session、token

          淺談什么是遞歸算法

          專注服務(wù)器后臺技術(shù)棧知識總結(jié)分享

          歡迎關(guān)注交流共同進(jìn)步

          瀏覽 19
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  在线观看日韩三级片 | 欧美日韩亚洲一区二区三区 | 久久人爽| 18美女毛片| 搡老熟女大熟了88AV一区二区 |