頂會Best Paper一作:所有實習(xí)經(jīng)歷都是有意義的

極市導(dǎo)讀
?三位不同時期在微軟亞洲研究院實習(xí)的實習(xí)生,作為第一作者斬獲了各自領(lǐng)域重量級論文獎項,他們在微軟亞洲研究院有著怎樣的經(jīng)歷和體會,他們?yōu)槭裁茨芡黄瓶蒲械闹貒?,未來想進入微軟亞洲研究院實習(xí)的同學(xué)們,這篇分享絕對不可錯過。?>>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿
2020年即將落下帷幕,回首這一年,相信很多人都通過努力離自己的目標更近了一步。同樣,微軟亞洲研究院三位不同階段的“實習(xí)生”也在這特殊的一年結(jié)束之際,斬獲了自己學(xué)術(shù)生涯的新獎項,給2020年添上了喜人的一筆。他們中有不愿意被“神話”的康奈爾在讀博士生,有視科研如日常的鄰家女孩,還有已“獨木成林”、致力于 AI 落地的公司高管。
三個人的共通之處在于,此次獲獎的論文都是他們在微軟亞洲研究院實習(xí)期間的科研成果。那么,微軟亞洲研究院這個“助攻”到底給予了他們什么樣的支持?讓我們走進三位實習(xí)生的世界,卸去 Best Paper 光環(huán)后,重新審視他們腳踏實地的實習(xí)經(jīng)歷。
張云昊:我不是"大神",我就是個普通人
2019年是張云昊在康奈爾大學(xué)攻讀博士的第二年,在博導(dǎo) Lorenzo Alvisi 的建議下,他利用暑假時間在微軟亞洲研究院進行了三個月的實習(xí)。實習(xí)期間,張云昊與導(dǎo)師周禮棟(微軟亞洲研究院常務(wù)副院長)、陳琪(微軟亞洲研究院主管研究員)共同確立了一個研究課題,并在回到學(xué)校之后,繼續(xù)遠程合作研究了一年多,最終發(fā)表了論文“Byzantine Ordered Consensus without Byzantine Oligarchy(拜占庭有序共識中的寡頭統(tǒng)治與民主)”。今年,在被譽為“操作系統(tǒng)原理領(lǐng)域奧斯卡”的?OSDI 2020 大會上,該論文榮獲了 “Best Paper Award”(最佳論文獎)。
這篇文章拓展了分布式系統(tǒng)中共識問題的經(jīng)典定義,并給出了新定義下的第一個系統(tǒng)設(shè)計與實現(xiàn)。在傳統(tǒng)的共識問題中,所有正確節(jié)點需要達成一致的執(zhí)行順序,而具體達成什么樣的順序并不重要。但是在依賴共識的許可區(qū)塊鏈中,節(jié)點的利益與該順序緊密相關(guān)。例如,在應(yīng)用于交易的許可鏈中,不同節(jié)點提交的購買請求的執(zhí)行順序決定了哪些節(jié)點能夠最終交易成功。因此,該文章提出了“有序共識”的概念,通過引入順序正確性維度擴充了共識問題的定義。
張云昊在微軟亞洲研究院實習(xí)期間的工位在張云昊看來,科研工作可以大致分為兩種:定義問題和解決問題。很多博士生會選擇尋找創(chuàng)新的方式來解決已有問題,因為難度相對可控。所以當(dāng)要拓展共識問題的經(jīng)典定義時,張云昊有些猶豫。然而,在兩位導(dǎo)師的鼓勵和耐心指導(dǎo)下,張云昊發(fā)現(xiàn)了曾獲得1972年諾貝爾經(jīng)濟學(xué)獎的社會選擇理論,大家一致認定該理論和分布式系統(tǒng)的共識十分相關(guān)。經(jīng)過數(shù)個月的共同探索,大家終于從社會選擇理論中獲得靈感,并結(jié)合兩位導(dǎo)師一直在研究的新共識協(xié)議,在疫情期間潛心合作完成了這份研究工作。
好的系統(tǒng)研究應(yīng)該理論和實踐并重。在實踐方面,微軟亞洲研究院提供的資源讓張云昊印象最為深刻,“當(dāng)時系統(tǒng)需要跑在100臺機器上,橫跨三個數(shù)據(jù)中心。我很慶幸是在微軟亞洲研究院做這個項目,因為這樣的軟硬件支持是一般大學(xué)和學(xué)術(shù)機構(gòu)難以提供的?!?/p>
雖然在研究院只有短短的三個月時間,但這里多元包容的文化,也給了張云昊很大的啟發(fā)。那時候坐在張云昊旁邊的是來自清華美院的黃杰妮同學(xué),這讓他十分意外。閑暇時間他們聊了很多 UI 色彩搭配、UX 用戶體驗、國內(nèi)外設(shè)計師差異、服裝染織工藝等等計算機領(lǐng)域以外的有意思的話題。實習(xí)的三個月里,除了與導(dǎo)師的密切溝通,與不同研究組、不同背景的實習(xí)生小伙伴間的交流也讓張云昊收獲頗多。
張云昊在科研毫無進展時到芝加哥旅游散心獲得最佳論文獎后,張云昊收到了不少同學(xué)、朋友的祝賀,以及網(wǎng)絡(luò)上素不相識的同學(xué)們的祝福,但對于大家給他的新稱呼“大神”、“大?!?,他有些不適。以南開老校長張伯苓、數(shù)學(xué)家陳省身為前行榜樣的他,一直覺得保持清醒和謙遜尤為重要。他認為自己只是一個普通人,還是個“很想變文藝但一直失敗”的工科生,也常常糾結(jié)自己作息不規(guī)律、效率不夠高等問題?!拔蚁雽Υ蠹艺f,其實并不一定非得是一個各方面都完美的人才能拿到 Best Paper,只要努力就都有機會。
在張云昊看來,這篇 Best Paper 只是他研究生涯的開始,至于對未來的研究方向有多大影響,他坦言自己并沒有想太多,至少未來一兩年仍然會在這個方向上繼續(xù)鉆研,再往后,也許會有全新的課題出現(xiàn),一切都未確定,都是未知。他表示,“做研究很重要的一點,也許就是享受這種不確定性?!?/span>
王程一:愛寫“日記”,科研這件事已平凡到融入日常
王程一與微軟亞洲研究院結(jié)緣是在2017年,那時在南開大學(xué)讀大三的她正在考慮未來的方向,恰好碰上微軟亞洲研究院副院長周明老師在學(xué)校的演講,她深受啟發(fā)打消了出國的想法。在本科畢業(yè)之后,王程一申請到了南開大學(xué)-微軟亞洲研究院聯(lián)合培養(yǎng)博士生,并在微軟亞洲研究院自然語言計算組實習(xí)至今。在?InterSpeech 2020?的論文評選中,王程一的論文 “Low Latency End-to-End Streaming Speech Recognition with a Scout Network(基于哨兵網(wǎng)絡(luò)的低延遲流式端到端語音識別系統(tǒng))”在千余篇論文中脫穎而出,獲得了 “The Best Student Paper Nomination“(最佳學(xué)生論文提名)。
該論文研究的是實時語音識別任務(wù),傳統(tǒng)的語音識別模型大多數(shù)只考慮準確率,但在與微軟總部語音產(chǎn)品組的合作中,王程一和團隊意識到實時的語音識別產(chǎn)品必須考慮時延,否則如果時延過長,即使準確率高,也會嚴重影響用戶體驗。而在業(yè)界,即便是考慮到了時延的算法,通常也就是將時延控制在一個固定時長,比如 600ms 或 900ms,由于每個人的語速不同,對于語速很慢的人,這樣的限制會導(dǎo)致識別不準確。因此,王程一和研究團隊在端到端的語音識別中加入了哨兵網(wǎng)絡(luò),能夠自主判斷一個詞是否已結(jié)束,等結(jié)束之后再開始識別,從而讓時延變得動態(tài),可以更好地平衡識別準確率和時延,讓實時語音識別模型得以顯著提升。
在微軟亞洲研究院實習(xí)的這段時間里,王程一最大的體會是一定要積極主動地跟導(dǎo)師多溝通,這樣才能更快、更深入地了解研究,獲得自己想要的成長。她與兩位研究員 Mentor 劉樹杰和吳俁的溝通頻率基本是每天開例會,無論是學(xué)術(shù)問題還是生活困惑,她都很感激導(dǎo)師們的言無不盡。
王程一(右四)與?Mentor 劉樹杰(右二)及組內(nèi)同事除了導(dǎo)師,“能夠與微軟的產(chǎn)品部門合作,是在微軟亞洲研究院做研究的另一大優(yōu)勢。產(chǎn)品研發(fā)過程中遇到的一些問題,剛好成為研究人員需要攻克的課題,產(chǎn)品與研究的相互促進,讓我受益匪淺”,王程一表示,“因為找到了好問題,研究就成功了一半。”而且微軟亞洲研究院在軟硬件以及數(shù)據(jù)層面的支持,讓語音識別研究在這里更有條件加速開花結(jié)果。
王程一有一套自己的學(xué)習(xí)方法,“每天做完實驗會用 OneNote 寫日記,沒有特別固定的模板,因為平時做的實驗大部分都是失敗的,如果不記下來,之后可能就會忘掉,再重復(fù)工作很浪費時間。平時看 Paper 的時候,我也會下意識地記錄下將來可能會用到的信息,方便將來查找?!狈e累,就在這樣的不經(jīng)意中完成了。
王程一(前排左一)與研究院實習(xí)生合影不驕躁、有一份平常心,但在某些問題上有著自己的堅持,是外人眼中的王程一?;蛟S對于科研工作者來說,“轟轟烈烈”的成就感本就是一瞬間,更多的時候,科研已經(jīng)是融入日常再普通不過的一件事。
袁晶:研究院的每一段經(jīng)歷和每個人,都讓我之后的工作受益
在三位“實習(xí)生”中,袁晶最為特殊。他十年前在微軟亞洲研究院實習(xí)時撰寫的論文 “T-Drive: Driving Directions Based on Taxi Trajectories(基于出租車軌跡的行車路線)”,近日獲得了?ACM SIGSPATIAL 2020頒發(fā)的“10-Year Impact Award Honorable Mention”(10年影響力論文榮譽提名獎)。其實,該論文當(dāng)年就獲得了 ACM SIGSPATIAL 2010大會的 Best Paper Runner-up 獎,十年后,這篇論文產(chǎn)生的影響力持續(xù)擴大,因此獲得了這個久經(jīng)時間考驗的獎項。
從2009年開始,袁晶在微軟亞洲研究院訪問實習(xí),時空數(shù)據(jù)分析、城市計算是他最初的研究方向。那時智能手機的功能還很初步,更沒有時下選擇眾多的打車軟件,但袁晶和研究團隊敏銳地注意到移動大數(shù)據(jù)所蘊藏的巨大價值,在那個時間點,選擇的研究方向為未來的研究打下了堅實基礎(chǔ)。這篇獲獎?wù)撐木褪菄@出租車司機腦海中的智能展開的。通過分析出租車的 GPS 信息,去挖掘司機們在路線規(guī)劃上的洞察,并且將出租車司機的洞察與路網(wǎng)映射相結(jié)合,從而產(chǎn)生最佳的路線推薦。袁晶特別提到,當(dāng)年他與其他實習(xí)生小伙伴一起,親自上路基于不同的路徑推薦算法實地驗證路線,這些經(jīng)歷令他至今都印象深刻。
袁晶(右一)與實習(xí)時的導(dǎo)師微軟亞洲研究院首席研究員謝幸(中)如今,這篇論文已有近1000次的引用,其中包括多位 ACM/IEEE Fellow 和中國科學(xué)院院士團隊,對智慧城市等領(lǐng)域的研究做出了很大貢獻。而十年前該項目所采用的方法,和今天業(yè)界廣泛關(guān)注的“知識驅(qū)動+數(shù)據(jù)驅(qū)動”的“第三代人工智能”十分契合。此后,袁晶正式加入微軟亞洲研究院成為研究員,在 LBS、自然語言處理、推薦系統(tǒng)等方面進行研究,也多次獲得了包括 KDD/ICDM 等頂會的最佳論文獎項。對于這些研究,袁晶總結(jié),本質(zhì)上都是研究人類在物理世界和數(shù)字世界的軌跡和行為。
后來袁晶加入了微軟(亞洲)互聯(lián)網(wǎng)工程院,帶領(lǐng)團隊做自然語言處理和相關(guān) AI 技術(shù)的產(chǎn)品化?,F(xiàn)在,他擔(dān)任華為云人工智能領(lǐng)域副總裁從事 AI 的商業(yè)化應(yīng)用。盡管袁晶現(xiàn)在的工作看起來離基礎(chǔ)研究有些距離,但在微軟亞洲研究院做科研的經(jīng)歷他非常珍惜。袁晶表示,基礎(chǔ)研究讓他擁有對整個 AI 生態(tài)最底層、最本質(zhì)的理解,對研究趨勢也非常敏感,這樣的積累讓他能夠更好地把握 AI 產(chǎn)品的價值點,以及 AI 商業(yè)落地的規(guī)律。
“在微軟亞洲研究院,我逐漸找到了做研究的正確方法。研究院本身的氛圍和環(huán)境就已經(jīng)能夠讓你快速成長了,加上各個領(lǐng)域的知名學(xué)者經(jīng)常來做報告分享,可以進一步幫助你形成和提升研究品位。當(dāng)然自己勤奮閱讀論文、了解業(yè)內(nèi)趨勢也必不可少。”如今回想起在微軟亞洲研究院的時光,袁晶仍記憶猶新,“平時要多和研究院的同事、實習(xí)生溝通交流,包括導(dǎo)師以及導(dǎo)師之外的其他研究員、外面來做分享的嘉賓。自己幾個禮拜都想不明白的問題,也許只跟他們交流幾分鐘就能讓你豁然開朗,千萬不要怕問錯問題?!?/span>
袁晶(前排右一)實習(xí)期間向比爾?蓋茨介紹 T-Drive 項目他還強調(diào),同期實習(xí)的同學(xué)們也不要忘了建立聯(lián)系,大家不僅在實習(xí)期間可以互相碰撞出研究的火花,多年之后,伙伴們又都成長為了領(lǐng)域內(nèi)的棟梁和擔(dān)當(dāng),可以攜手共進。
結(jié)合自己的成長經(jīng)歷,袁晶很看重研究、技術(shù)、產(chǎn)品和商業(yè)的綜合能力。他認為,“對于實習(xí)生來說,哪個方向值得做?如何選擇課題?怎么評價研究成果?不必單純著眼于技術(shù)本身,可以基于更綜合的理念去思考技術(shù)在整個生態(tài)鏈中的價值。確定好方向后,也不必著急。只要是你感興趣的,熱情大膽地投入就好,任何經(jīng)歷都會是有意義的。”
現(xiàn)在,張云昊在康奈爾大學(xué)繼續(xù)著自己的求學(xué)生活,王程一在微軟亞洲研究院專注于自然語言處理的研究,袁晶則繼續(xù)在人工智能的商業(yè)領(lǐng)域開疆拓土。三個有著不同人生軌跡的“科研打工人”,在這樣特殊的一年收獲了學(xué)術(shù)界的高度認可,而走下領(lǐng)獎臺后,還將有更多艱深的問題等待他們給出答案。
推薦閱讀

