工業(yè)界和學(xué)術(shù)界最大區(qū)別是什么?
點擊下方“AI算法與圖像處理”,一起進(jìn)步!
重磅干貨,第一時間送達(dá)
導(dǎo)讀
?宅實驗室專心科研的生活自由但無硬核的工作像是在空中跳舞,學(xué)術(shù)界人才濟濟而職稱的坑位少,大家相見即交鋒。面對這樣的環(huán)境感覺到現(xiàn)實非常的殘酷,那么工業(yè)界又是怎樣的一種狀態(tài)呢?來聽聽大家對于該問題的看法吧~
原問題:鄙人能源類工科博士在讀,正在面臨工業(yè)界和學(xué)術(shù)界的抉擇,想知道兩者的區(qū)別,以便提前做好準(zhǔn)備??蒲袪顟B(tài)自我感覺挺舒適,習(xí)慣了自由自在,沒有太大約束的生活,但是感覺自己做的東西浮在空中,落地會摔粉碎。學(xué)術(shù)圈目前應(yīng)該是越來越難了吧,人才多,評職稱艱難。隔壁實驗室的講師每天走得比我還晚(一般12點走),所以很想知道工業(yè)界又是怎么樣一種狀態(tài)?
問題鏈接:https://www.zhihu.com/question/332602866
#?回答一
作者:蛤蟆仙人
來源鏈接:
https://www.zhihu.com/question/332602866/answer/2145469028
我的背景更偏學(xué)術(shù)界,我對兩邊都有了解,我談一點自己粗淺的看法。我的討論范圍限定在(1)機器學(xué)習(xí)領(lǐng)域,(2)能力在前10%~50%的正常人,不討論改變世界的大神。
簡單粗暴的結(jié)論:
(1)高校的研究能力在工業(yè)界很有用,但是高校的成果幾乎(99.9%)在工業(yè)界都沒有用。或許高校的education的作用更大,期望高校做出改變工業(yè)界的學(xué)術(shù)成果不太現(xiàn)實。
(2)工業(yè)界的研究院其實屬于學(xué)術(shù)界,本質(zhì)跟高校區(qū)別不大。他們比高校做的東西更有用,但是研究院做的不是核心技術(shù),只是外圍、邊緣的技術(shù)而已。
先說說高校的科研。 高校絕大多數(shù)的研究都是各種問題的corner case,在公開的數(shù)據(jù)集上跑幾個實驗,claim自己是SOTA,發(fā)篇論文。但這些東西在工業(yè)界用途非常非常小。我舉幾個例子。
近年來學(xué)術(shù)界搜索、推薦的論文不少,但在工業(yè)界能用的幾乎沒幾個。學(xué)術(shù)界的做法是“改進(jìn)模型,在MovieLens等數(shù)據(jù)集上做個實驗,提升幾個點,發(fā)表論文”。但學(xué)術(shù)界的成果在工業(yè)界幾乎都不work。在工業(yè)界真正能改進(jìn)模型效果的方法大多是標(biāo)注數(shù)據(jù)、處理數(shù)據(jù)、調(diào)特征、修bug。少數(shù)能用的學(xué)術(shù)成果都是Google等公司發(fā)表的。
最近幾年聯(lián)邦學(xué)習(xí)很熱門,每個會議都有上百篇聯(lián)邦學(xué)習(xí)的投稿。這些文章中90%以上都是在解決corner case,比如XXX設(shè)定下的收斂、XXX設(shè)定下的XXX差分隱私方法、用XXX方法防御XXX假設(shè)下的拜占庭錯誤。有腳指頭想想也知道,這些corner case在工業(yè)界是沒有用的。工業(yè)界用的是簡單、好調(diào)、scalability能上得去的方法,而且要考慮自身系統(tǒng)平臺的支持。
最近一兩年,有N篇基于vision transformer的論文,都是對vision transformer做一點改進(jìn),在公開數(shù)據(jù)集上top-1 accuracy提升一點點。在絕大多數(shù)工業(yè)應(yīng)用里面,沒人在乎一點點準(zhǔn)確率的提升。好好處理數(shù)據(jù)、標(biāo)注數(shù)據(jù)、再加點小trick,帶來的提升比模型大得多。說實話,ResNet之后所有的模型帶來的提升全加起來,還沒JFT一個數(shù)據(jù)集帶來的提升多。
工業(yè)界里重要的問題非常多,但是沒有足夠的人力去解決,只能挑收益最大的做。而高校烏央烏央的人扎堆擠到一些很小的問題上,研究各種各樣的corner case,比如上面討論的幾個問題。這就是為什么我打算離開高校。
再說說工業(yè)界的研究院。
工業(yè)界研究院有一部分人做純科研,做出了非常牛逼的工作。Google、Deepmind、MSR、NVIDIA等公司的研究院都有非常厲害的成果。Transformer、AlphaGo這些成果確實改變了世界。其余影響力小一些的論文也起到了PR的作用。
工業(yè)界研究院有相當(dāng)多的人在為業(yè)務(wù)、技術(shù)部門服務(wù)??上У氖茄芯吭鹤龅耐ǔ2皇呛诵募夹g(shù),而是可有可無的邊緣技術(shù)。研究院的人看不到完整的核心技術(shù)。舉幾個例子:
推薦算法團(tuán)隊跟研究院合作,希望“試一試”強化學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)這些技術(shù)。重點在“試一試”,也就是說可有可無,不是核心技術(shù)。能帶來零點幾個點的增長最好,沒有也無所謂。 技術(shù)部門發(fā)現(xiàn)強化學(xué)習(xí)在網(wǎng)約車派單上好用,收益挺大。上線之后,讓研究院做進(jìn)一步的探索,目標(biāo)是用更fancy的技術(shù)取得marginal improvement。
為什么工業(yè)界研究院接觸不到完整的、核心的技術(shù)?核心技術(shù)肯定在業(yè)務(wù)部門手里,重要性次一級的工具在技術(shù)中臺手里。由于利益原因,沒人愿意把自己重要的東西交給別人做,除非是自己不愿做、沒精力做、沒能力做。
說一下工業(yè)界的技術(shù)團(tuán)隊。 工業(yè)界的工作并不美好,有很多臟活累活要干,沒有學(xué)術(shù)界看起來高大上,而且KPI壓力很大。有一部分人在推著技術(shù)走,這種工作的成就感會比較高。另一部分人被業(yè)務(wù)推著走,比如這個地方掉點了,那個地方有個bad case,要修一下。。。很明顯,前者的技術(shù)含量高,成長更快,在就業(yè)市場上很搶手;后者的技術(shù)含量低,是高檔人肉電池,容易被換掉。
最后說說人。 學(xué)術(shù)界的人才密度遠(yuǎn)遠(yuǎn)大于工業(yè)界。拿到985學(xué)校的講師(所謂助理教授)職位,比公司SP offer還難。工業(yè)界研究院里各個都是有不錯成果的博士。而工業(yè)界的技術(shù)部門里,人才密度低得多。哪里更容易出頭是顯而易見的。在跳槽的時候,研究院出身的不那么受歡迎,跟核心技術(shù)團(tuán)隊的人差距巨大。
#?回答二
作者:小米君
來源鏈接:
https://www.zhihu.com/question/332602866/answer/2139752924個人觀點:學(xué)術(shù)界就像談戀愛,有不錯的motivation和idea你只用鍛造技術(shù)去給一個solution就完了,最后呈現(xiàn)的方式是publication。你可以更自由,可以天馬行空,可以各種魔改,甚至不需要考慮落地成為一個paperer守著ppt過一輩子。
工業(yè)界就是結(jié)婚過日子,柴米油鹽,衣食住行,你就不得不考慮商業(yè)化和市場,平衡各方利益,調(diào)動各種資源上下游的關(guān)系。有這個idea的可能很多,但是你可以做出實打?qū)嵉卯a(chǎn)品,并將其推給用戶,為該領(lǐng)域起到推動作用,這就不是簡單的publication可以呈現(xiàn)的。同樣,沒有愛情的婚姻質(zhì)量不高,沒有重大innovation支撐的產(chǎn)品也不長久。
總之,paper 不代表一切~卻是一切美好的開始……
多加幾句:從社會責(zé)任的角度來看,不以結(jié)婚為目的的談戀愛都是耍流氓,婚姻里連流氓都不愿意耍的是搭伙過日子,只是完成國家規(guī)定的結(jié)婚kpi,給娃(產(chǎn)品)上戶口。
#?回答三
作者:留德華叫獸
來源鏈接:https://www.zhihu.com/question/332602866/answer/2146972009
學(xué)術(shù)界水了5年,工業(yè)界摸魚了3年,談?wù)勎业臏\見(IT、人工智能)。
一、工程能力、數(shù)據(jù)之于業(yè)界的重要性
當(dāng)你進(jìn)入到工業(yè)界會發(fā)現(xiàn),原來世界500強公司的機器學(xué)習(xí)團(tuán)隊也大都只是Git clone市面上開源的代碼,調(diào)整一些參數(shù)/用自己的數(shù)據(jù)集訓(xùn)練,有那么幾個復(fù)現(xiàn)能力強的算法工程師,足矣。。
不同深度學(xué)習(xí)模型在大數(shù)據(jù)燃料的驅(qū)動下,差別幾乎可以忽略。
相反,學(xué)術(shù)界take for granted的數(shù)據(jù)集才是工業(yè)界的命脈,得數(shù)據(jù)者得天下,對于互聯(lián)網(wǎng)公司更是如此。

標(biāo)注一張語義分割圖片需要1個小時
標(biāo)注一張語義分割圖片需要1個小時,相比花里胡哨的深度學(xué)習(xí)模型,業(yè)界更需要海量大數(shù)據(jù)收集/管理/讀取/active learning的能力、把算法工程(產(chǎn)品)化的能力、算法寫進(jìn)板子的能力、軟件開發(fā)和迭代的能力以及ppt和有效溝通的能力。
二、 產(chǎn)品才是業(yè)界的核心
如果說學(xué)術(shù)界KPI是頂刊和引用數(shù),那么業(yè)界的KPI便是盡量提升用戶數(shù)和滿意度
企業(yè)最終賣的是產(chǎn)品和解決方案,而算法只是其中很小的一部分。并且對于大多數(shù)中小企業(yè)來講是很微不足道的部分,而大頭都是軟件開發(fā)相關(guān),什么前端、后端、美工、產(chǎn)品經(jīng)理--這也是作為數(shù)學(xué)建模、算法出身的我最近幾年才認(rèn)識到的“殘酷”現(xiàn)實。
開發(fā)才是業(yè)界的剛需!
設(shè)想一個做導(dǎo)航軟件的小公司,導(dǎo)航軟件里最核心的算法便是@運籌OR帷幄 最經(jīng)典的最短路徑算法。但作為用戶,你最關(guān)心的導(dǎo)航軟件一定是它的UI(用戶操作界面)以及支持的功能(例如是否有限速提醒、探頭提醒等),還有數(shù)據(jù)庫(是否導(dǎo)航中的信息足夠詳盡和精確),算法部分只要夠用就行。
作為用戶,你會不會打開倆個導(dǎo)航軟件對比哪個軟件的線路更短、用時更快?比如搜索一段路徑:百度地圖給出的路徑長53.5公里、用時52分鐘,而騰訊地圖給出的路徑長53.7公里、用時56分鐘。


而作為用戶的你,是因為這多出來的0.2公里和4分鐘才選擇的百度而不是騰訊么?因此(中小)公司寧愿選擇砸錢雇很多前端(UI、美工設(shè)計師)也不愿花錢雇第二個運籌學(xué)算法工程師。只有那些頭部大廠才舍得花錢砸算法工程師去改進(jìn)算法提升那么一點點的軟件運行效率
而當(dāng)公司面臨財務(wù)危機的時候,第一批卷鋪蓋走人的也肯定是算法工程師(或研發(fā)科學(xué)家),畢竟他們工資高得嚇人。
三、為別人打工 VS 為自己打工
學(xué)術(shù)界即使博士后、青椒,畢竟發(fā)的文章署名是自己的,多半還是在為自己打工,因此即使007也心甘情愿。
然而殘酷的事實是學(xué)術(shù)界卷得厲害,007也不一定能換來終身教職并且還得飽受清貧之苦。為了所謂的學(xué)術(shù)理想是否值得,是需要深思的。
工業(yè)界就不一樣的,國內(nèi)996大廠好歹有加班補貼。作為碼農(nóng)按時計費,超一小時就要算上一小時的錢或者績效那邊補上(獎金)。歐洲這邊則是965每周工作40小時,到點下班、加班一小時都不可能。
感激博士畢業(yè)求職季把我拒掉的兩個博后崗位,讓我提前脫離“苦?!?,提前“上岸”,成為了快樂的德國“摸魚”人。
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有美顏、三維視覺、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群
個人微信(如果沒有備注不拉群!) 請注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱
下載1:何愷明頂會分享
在「AI算法與圖像處理」公眾號后臺回復(fù):何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經(jīng)典工作的總結(jié)分析
下載2:終身受益的編程指南:Google編程風(fēng)格指南
在「AI算法與圖像處理」公眾號后臺回復(fù):c++,即可下載。歷經(jīng)十年考驗,最權(quán)威的編程規(guī)范!
下載3 CVPR2021 在「AI算法與圖像處理」公眾號后臺回復(fù):CVPR,即可下載1467篇CVPR?2020論文 和 CVPR 2021 最新論文

