<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          選擇大于努力:機器學習崗的就業(yè)選擇分析

          共 3631字,需瀏覽 8分鐘

           ·

          2020-08-07 18:45

          文 |?吳海波?
          轉自:夕小瑤的賣萌屋

          現(xiàn)在校招開始的越來越早,今年的實習生招聘還是異常火爆,簡歷一堆,而且是越來越?jīng)]有區(qū)分度,以前面?zhèn)€xgboost的論文細節(jié),就能區(qū)分很多人,現(xiàn)在大部分人都能講的不錯,哎,面試越來越難。

          也在蘑菇街帶了幾年團隊,有些同學成長的很快,去了更好的平臺,有些同學本來被寄予厚望,卻表現(xiàn)平平,暗嘆可惜。大家來來去去,鐵打的營盤流水的兵,不知不覺成了組里待時間最長的,頗有感慨,今天就和大家嘮叨幾句offer選擇和職業(yè)發(fā)展,個人觀點,純當消遣。

          從面試的情況來看,學生質量兩級分化一年比一年嚴重。估計到時候offer又是旱的旱死,澇的澇死。回想自己剛畢業(yè)的情況,如果來面現(xiàn)在的蘑菇街,大概率是過不了的。除了公司在發(fā)展,用人的選擇余地大了,更多的是那時候機器學習還不像現(xiàn)在這么火,從業(yè)者不多。大家只能看NG在斯坦福錄制的課程,還沒有cousera,你在簡歷上寫個拿到cousera ng的machine learning課程,各大公司可能還會面面你,但現(xiàn)在就呵呵了。

          對于很多同學來講,這個時候有個終極的問題要討論了,到底是去大公司還是小公司?

          先說應屆生offer選擇。針對互聯(lián)網(wǎng)公司,針對推薦、搜索、廣告場景,我個人的建議是:

          大公司核心業(yè)務團隊 > 中小公司核心業(yè)務團隊 > 大公司邊緣業(yè)務團隊 > 小公司

          根據(jù)公司、部門選擇的不同,會有不同的成長路徑,崗位推薦程度由高到低分別是:

          1. 經(jīng)歷核心團隊業(yè)務規(guī)模從小到大的過程,比如跟著頭條、抖音成長起來的一些同學,現(xiàn)在的發(fā)展都不會差。但這個看命,大部分小公司會掛掉,好不容易成長到中小公司,還會遇到瓶頸,遲遲突破不了,真正到大公司的,鳳毛麟角。而且還要這么多年待得住。
          2. 參與大公司主要業(yè)務瓶頸突破的過程,有點繞,而且好像離應屆生比較遠,理想情況這種任務都是老員工搞,但很多時候由于種種原因(大多是風險偏好),可能是一個經(jīng)驗豐富的老員工帶著一批應屆生搞,若輪到你,大賺。
          3. 經(jīng)歷團隊、業(yè)務規(guī)模從小到中的過程,也能得到不少的鍛煉。
          4. 一直在大公司做邊緣業(yè)務,這個對自己的悟性和驅動力要求太高,大部分人的成長都會明顯慢下來。
          5. 在沒有數(shù)據(jù)和掙錢業(yè)務的小公司,自求多福

          以上排序的核心邏輯是數(shù)據(jù)規(guī)模大小和是否有線上實驗反饋(A/B test)。規(guī)模帶來技術深度和業(yè)務背書,反饋是建立方法論的基石,沒有它就很難順利成長為合格的算法工程師。

          為什么如此強調線上A/B test?

          首先,很多同學從學校出來,并沒有真正做過一個實際的業(yè)務提升,是非常需要從線上A/B test拿到結果,建立信心,確認機器學習真的很有用。有些同學在大公司,干了幾年,一個線上收益都沒有拿到,對信心的打擊是很大,直接轉崗了。

          其次,大家都不是神,機器學習還是有非常大的不確定性,因此A/B test的準確度、有效性,以及同時能做多少實驗是非常重要的。 假設一個公司一次能做100種實驗,一個只能做10種,在idea的實驗效率上,就存在著巨大的差距。而這里的關鍵,就是數(shù)據(jù)規(guī)模有沒有到一定的量級,到了你的A/B test就能做的更多,且更準確,更快拿到反饋,從而修正自己的認知和方法論。

          明確了標準之后,面臨選擇時就更好把握。接下來說下各個選擇可能存在的問題。

          大公司

          老生常談,分工太細了,該做的事情,大部分都做掉了,很多時候找你進來是搞維護工作的。有些同學不服氣,面試也有遇到工作一兩年,說自己給公司提升了多少多少,詳細聊下來做的事情又很普通。那么事實就很明顯了,要么他們原來不重視這塊,做的水(現(xiàn)在越來越少了),要么你在吹水。

          重要的是:大部分人的悟性不足以通過現(xiàn)有的系統(tǒng),理解在其曾經(jīng)的發(fā)展邏輯及面對問題的方案選擇。 而后者,才是將來你面對新業(yè)務時候的底氣,人不可能在同一個業(yè)務上做一輩子。

          為什么還要去呢,有兩個方面的原因。第一個是上面已經(jīng)提到過的,萬一趕上被拉壯丁去解決核心問題,雖然業(yè)績風險大,但好歹有了戰(zhàn)點,有困難,有成長。第二是,這個東西就像當年大家去美國留學,先看看先進的東西是怎么樣的。比如在頭條,在鳳巢,你們會看到離散化模型的特征規(guī)模到了千億,讀書的時候怎么可能想到他們會這么搞。會看到原來要用ps訓練模型,需要用類似淘寶iGraph的系統(tǒng)來處理用戶側的實時特征。A/B test是怎么做的。待上一陣子,如果沒有戰(zhàn)點,找家中小規(guī)模的公司,去那里把技術和業(yè)務結合實際,形成自己的認知和方法論,也是極好的路線。

          中小公司的核心團隊

          在中小公司的核心團隊,對比大公司,會更“累”一些,需要做的事情會更多,這里的更多指的是數(shù)據(jù)質量和系統(tǒng)工程上。大公司的核心業(yè)務,一般會有一個規(guī)模不小的ETL組為你清洗數(shù)據(jù),還會有不同團隊搞出來的機器學習訓練平臺求著你用。而在中小公司,想用個PS,去看看開源吧,還好騰訊的angel還不錯。想搞個tensorflow的分布式,對方一臉懷疑,先拿效果出來看看?

          因此,要靠刷這張老臉,工程的同學都是不見兔子不撒鷹的主。畫風很容易就變成了,我們需要個在線預估服務,算法同學先搞個初級版本出來吧,線上拿到收益了,工程的人進來優(yōu)化重構;我們需要搞用戶實時特征,先搞個原始版本證明有收益,工程再進來重構。還好每次結果還不錯,最近開始搞大規(guī)模LR模型,大家支持力度比以前好多了,不再要先看結果了,畢竟這次也沒有辦法先看結果了,不是單打獨斗能搞的了。所幸,上線后收益很明顯。

          調侃歸調侃,在資源有限的情況下,這樣的方式非常合理,大公司才能養(yǎng)的起超前的團隊,而我們要精打細算。但對個人的成長也是非常有好處,首先是魔武雙修了,算法和工程都不錯,*其次是逼著你想清楚到底要干嘛,對算法和業(yè)務的理解更為深刻,因為每一次決策失敗,都是消耗大家對你的信任,如果次數(shù)多了,估計就混不下去了。

          最后,大部分來中小公司的,都是去不了一線大公司核心組的,這個是現(xiàn)實。但不要妄自菲薄,人生是長跑,不必爭一時瑜亮。

          大公司非核心業(yè)務團隊

          這個就要擔心了,首先,很多大公司應屆生招聘時候,同學們不知道自己面的是什么部門,所以一定要問清楚。現(xiàn)實中很多非核心團隊,本身沒有什么積累,因為留不住好的人,一直被核心團隊壓制,資源分配的很少,還不如中小公司。這個時候去,一定要想清楚,自己是不是看好這一塊。當然,凡是不能絕對,也有非核心業(yè)務發(fā)展的很快,成長為核心業(yè)務的,這個看自己的眼光和運氣了。

          小公司

          舉個常見例子,假設要做推薦,首先要有數(shù)據(jù),這點已經(jīng)可能干掉很多小公司了,沒有數(shù)據(jù)玩?zhèn)€毛線。其次,大家做模型一定是需要做A/B test的,那么最好場景的DAU是大于百萬(又干掉了很多小公司),一個是數(shù)據(jù)質量會高很多,A/B的時候波動小,另一個是不容易動不動搞個模型提升x倍(我們在小場景上會遇到),從而飄飄然,不知道自己幾斤幾兩。最后,場景的物料規(guī)模要大,才有推薦的空間,后續(xù)模型才有持續(xù)優(yōu)化的可能。舉個不恰當?shù)睦樱谝粋€賣xx的電商平臺,如果只有幾十款商品,用戶幾下就能瀏覽完,還做什么推薦。


          再來聊個題外話,老板較不較真

          除了公司、部門之外,和個人成長最相關的因素之一就是上級了。這里給大家提供一個指標:老板的較真程度。

          怎么評判呢?看在項目里,Ta是只看收益還是要求將收益講清楚,只看高大上的模型還是要求真正解決問題。不盲從,較真的思考為什么會有提升,為什么會沒有提升,去分析,去總結,對一個員工以至于團隊都非常重要。

          舉個例子,在業(yè)界,ctr預估一直有兩種思路,大規(guī)模特征 + 簡單模型對比小規(guī)模特征+復雜模型。但真正對比過這兩種方案的,少之又少。當年百度有個哥們去淘寶,想把百度大規(guī)模離散特征這一套應用在電商場景,最后是鎩羽而歸。但深入去了解當時的一些背景,發(fā)現(xiàn)嘗試的時間很短,結果就很可疑了,這就是不夠較真。

          由于長期受淘寶的影響,我街的基線模型和淘寶的思路非常接近,但到瓶頸了。而且我們和另外一家巨頭的模型線上pk過,效果要好于他們。為了突破瓶頸,在分析了各種模型的優(yōu)缺點,選擇做大規(guī)模離散模型,前前后后花了好幾個月,將數(shù)據(jù)鏈路上的各個環(huán)節(jié)重搞了一遍,嘗試了很多離散化特征,線上預估系統(tǒng)改造了好幾版,最后上線效果明顯。主要原因是該模型帶來了更多的特征工程空間。這就是較真帶來的收益。

          除了以上因素之外,offer的選擇還受到種種顧慮的影響,比如想要戶口、想離男/女朋友近、不想996等,最后還是要自己分配權重去做決策。祝大家的秋招都碩果累累,收獲心儀的offer。


          往期精彩:

          數(shù)學推導+純Python實現(xiàn)機器學習算法23:CRF條件隨機場

          【原創(chuàng)首發(fā)】機器學習公式推導與代碼實現(xiàn)30講.pdf

          【原創(chuàng)首發(fā)】深度學習語義分割理論與實戰(zhàn)指南.pdf

          瀏覽 23
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  五月天婷婷久久 | AA黄色片视频 | 五月播播 | a片视频在线播放 | 三级经典在线视频 |