<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          面經(jīng) | 阿里淘系數(shù)據(jù)分析1+5面 offer報(bào)批中

          共 4448字,需瀏覽 9分鐘

           ·

          2020-11-28 00:51

          篇分成三part:
          1. 超重要的簡(jiǎn)歷面

          2. 面經(jīng)

          3. 面試 over


          part1 超重要的簡(jiǎn)歷面


          阿里今年多是業(yè)務(wù)線各自組織招聘,二月底我就在淘系技術(shù)部的內(nèi)推群里投了簡(jiǎn)歷。這次簡(jiǎn)歷面也算是我人生中第一次正式的工作面試吧(我yy的mentor看到可能會(huì)氣死hhh)??梢哉f,從0基礎(chǔ)的萌新小白,到后來get TAT三家大廠offer的初級(jí)小白,都得感謝這次面試。

          當(dāng)時(shí)簡(jiǎn)歷一塌糊涂,方向不清晰,目標(biāo)不明確。

          簡(jiǎn)歷面 2020.02.24? ? 30min

          1. 實(shí)習(xí)經(jīng)歷
          2. 一個(gè)指標(biāo)在30天內(nèi)有波動(dòng),怎么判斷屬于正常波動(dòng)還是數(shù)據(jù)異常?
          3. 實(shí)習(xí)具體做了什么工作
          開發(fā)ltv報(bào)表如何選取指標(biāo)?有討論嗎?報(bào)表的維度有哪些?怎么分析?你做的報(bào)表能發(fā)現(xiàn)什么?可以提供給產(chǎn)品什么建議?
          4. 如果讓你來選指標(biāo),除了ltv(屬于中后期指標(biāo)),還可以選什么?如何用圖表呈現(xiàn)?

          5. sql問題
          • row_number()實(shí)際用法介紹

          • 如何優(yōu)化連接

          6. 統(tǒng)計(jì)
          • 貝葉斯公式一般解決什么問題

          • 現(xiàn)在新型冠狀病毒,有一個(gè)病人發(fā)燒咳嗽,讓你用試劑盒檢測(cè),拿到陽性或陰性的結(jié)果,怎么判斷他到底有沒有患?。?/span>

          • 假設(shè)檢驗(yàn)和置信區(qū)間的區(qū)別

          • 中心極限定理

          7. 機(jī)器學(xué)習(xí)
          • 比較熟悉的機(jī)器學(xué)習(xí)算法有哪些?

          • 支持向量機(jī)的原理是什么?和感知機(jī)的區(qū)別?那線性可分和不可分有什么區(qū)別呢?

          8. 建議:
          • 系統(tǒng)地梳理一遍業(yè)務(wù)知識(shí)

            • AARRR

            • 廣告的投放、變現(xiàn)過程...

          小哥說了很多,但我的字跡太潦草,后來我只認(rèn)出了這幾個(gè)字...
          • 熟悉兩三個(gè)算法,可以從這幾個(gè)角度:

          ?解決什么問題、算法原理、推導(dǎo)過程、缺點(diǎn)、怎么優(yōu)化。

          整理面經(jīng)時(shí)看見之前的答案真的好辣雞,所以就沒有貼我的回答啦

          e.g:
          被問到svm怎么用于線性不可分?jǐn)?shù)據(jù)集,我:怎么會(huì)線性不可分哇,從數(shù)學(xué)上來講,只要不是無限維的,映射到高維空間,都能給他分得開?

          當(dāng)時(shí)屬于完全get不到面試官想考我什么的菜?水平

          不過這次面試讓我知道應(yīng)該從這幾個(gè)方向去準(zhǔn)備
          • 算法:小哥說,一般面試也沒兩個(gè)人能把svm的來龍去脈講清楚,所以重點(diǎn)弄明白兩三個(gè)經(jīng)典算法就好了(可能需要svm的smo這種深度吧

          • 業(yè)務(wù):系統(tǒng)學(xué)習(xí)和整理相關(guān)知識(shí),思路才會(huì)更有框架性

          • 自己簡(jiǎn)歷的case得從多方面深挖


          好像講的都是大家知道的,但我最初是很抵觸去看算法的,覺得內(nèi)容多且雜,沒有辦法面面俱到。但是掌握兩三個(gè)就很容易了,再?gòu)乃惴ǖ漠愅c(diǎn)逐漸拓展開來,每次面試前復(fù)習(xí)一遍,讀書百遍,其義自就是這個(gè)道理吧


          緊接著就是前面兩篇寫過的騰訊&字節(jié)的面試,直到3月18阿里開正式系統(tǒng),才有之后的故事:part2:3+1交叉面+1hr面?其中第3面簡(jiǎn)單粗暴 & 慘不忍睹


          part2 面經(jīng)


          淘系技術(shù)部 數(shù)據(jù)分析


          一面 2020.03.26 30min
          1. 自我介紹
          2. 為什么轉(zhuǎn)到數(shù)學(xué)?遇到的最大困難和解決辦法
          3. 數(shù)據(jù)分析分很多種,阿里實(shí)習(xí)和轉(zhuǎn)正要求是同一崗位,你為什么想做偏業(yè)務(wù)的呢?

          4. 你在yy具體什么部門負(fù)責(zé)什么業(yè)務(wù)?組織架構(gòu)是怎樣的?

          5. 統(tǒng)計(jì)

          • 用小白鼠做實(shí)驗(yàn),如何驗(yàn)證新藥劑是否有作用?

          • 如果p值比a大,就斷定新藥劑有作用嗎?

            統(tǒng)計(jì)顯著性和檢驗(yàn)顯著性


          6. 業(yè)務(wù)題

          • 淘寶活動(dòng),怎么設(shè)計(jì)優(yōu)惠券的滿、減金額,使gmv最大?怎么設(shè)計(jì)?怎么對(duì)比?最后看什么數(shù)據(jù)?

            對(duì)比:不能只考慮gmv值的絕對(duì)差異,還要考慮退貨訂單率

          • 對(duì)于設(shè)計(jì)出來的兩三種優(yōu)惠券,基于過去的數(shù)據(jù),怎么給商家配比?通過什么維度?如何衡量好壞?

          7. 提問:
          • 具體部門:淘系技術(shù)部 - 商業(yè)機(jī)器智能部門

          • 不足:互聯(lián)網(wǎng)相關(guān)實(shí)踐較少,多看一些行業(yè)報(bào)告是如何分析問題的


          面試官說他之前面的都是社招,也不太了解我這種沒啥實(shí)踐的校招生應(yīng)該是什么水平(害 maybe他以為校招生都跟我一樣菜了 ?

          二面 2020.04.01 35min+11min(面試官介紹工作內(nèi)容)

          1. 實(shí)習(xí)的匯報(bào)線和分工,圍繞具體負(fù)責(zé)的產(chǎn)品功能介紹工作內(nèi)容
          2. 實(shí)習(xí)case
          • 你覺得最難的點(diǎn)?

            分業(yè)務(wù)和技術(shù)展開講

          • 技術(shù)層面遇到的問題 & 怎么解決的?技術(shù)層面的提升有哪些?

          3. sql
          • sql的優(yōu)化有哪些

          • 小表在前,大表在后的優(yōu)化原理

          • tb有一列數(shù),保證不重復(fù),打印出相加等于100的數(shù),2&98 與98&2只打印出一行即可


          4. 業(yè)務(wù)題

          • 道路交通事故,男司機(jī)出現(xiàn)事故占90%,女司機(jī)出現(xiàn)事故占10%,是否說明男司機(jī)比女司機(jī)更容易出現(xiàn)交通事故?

            不對(duì),基數(shù)不一樣

          • 除了人數(shù),還需要考慮什么因素?(這才意識(shí)到是想考我控制變量法)

            除了性別,其他因素都一樣:統(tǒng)計(jì)的時(shí)間區(qū)間、駕駛車的類型(幾座、牌子)、車齡、司機(jī)駕齡...


          5. 概率題54張牌分成三份,4個(gè)A一起的概率
          ????高中數(shù)學(xué)的古典概型問題

          6. 代碼能力,python什么程度?具體使用情況?spark的使用?數(shù)據(jù)清洗的時(shí)間格式轉(zhuǎn)換?

          7. 提問:

          • 數(shù)據(jù)分析具體工作做什么?

          ????????數(shù)據(jù)賦能,大團(tuán)隊(duì)包括算法、數(shù)據(jù)

          ????????對(duì)外發(fā)揮價(jià)值的方式:以分析為主導(dǎo),為運(yùn)營(yíng)、產(chǎn)品迭代提供幫助;算法賦能,抽象建模

          • 如何提升?

          ????????業(yè)務(wù)上的理解可以在實(shí)習(xí)中逐漸積累、繼續(xù)沉淀;技術(shù)層面:python等是一方面,還要學(xué)習(xí)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘相關(guān)算法


          三面 2020.04.03 15+3min

          面試官前一天打電話約時(shí)間和面試時(shí)都十分高冷,看??蜕系拿娼?jīng)說第三面很有可能是壓力面,不出所料,果然面到心態(tài)爆炸?

          1. spark是用java還是scala?
          ????emmm 主要是在云計(jì)算平臺(tái)上寫spark sql,沒有涉及到更底層的

          2. spark sql和普通sql有什么區(qū)別?運(yùn)行的時(shí)候遇到過哪些錯(cuò)誤?具體報(bào)錯(cuò)的信息是什么?

          ????再次... ?這兩個(gè)spark相關(guān)的問題答得是相當(dāng)辣雞,這一刻感覺自己呼吸都是尷尬的


          3. 靈魂拷問系列

          ??? Q:對(duì)一列數(shù)據(jù)進(jìn)行二值化,使得二值化后的數(shù)據(jù)均方誤差最小

          ??? A:聚類算法的思想:k-means

          ??? Q:你確定你的答案嗎?還有什么快速方法?

          ??? A:確定。從小到大排列,取1/4和3/4分位數(shù)

          ??? Q:如果不排序,還有什么方法?

          ??? A:是否需要精確找到這兩個(gè)數(shù)?數(shù)據(jù)量很大嗎?可以當(dāng)成正態(tài)分布來做嗎

          ??? Q:精確找到,沒有分布信息

          ????...

          ??? A:是要精確找到這個(gè)數(shù)嗎?

          ??? Q:是,你剛才已經(jīng)問過了

          ????...

          ??? A:用二分法,對(duì)于排在中間位置的數(shù),比它小就往前排,比它大就往后排...


          4. 30個(gè)人去旅游,有A、B、C、D、E 5個(gè)地方供選擇,每人投一票,兩種投票方式:

          :選出票數(shù)最多的地點(diǎn)(如果票數(shù)相同,對(duì)于相同地點(diǎn)繼續(xù)投票)

          二:每一輪淘汰一個(gè)票數(shù)最少的地點(diǎn),直到只剩一個(gè)地點(diǎn)

          這兩種投票方式有區(qū)別嗎?為什么?講出這兩種投票方式的優(yōu)缺點(diǎn)2-3個(gè)

          一:盡可能滿足更多人的第一志愿,二:盡可能提升所有人的平均滿意度

          5. 提問:

          • 和前面的面試官是一個(gè)部門嗎?

          ????????面試官:你還沒有到交叉面試環(huán)節(jié)

          • spark sql那一塊是不是答得很不好?

          ????????面試官:你覺得這是什么原因?


          靈魂拷問系列中的兩個(gè)...,是我面試中度過最漫長(zhǎng)的兩分鐘。最后這兩個(gè)死亡提問,現(xiàn)在回憶起來仍令我倒吸一口涼氣,maybe真是壓力面?!但我還是硬著頭皮認(rèn)真解釋了剛開始為什么答得不好以及之后的改進(jìn)方向,可能有扳回0.1成?



          因?yàn)槿婊卮鸬锰彪u,一直以為自己被掛掉了,但是官網(wǎng)流程沒更新。14號(hào)接到阿里面試官電話,開口第一句:我是螞蟻金服的算法工程師...

          學(xué)姐說阿里的交叉面一般是阿里內(nèi)部or螞蟻內(nèi)部的交叉,我可能是被轉(zhuǎn)崗了,想到自己又要從頭開始,仿佛看到騰訊0-7的悲慘戰(zhàn)績(jī),差點(diǎn)沒緩過來?

          四面 2020.04.14 30min (螞蟻金服交叉面)

          1. ccf項(xiàng)目 ? 13min

          • 方案賽和算法賽的區(qū)別、復(fù)賽思路展開

          • 你們都不是網(wǎng)絡(luò)安全相關(guān)專業(yè)的,怎么想到這么去做的呢?

          • 如果不知道業(yè)務(wù)知識(shí),怎么去分析?

            數(shù)據(jù)如果脫離業(yè)務(wù)背景,分析就沒有意義

          • 企業(yè)里復(fù)用,對(duì)于噪聲影響怎么優(yōu)化分析思路?

          • 具體分工 & 最終得到的結(jié)果


          2. 簡(jiǎn)歷里提到的用戶行為分析 ? ?7min

          • 具體:

            從用戶打開app開始,分析付費(fèi)用戶的前續(xù)行為

          • 報(bào)表的作用:

            為選取搭建基礎(chǔ)數(shù)據(jù)報(bào)表體系的指標(biāo)提供支持,為產(chǎn)品迭代提供方向

          • 除了數(shù)據(jù)結(jié)果,還可以從哪些方向優(yōu)化app?


          3. 遷移到螞蟻金服的業(yè)務(wù)(數(shù)字金融線),怎么界定行為的轉(zhuǎn)化,比如用戶從最初使用余額寶??穩(wěn)健型理財(cái)產(chǎn)品??風(fēng)險(xiǎn)型基金這樣一個(gè)進(jìn)階過程

          • 定義優(yōu)質(zhì)客戶:在螞蟻上花費(fèi)較多的用戶,時(shí)間序列觀察行為轉(zhuǎn)變過程

          • 定義轉(zhuǎn)化的關(guān)鍵步驟:從數(shù)據(jù)上發(fā)現(xiàn)哪兩步之間存在比較大的gap,結(jié)合業(yè)務(wù)定位問題

          4. 提問:

          • 面試流程:面試官表示是他老板讓他面的,他不清楚我前面的流程,以為是一面

          • 具體工作:用數(shù)據(jù)指導(dǎo)業(yè)務(wù)同學(xué)推薦適合的理財(cái)產(chǎn)品;描繪用戶的進(jìn)階路線(用戶行為模式的探索)


          算是最順利的一次面試了,面試官表示我的分析思路和他們的實(shí)際工作基本一致,詢問到的工作內(nèi)容也是我比較感興趣的,好像互相都還覺得比較match。當(dāng)時(shí)我倆都以為是一面,問題也都是圍繞簡(jiǎn)歷展開的。

          第二天問了內(nèi)推的大哥(第一次簡(jiǎn)歷面的面試官)才知道,交叉面通過了,可以安心等待hr面

          如果四面面試官知道這是交叉面,想必不會(huì)這么容易了吧

          hr面 2020.04.16 30min 視頻面

          1. 疫情期間在家的安排
          2. 阿里業(yè)務(wù)介紹
          ????部門200人,90%以上是算法工程師
          3. 交叉面的問題
          hr姐姐表示他們是淘系面試最嚴(yán)格的部門,交叉面必須要跨大的bu
          4. 實(shí)習(xí)時(shí)間:
          • 之前沒有疫情影響,阿里是要求5月-10月底,具體看同學(xué)的時(shí)間

          • 10月底會(huì)有轉(zhuǎn)正面試,11/12月三方簽署


          5. 你是一個(gè)什么樣的人 & 興趣愛好
          6. 你想和什么樣的人一起工作
          老板:邏輯清晰,一針見血,有整體的框架性考慮,工作時(shí)認(rèn)真,私下略活潑。拎得清、分得開
          同事:工作能力強(qiáng),善于溝通,好相處
          7. 你遇到的比較難的事?
          8. 你想在哪個(gè)城市工作?
          淘系大部分base杭州,少量北京

          03 面試 over


          阿里面試風(fēng)格還是比較鮮明

          1. 很可能沒有自我介紹,直接看簡(jiǎn)歷問問題,我hr面都沒有讓自我介紹?

          2. 之前實(shí)習(xí)工作的部門組織架構(gòu)及匯報(bào)線
          被問到三四次,考察你是否了解公司和業(yè)務(wù)的整體運(yùn)作情況

          3.?更注重發(fā)現(xiàn)問題 & 怎么想到解決方法的思路
          騰訊更多會(huì)問怎么解決,阿里更多會(huì)問怎么想到這么去解決

          4.?如果面試發(fā)揮得不好,最后提問環(huán)節(jié)也是一個(gè)重要機(jī)會(huì)噢


          ·················END·················

          推薦閱讀

          1. 說說心里話

          2. 寫給所有數(shù)據(jù)人。

          3. 從留存率業(yè)務(wù)案例談0-1的數(shù)據(jù)指標(biāo)體系

          4. NB,真PDF神處理工具!

          5. 超級(jí)菜鳥如何入門數(shù)據(jù)分析?


          歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」

          瀏覽 110
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  神马影院午夜福利 | 干我操我 | 黄色一级A片不卡 | 国产精品99久久久久久久久 | 91人妻人人人 |