<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          2021某大廠數(shù)據(jù)分析筆試題解析

          共 3073字,需瀏覽 7分鐘

           ·

          2021-11-26 21:12


          導(dǎo)讀:從??途W(wǎng)上找到的搜狐暢游數(shù)據(jù)分析崗位的筆試題,精選了14道題目來(lái)給大家解析下,內(nèi)容涵蓋統(tǒng)計(jì)學(xué)、Excel、SQL、Python、業(yè)務(wù)理解。


          作者:蝦殼可樂(lè)
          來(lái)源:可樂(lè)的數(shù)據(jù)分析之路(ID:the_way_of_data_cola)




          01?統(tǒng)計(jì)學(xué)

          No.1 若咖啡和茶葉互為替代品,當(dāng)咖啡價(jià)格上升時(shí),茶葉需求量的變化趨勢(shì)是:

          • 答案:增加

          • 解析:供求關(guān)系的影響,咖啡價(jià)格上升,買的人少,咖啡和茶互為替代品,大家會(huì)選擇價(jià)格沒(méi)上漲的茶。

          No.2 游戲中玩家可以通過(guò)兩種途徑清涼一夏活動(dòng)、西瓜大賽活動(dòng)獲得玉瓤,假設(shè)每個(gè)活動(dòng)獲得玉瓤數(shù)概率如下表所示:活動(dòng)上線后,某玩家隨機(jī)選擇參加一活動(dòng),結(jié)果獲得了25個(gè)玉瓤。請(qǐng)問(wèn)該玩家參加的是清涼一夏活動(dòng)的概率。


          • 答案:4/7

          • 解析:

          考察貝葉斯概率:

          A事件為清涼一夏,B事件為獲得25個(gè)瓜瓤

          P(A)= 0.5 即參加清涼一夏活動(dòng)的概率

          P(B)= (0.4+0.3)/2 = 0.7/2 即獲得25個(gè)玉瓤的概率

          P(B|A)= 0.4 即參加清涼一夏活動(dòng)時(shí),獲得25個(gè)玉瓤的概率

          要求P(A|B) 即獲得25個(gè)玉瓤時(shí),參加的是清涼一夏活動(dòng)的概率

          貝葉斯概率:P(A|B)= P(B|A)*P(A)/P(B)

          代入:0.4*0.5/(0.7/2)= 4/7

          No.3 在游戲中,假設(shè)對(duì)于普通玩家,參加一次打圖活動(dòng)獲得藏寶圖的概率是0.5,每次打圖活動(dòng)相對(duì)獨(dú)立。某角色參加了10次打圖活動(dòng),獲得了9張藏寶圖,請(qǐng)問(wèn)該角色是否可以認(rèn)定為非普通玩家?

          1. 以0.01的校驗(yàn)水準(zhǔn)無(wú)法認(rèn)定,但以0.05的校驗(yàn)水準(zhǔn)可以認(rèn)定
          2. 以0.01的校驗(yàn)水準(zhǔn),可以認(rèn)定為非普通玩家
          3. 以0.05的校驗(yàn)水準(zhǔn)無(wú)法認(rèn)定

          • 答案:B

          • 解析:

          考察假設(shè)檢驗(yàn)。

          這是一個(gè)總體比例的檢驗(yàn)。

          原假設(shè):該角色為普通玩家,Π=0.5 備擇假設(shè):該角色為非普通玩家,Π≠0.5

          p=9/10

          n=10

          計(jì)算Z統(tǒng)計(jì)量:

          代入公式計(jì)算得到z≈2.53,這是一個(gè)單側(cè)檢驗(yàn),在0.01顯著性水平下,?= 2.32 < 2.53

          落在拒絕域外,不拒絕,即以0.01的校驗(yàn)水準(zhǔn),可以認(rèn)定為非普通玩家

          No.4 篩選了一批新用戶,統(tǒng)計(jì)其每天在線時(shí)長(zhǎng)、獲得經(jīng)驗(yàn)數(shù)據(jù)如下:角色id 平均每天在線時(shí)長(zhǎng)(小時(shí)) 平均每天獲得經(jīng)驗(yàn)(萬(wàn)) 請(qǐng)嘗試計(jì)算平均每天在線時(shí)長(zhǎng)數(shù)據(jù)、平均每天獲得經(jīng)驗(yàn)數(shù)據(jù)的協(xié)方差。


          • 答案:19/3

          • 解析:

          協(xié)方差表示的是兩個(gè)變量的總體的誤差??梢酝ㄋ椎睦斫鉃椋簝蓚€(gè)變量在變化過(guò)程中是同方向變化?還是反方向變化?變化程度如何?

          Cov(X,Y) = E(XY) - E(X)E(Y)

          X表示平均每天在線時(shí)長(zhǎng)

          Y表示平均每天獲得經(jīng)驗(yàn)

          E(X)是X的期望,E(X) = (4+5+9)/3=6

          E(Y)是Y的期望,E(Y) = (2+4+9)/3=5

          E(XY) = (42+54+9*9)/3 = 109/3

          帶入得到Cov(X,Y) = 19/3


          02 Excel

          No.5 如表A中記錄了玩家的賬號(hào)和消費(fèi)金額,表B中記錄了玩家的賬號(hào)和性別,現(xiàn)需要把表B中玩家性別信息匹配到表A中,在EXCEL中應(yīng)該用哪個(gè)函數(shù)?

          1. LOOKUP
          2. SEARCH
          3. MATCH
          4. VLOOKUP

          • 答案:VLOOKUP

          • 解析:這題就很簡(jiǎn)單了,考察Excel里的兩表匹配的函數(shù),即VLOOKUP。


          03 業(yè)務(wù)理解

          No.6 以下哪組指標(biāo)都是付費(fèi)項(xiàng)指標(biāo):

          1. APA,ARPU
          2. APA,DAU
          3. DAU,ARPU
          4. DAU,DAOT

          • 答案:APA,ARPU

          • 解析:

          • APA (Active Payment Account):活躍付費(fèi)用戶數(shù)
          • ARPU(Average Revenue per User):每用戶平均收入
          • DAU(Daily Active Users):日活躍用戶數(shù)量

          No.7 指標(biāo)定義:新用戶n日留存率=新用戶游戲的第n天留存數(shù)/新用戶數(shù)。那么,7月8日新增用戶2000人,這2000人在7月9日,7月10日,7月11日分別上線了500,400,350人,那么7月8日新增用戶的3日留存率為多少(請(qǐng)以百分?jǐn)?shù)展現(xiàn),小數(shù)點(diǎn)后保留一位)

          • 答案:20%

          • 解析:

          • Day 1 7月8日,新增2000人
          • Day 2 7月9日,留存500人
          • Day 3 7月10日,留存400人

          7月8日的3日留存率 = 7月8日當(dāng)天新增用戶中第三天還登錄的用戶 / 7月8日新增用戶數(shù) = 400/2000 = 20%


          04 SQL

          接下來(lái)是SQL題。

          No.8 SQL中常用的條件表達(dá)式有:

          1. case when
          2. if else
          3. if else when
          4. switch

          • 答案:case when

          • 解析:SQL里的條件表達(dá)式就是case when

          No.9 SQL中用于將某種數(shù)據(jù)類型的表達(dá)式顯式轉(zhuǎn)換為另一種數(shù)據(jù)類型的函數(shù)是

          1. concat
          2. isnumeric
          3. change
          4. cast

          • 答案:cast

          • 解析:

          CAST函數(shù)用于將某種數(shù)據(jù)類型的表達(dá)式顯式轉(zhuǎn)換為另一種數(shù)據(jù)類型。

          比如:

          SELECT?CAST(NOW()?AS?DATE)

          得到結(jié)果:2021-11-04,而直接輸入now()的結(jié)果是帶時(shí)間的。將時(shí)間類型轉(zhuǎn)換為日期。

          No.10 數(shù)據(jù)庫(kù)中的表A記錄了某天玩家登錄游戲的所有記錄,表A中共有2個(gè)字段,一個(gè)是記錄玩家登錄時(shí)間的字段time,一個(gè)是記錄玩家游戲賬號(hào)的字段cnmaster,現(xiàn)需要計(jì)算這天登錄過(guò)游戲的不重復(fù)賬號(hào)個(gè)數(shù),SQL命令是:

          • 答案:

          select?count(distinct?cnmaster)?from?A

          • 解析:考察SQL語(yǔ)句計(jì)數(shù)與去重。

          No.11 數(shù)據(jù)庫(kù)有兩張表, A表為游戲登出表,用戶每次下線時(shí)記錄一條:dt(登出日期),servertime(登出時(shí)間),userid(用戶id),onlinetime(當(dāng)次在線時(shí)長(zhǎng)(單位:秒),int);B表為游戲充值表,用戶每次充值記錄一條:dt(充值日期),servertime(充值時(shí)間),userid(用戶id),money(充值金額,int) 請(qǐng)查出:

          1. 2018年9月1日~2018年9月7日每天用戶平均在線時(shí)長(zhǎng)。指標(biāo)說(shuō)明:平均在線時(shí)長(zhǎng)=總在線時(shí)間/用戶數(shù)。
          2. 2018年9月1日當(dāng)天,總在線時(shí)長(zhǎng)超過(guò)20分鐘以上的用戶的付費(fèi)總金額。

          • 答案:

          --?第一題
          select?dt,sum(onlinetime)/count(uesrid)?as?'平均在線時(shí)長(zhǎng)'
          from?A
          where?dt?between?'2018-09-01'?and?'2018-09-07'
          group?by?dt

          --?第二題
          select?userid,sum(money)
          from?B
          where?userid?=?
          (
          ??select?userid?
          ??from?A
          ??where?dt?=?'2018-09-01'?
          ??group?by?userid
          ??having?sum(onlinetime)?>20*60
          )
          group?by?userid

          • 解析:第二題中先找出2018年9月1日當(dāng)天,總在線時(shí)長(zhǎng)超過(guò)20分鐘以上的用戶的id,再求這些用戶付費(fèi)總金額,用到了子查詢。


          05?Python

          No.12 使用python的matplotlib工具包繪制折線圖,所用的函數(shù)是

          1. plot
          2. scatter
          3. sort
          4. input

          • 答案:plot

          • 解析:不多說(shuō)了,基礎(chǔ),plot繪圖。

          No.13 以下python命令的輸出結(jié)果為:

          zhandouli=16000
          if?zhandouli?10000:
          print("初入江湖")
          elif?zhandouli?30000:
          print("小有名氣")
          else
          print("名動(dòng)一方")

          • 答案:小有名氣

          • 解析:也是基礎(chǔ),10000<16000<30000,所以輸出小有名氣。

          No.14 在Python中輸入以下命令,輸出結(jié)果為:

          s=0
          for?k?in?range(101):
          ????s=s+k
          print?(s)

          • 答案:5050

          • 解析:range(101)返回的結(jié)果是0到100,這題是0到100相加的等差數(shù)列,結(jié)果是5050.

          總的來(lái)說(shuō),題目偏簡(jiǎn)單,考察的都是很基礎(chǔ)的內(nèi)容,比如Excel只考察了vlookup是做什么用的,但實(shí)際用起來(lái)才會(huì)知道它更多的坑,這也就是筆試/面試和工作的區(qū)別。當(dāng)然首先得有敲門磚,進(jìn)來(lái)后再深入學(xué)習(xí)也不晚。


          延伸閱讀??

          延伸閱讀《利用Python進(jìn)行數(shù)據(jù)分析

          干貨直達(dá)??



          更多精彩??

          在公眾號(hào)對(duì)話框輸入以下關(guān)鍵詞
          查看更多優(yōu)質(zhì)內(nèi)容!

          讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手
          大數(shù)據(jù)?|?云計(jì)算?|?數(shù)據(jù)庫(kù)?|?Python?|?爬蟲(chóng)?|?可視化
          AI?|?人工智能?|?機(jī)器學(xué)習(xí)?|?深度學(xué)習(xí)?|?NLP
          5G?|?中臺(tái)?|?用戶畫像?|?數(shù)學(xué)?|?算法?|?數(shù)字孿生

          據(jù)統(tǒng)計(jì),99%的大咖都關(guān)注了這個(gè)公眾號(hào)
          ??
          瀏覽 14
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲宗合在线视频 | 亚洲黄免费 | AV在线直播 | 大香蕉色综合 | 最新国产精品视频 |