2021某大廠數(shù)據(jù)分析筆試題解析

導(dǎo)讀:從??途W(wǎng)上找到的搜狐暢游數(shù)據(jù)分析崗位的筆試題,精選了14道題目來(lái)給大家解析下,內(nèi)容涵蓋統(tǒng)計(jì)學(xué)、Excel、SQL、Python、業(yè)務(wù)理解。

No.1 若咖啡和茶葉互為替代品,當(dāng)咖啡價(jià)格上升時(shí),茶葉需求量的變化趨勢(shì)是:
答案:增加
解析:供求關(guān)系的影響,咖啡價(jià)格上升,買的人少,咖啡和茶互為替代品,大家會(huì)選擇價(jià)格沒(méi)上漲的茶。
No.2 游戲中玩家可以通過(guò)兩種途徑清涼一夏活動(dòng)、西瓜大賽活動(dòng)獲得玉瓤,假設(shè)每個(gè)活動(dòng)獲得玉瓤數(shù)概率如下表所示:活動(dòng)上線后,某玩家隨機(jī)選擇參加一活動(dòng),結(jié)果獲得了25個(gè)玉瓤。請(qǐng)問(wèn)該玩家參加的是清涼一夏活動(dòng)的概率。

答案:4/7
解析:
No.3 在游戲中,假設(shè)對(duì)于普通玩家,參加一次打圖活動(dòng)獲得藏寶圖的概率是0.5,每次打圖活動(dòng)相對(duì)獨(dú)立。某角色參加了10次打圖活動(dòng),獲得了9張藏寶圖,請(qǐng)問(wèn)該角色是否可以認(rèn)定為非普通玩家?
以0.01的校驗(yàn)水準(zhǔn)無(wú)法認(rèn)定,但以0.05的校驗(yàn)水準(zhǔn)可以認(rèn)定 以0.01的校驗(yàn)水準(zhǔn),可以認(rèn)定為非普通玩家 以0.05的校驗(yàn)水準(zhǔn)無(wú)法認(rèn)定
答案:B
解析:
No.4 篩選了一批新用戶,統(tǒng)計(jì)其每天在線時(shí)長(zhǎng)、獲得經(jīng)驗(yàn)數(shù)據(jù)如下:角色id 平均每天在線時(shí)長(zhǎng)(小時(shí)) 平均每天獲得經(jīng)驗(yàn)(萬(wàn)) 請(qǐng)嘗試計(jì)算平均每天在線時(shí)長(zhǎng)數(shù)據(jù)、平均每天獲得經(jīng)驗(yàn)數(shù)據(jù)的協(xié)方差。

答案:19/3
解析:
No.5 如表A中記錄了玩家的賬號(hào)和消費(fèi)金額,表B中記錄了玩家的賬號(hào)和性別,現(xiàn)需要把表B中玩家性別信息匹配到表A中,在EXCEL中應(yīng)該用哪個(gè)函數(shù)?
LOOKUP SEARCH MATCH VLOOKUP
答案:VLOOKUP
解析:這題就很簡(jiǎn)單了,考察Excel里的兩表匹配的函數(shù),即VLOOKUP。
No.6 以下哪組指標(biāo)都是付費(fèi)項(xiàng)指標(biāo):
APA,ARPU APA,DAU DAU,ARPU DAU,DAOT
答案:APA,ARPU
解析:
APA (Active Payment Account):活躍付費(fèi)用戶數(shù) ARPU(Average Revenue per User):每用戶平均收入 DAU(Daily Active Users):日活躍用戶數(shù)量
No.7 指標(biāo)定義:新用戶n日留存率=新用戶游戲的第n天留存數(shù)/新用戶數(shù)。那么,7月8日新增用戶2000人,這2000人在7月9日,7月10日,7月11日分別上線了500,400,350人,那么7月8日新增用戶的3日留存率為多少(請(qǐng)以百分?jǐn)?shù)展現(xiàn),小數(shù)點(diǎn)后保留一位)
答案:20%
解析:
Day 1 7月8日,新增2000人 Day 2 7月9日,留存500人 Day 3 7月10日,留存400人
No.8 SQL中常用的條件表達(dá)式有:
case when if else if else when switch
答案:case when
解析:SQL里的條件表達(dá)式就是case when
No.9 SQL中用于將某種數(shù)據(jù)類型的表達(dá)式顯式轉(zhuǎn)換為另一種數(shù)據(jù)類型的函數(shù)是
concat isnumeric change cast
答案:cast
解析:
SELECT?CAST(NOW()?AS?DATE)No.10 數(shù)據(jù)庫(kù)中的表A記錄了某天玩家登錄游戲的所有記錄,表A中共有2個(gè)字段,一個(gè)是記錄玩家登錄時(shí)間的字段time,一個(gè)是記錄玩家游戲賬號(hào)的字段cnmaster,現(xiàn)需要計(jì)算這天登錄過(guò)游戲的不重復(fù)賬號(hào)個(gè)數(shù),SQL命令是:
答案:
select?count(distinct?cnmaster)?from?A
解析:考察SQL語(yǔ)句計(jì)數(shù)與去重。
No.11 數(shù)據(jù)庫(kù)有兩張表, A表為游戲登出表,用戶每次下線時(shí)記錄一條:dt(登出日期),servertime(登出時(shí)間),userid(用戶id),onlinetime(當(dāng)次在線時(shí)長(zhǎng)(單位:秒),int);B表為游戲充值表,用戶每次充值記錄一條:dt(充值日期),servertime(充值時(shí)間),userid(用戶id),money(充值金額,int) 請(qǐng)查出:
2018年9月1日~2018年9月7日每天用戶平均在線時(shí)長(zhǎng)。指標(biāo)說(shuō)明:平均在線時(shí)長(zhǎng)=總在線時(shí)間/用戶數(shù)。 2018年9月1日當(dāng)天,總在線時(shí)長(zhǎng)超過(guò)20分鐘以上的用戶的付費(fèi)總金額。
答案:
--?第一題
select?dt,sum(onlinetime)/count(uesrid)?as?'平均在線時(shí)長(zhǎng)'
from?A
where?dt?between?'2018-09-01'?and?'2018-09-07'
group?by?dt
--?第二題
select?userid,sum(money)
from?B
where?userid?=?
(
??select?userid?
??from?A
??where?dt?=?'2018-09-01'?
??group?by?userid
??having?sum(onlinetime)?>20*60
)
group?by?userid解析:第二題中先找出2018年9月1日當(dāng)天,總在線時(shí)長(zhǎng)超過(guò)20分鐘以上的用戶的id,再求這些用戶付費(fèi)總金額,用到了子查詢。
No.12 使用python的matplotlib工具包繪制折線圖,所用的函數(shù)是
plot scatter sort input
答案:plot
解析:不多說(shuō)了,基礎(chǔ),plot繪圖。
No.13 以下python命令的輸出結(jié)果為:
zhandouli=16000
if?zhandouli?10000:
print("初入江湖")
elif?zhandouli?30000:
print("小有名氣")
else:
print("名動(dòng)一方")答案:小有名氣
解析:也是基礎(chǔ),10000<16000<30000,所以輸出小有名氣。
No.14 在Python中輸入以下命令,輸出結(jié)果為:
s=0
for?k?in?range(101):
????s=s+k
print?(s)答案:5050
解析:range(101)返回的結(jié)果是0到100,這題是0到100相加的等差數(shù)列,結(jié)果是5050.


干貨直達(dá)??
評(píng)論
圖片
表情
