<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          面經(jīng) | 滴滴數(shù)據(jù)分析崗試題分享

          共 2301字,需瀏覽 5分鐘

           ·

          2020-08-05 23:19

          (給機器學(xué)習(xí)算法與Python實戰(zhàn)加星標(biāo),提升AI技能)

          逆流 |?作者?知乎專欄?| 來源

          1


          題目


          2

          w
          問題

          • 訂單的應(yīng)答率、完單率分別是多少?

          • 呼叫應(yīng)答時間多長?

          • 從這一周的數(shù)據(jù)來看,呼叫量最高的是哪一個小時(當(dāng)?shù)貢r間)?呼叫量最少的是哪一個小時(當(dāng)?shù)貢r間)?

          • 呼叫訂單第二天繼續(xù)呼叫的比例有多少?

          • 如果要對表中乘客進行分類,你認(rèn)為需要參考哪一些因素?


          3


          解題過程

          ?導(dǎo)入mysql數(shù)據(jù)庫及數(shù)據(jù)預(yù)處理?

          觀察表中時間相關(guān)數(shù)據(jù)結(jié)合題目,要做出2步數(shù)據(jù)預(yù)處理:
          • 將時間相關(guān)列轉(zhuǎn)換格式

          • 按巴西比中國慢11小時,將表中北京時間轉(zhuǎn)換為巴西時間



          -- 利用cast函數(shù)轉(zhuǎn)換成日期數(shù)據(jù)update didi setcall_time = cast(call_time as datetime),grab_time = cast(grab_time as datetime),cancel_time = cast(cancel_time as datetime),finish_time = cast(finish_time as datetime);

          -- 將北京時間調(diào)整為巴西時間,date_sub函數(shù)update didi setcall_time = date_sub(call_time,interval 11 hour ),grab_time = date_sub(grab_time,interval 11 hour ),cancel_time = date_sub(cancel_time,interval 11 hour ),finish_time = date_sub(finish_time,interval 11 hour );

          ?處理后數(shù)據(jù)?


          問題1:訂單的應(yīng)答率、完單率分別是多少?
          • 應(yīng)答率 = 應(yīng)答訂單數(shù) / 呼叫訂單數(shù)

          • 完單率 = 完成訂單數(shù) / 呼叫訂單數(shù)


          select sum(if(year(grab_time)<>1970,1,0))/count(call_time)as '應(yīng)答率',sum(if(year(finish_time)<>1970,1,0))/count(call_time)as '完單率'from didi


          問題2:呼叫應(yīng)答時間多長?


          -- 使用timestampdiff函數(shù),計算應(yīng)答時間與呼叫時間之間的時長
          select sum(TIMESTAMPDIFF(MINUTE,call_time,grab_time))/count(grab_time)as '呼叫應(yīng)答時間'
          from didi
          where year(grab_time)<>1970;

          問題3:從這一周的數(shù)據(jù)來看,呼叫量最高的是哪一個小時(當(dāng)?shù)貢r間)?呼叫量最少的是哪一個小時(當(dāng)?shù)貢r間)?

          根據(jù)題意,需要新增一列數(shù)據(jù),訂單呼叫時間的小時,進行分組分析

          -- 新增一列alter table didi add column call_time_hour VARCHAR(255);-- 使用substr函數(shù)做字符串截取,為新列賦值update didi set call_time_hour = SUBSTR(call_time from 12 for 2);
          -- 方法2:使用date_format函數(shù)轉(zhuǎn)換格式update didi set call_time_hour = DATE_FORMAT(call_time,'%k')


          -- 找出呼叫量最高的小時,顯示2行防止出現(xiàn)重復(fù)值。select call_time_hour,count(call_time)as'呼叫量'from didiGROUP BY call_time_hourORDER BY count(call_time) desclimit 2;


          -- 找出呼叫量最少的小時,顯示3行確認(rèn)是否有第三個相等值。select call_time_hour,count(call_time)as'呼叫量'from didiGROUP BY call_time_hourORDER BY count(call_time) asclimit 3;


          得出結(jié)論:呼叫量最高的是18時,呼叫量最少的是2和3時。

          問題4:呼叫訂單第二天繼續(xù)呼叫的比例有多少?

          select count(DISTINCT a.order_id)/(select count(DISTINCT order_id) from didi)as'第二天繼續(xù)呼叫比例' from didi a join didi bon a.passenger_id = b.passenger_idwhere datediff(a.call_time,b.call_time)=1


          問題5:如果要對表中乘客進行分類,你認(rèn)為需要參考哪一些因素?

          基于已有的表格中數(shù)據(jù),可以參RFM模型對用戶進行分類:
          • R:乘客上一次打車距離3月11日的時間間隔

          • F:乘客在數(shù)據(jù)期間的打車頻率

          • M:打車消費金額(表中無打車金額,可以用完成訂單總時長代替)



          -?END -
          加入機器學(xué)習(xí)、Python微信群
          請后臺回復(fù)【入群】

          推薦閱讀

          (點擊標(biāo)題可跳轉(zhuǎn)閱讀)

          集成學(xué)習(xí):一種先進的機器學(xué)習(xí)方法

          北大讀博手記:怎樣完成自己的博士生涯?

          周志華新作《機器學(xué)習(xí)理論導(dǎo)引》閱讀攻略

          2020年度最佳的23個的機器學(xué)習(xí)項目(附代碼)


          老鐵,三連支持一下,好嗎?↓↓↓

          瀏覽 44
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文字幕在线中文乱 | 91大黄片| 国产无码一级视频 | 成人丁香婷婷 | 少妇呻吟视频 |