<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          數(shù)據(jù)分析在風(fēng)控。

          共 7257字,需瀏覽 15分鐘

           ·

          2021-08-20 17:23

          大家好,我是寶器!


          大數(shù)據(jù)領(lǐng)域就沒(méi)有不做數(shù)據(jù)分析的,大數(shù)據(jù)風(fēng)控也不例外。


          我的觀點(diǎn)是風(fēng)控和其他互聯(lián)網(wǎng)業(yè)務(wù)都是互通的,本文介紹下風(fēng)控中必做的數(shù)據(jù)分析,用以說(shuō)明數(shù)據(jù)分析是一通百通的。


          工欲善其事,必先利其器。先說(shuō)下數(shù)據(jù)分析的工具。


          分析工具,最通用的包括Excel、SQL和Python。


          即使大家是技術(shù)崗位,也沒(méi)有必要技能歧視,用Python并不會(huì)比用Excel和SQL高級(jí)。算法工程師都自嘲SQL boy。SQL是數(shù)據(jù)分析師以及算法工程師用的最多的技能。能不能從海量的業(yè)務(wù)數(shù)據(jù)中取出正確的數(shù)據(jù),是解決問(wèn)題的前提。而Excel透視表強(qiáng)大到萬(wàn)物皆可透視。不夸張地說(shuō),我就沒(méi)見(jiàn)過(guò)透視表解決不了的問(wèn)題。


          數(shù)據(jù)分析平臺(tái),開(kāi)源的有metabase,收費(fèi)的有tableau,都可以連接數(shù)據(jù)庫(kù)實(shí)時(shí)交互,并提供豐富的智能儀表盤(pán)。


          個(gè)人推薦開(kāi)源的BI工具M(jìn)etabase,它具有可視化操作界面的數(shù)據(jù)分析和查詢(xún)功能,讓不懂SQL的用戶(hù)可能夠快速掌握業(yè)務(wù)數(shù)據(jù),也支持團(tuán)隊(duì)共享業(yè)務(wù)數(shù)據(jù),是一個(gè)很不錯(cuò)的BI解決方案。




          01

          業(yè)務(wù)理解



          如果一家金融機(jī)構(gòu)聘請(qǐng)你給他們的風(fēng)控業(yè)務(wù)做咨詢(xún),你知道怎么辦嗎?


          別告訴我,你想硬搬風(fēng)控建模比賽的那套東西。不要掉價(jià)。


          解決方案一定是針對(duì)當(dāng)前業(yè)務(wù)和用戶(hù)客群獨(dú)家定制的。你可以嫁接kaggle比賽的經(jīng)驗(yàn),但要站在巨人的肩膀上。好比你訓(xùn)練一個(gè)人臉識(shí)別工具,你不能找到了經(jīng)典的網(wǎng)絡(luò)結(jié)果就萬(wàn)事大吉了,你需要去fine-tune。


          那么怎么理解業(yè)務(wù)?


          這個(gè)問(wèn)題等同于怎么理解你的客戶(hù)。客戶(hù)是你業(yè)務(wù)唯一重要的資源。Know your customer!


          用戶(hù)畫(huà)像是了解你的客戶(hù)的有效方式,常見(jiàn)的用戶(hù)畫(huà)像包括但不限于年齡、性別、手機(jī)歸屬地、學(xué)歷、職業(yè)、婚姻狀態(tài)、機(jī)型、銀行卡、消費(fèi)、app偏好等?;ソ鹩脩?hù)還有新老戶(hù)比例、額度、息費(fèi)、多頭程度、借款次數(shù)、借款金額、展期次數(shù)、逾期次數(shù)、逾期升期等。


          客戶(hù)的城市分布就可以通過(guò)統(tǒng)計(jì)作圖如下,從而對(duì)業(yè)務(wù)覆蓋范圍有清楚的認(rèn)識(shí)。



          客群基礎(chǔ)信息的畫(huà)像適合于任何一個(gè)互聯(lián)網(wǎng)to C的業(yè)務(wù)場(chǎng)景,可以據(jù)此了解自己的客群分布。如果要拓展新用戶(hù),它就幫你確定了投放渠道和產(chǎn)品定價(jià)等。


          但要想真正對(duì)業(yè)務(wù)提供sense,與業(yè)務(wù)直接相關(guān)的數(shù)據(jù)是最重要的。上面的新老戶(hù)比例、額度息費(fèi)、多頭、借款次數(shù)與金額、展期次數(shù)、逾期次數(shù)、逾期升期等就是這樣的數(shù)據(jù)。


          我們可以圍繞這些數(shù)據(jù)構(gòu)建出對(duì)業(yè)務(wù)的理解,例如統(tǒng)計(jì)出如下數(shù)據(jù)結(jié)果。



          需要說(shuō)明的是,對(duì)于業(yè)務(wù)的理解,需要分析的絕不止以上內(nèi)容。


          通過(guò)KYC,你可以大致知道發(fā)力的方向在哪里,是拓展新戶(hù)還是挖掘存戶(hù),是提升風(fēng)控能力還是優(yōu)化產(chǎn)品設(shè)計(jì),等等。



          02

          漏斗分析


          進(jìn)件漏斗分析可以幫助我們定位到產(chǎn)品設(shè)計(jì)的薄弱位置,從而針對(duì)優(yōu)化。


          不失一般性,進(jìn)件漏斗可以是,點(diǎn)擊->下載->點(diǎn)擊申請(qǐng)->個(gè)人信息->運(yùn)營(yíng)商認(rèn)證->人臉識(shí)別->規(guī)則通過(guò)->模型通過(guò)->綁定銀行卡->開(kāi)始借款—>放款。


          在這,申請(qǐng)流程假設(shè)為填寫(xiě)個(gè)人信息,再手機(jī)號(hào)認(rèn)證,再人臉識(shí)別,再進(jìn)行強(qiáng)規(guī)則審批,再到模型審批,通過(guò)之后再綁卡,后進(jìn)行借款。這套流程設(shè)計(jì)控制了客戶(hù)轉(zhuǎn)化鏈路,審批前除必要的信息外,綁卡操作進(jìn)行了后置,盡量減少轉(zhuǎn)化損失。


          這個(gè)漏斗分析很容易就可以計(jì)算出來(lái),例如我們要做一個(gè)渠道轉(zhuǎn)化表,可以這么算。


          select 
            channel,
            dt,
            register_cnt,
            download_cnt / register_cnt download_rate,                -- 注冊(cè)到下載
            click_apply_cnt / download_cnt click_apply_rate,          -- 下載到點(diǎn)擊申請(qǐng)
            personal_finish / click_apply_cnt personal_finish_rate,   -- 個(gè)人信息完成率
            carrier_finish / personal_finish carrier_finish_rate,     -- 運(yùn)營(yíng)商認(rèn)證完成率
            identity_finish / carrier_finish identity_finish_rate,    -- 人臉識(shí)別完成率
            rule_pass / identity_finish rule_pass_rate,               -- 規(guī)則審批通過(guò)率
            model_pass / rule_pass model_pass_rate,                   -- 模型審批通過(guò)率

            model_pass / identity_finish pass_rate                    -- 審批通過(guò)率
          from (
              select
                channel,                        -- 關(guān)注的渠道
                to_date(create_time) as dt,     -- 按天
                count(idas register_cnt,                                                        -- 注冊(cè)
                count(case when device is not null then id else null endas download_cnt,        -- 下載
                count(case when click_apply is not null then id else null endas click_apply_cnt,-- 點(diǎn)擊申請(qǐng)
                count(case when personal=1 then 1 else null endas personal_finish,              -- 個(gè)人信息完成
                count(case when carrier=1 then 1 else null endas carrier_finish,                -- 運(yùn)營(yíng)商認(rèn)證完成
                count(case when identity=1 then 1 else null endas identity_finish,              -- 人臉識(shí)別完成
                count(case when rule_result=1 then 1 else null endas rule_pass,                 -- 規(guī)則通過(guò)
                count(case when model_result=1 then 1 else null endas model_pass                -- 模型通過(guò)
              from user as u
              where to_date(create_time) >= '2021-01-01'
              group by 1,2
              ) t
          order by 1,2
          ;


          代碼中我們區(qū)分了關(guān)注的渠道,在貸前場(chǎng)景中我們一般很關(guān)注不同渠道的轉(zhuǎn)化情況,以便對(duì)渠道進(jìn)行優(yōu)化。轉(zhuǎn)化鏈路還可以往后追加。



          你的產(chǎn)品形式也許需要關(guān)注的點(diǎn)會(huì)和上面有所差異,但思路應(yīng)該沒(méi)有區(qū)別。


          漏斗轉(zhuǎn)化能幫助你了解到用戶(hù)容易在什么環(huán)節(jié)發(fā)生流失。轉(zhuǎn)化流和行業(yè)一般情況做對(duì)比,就可以快速了解你的產(chǎn)品設(shè)計(jì)有沒(méi)有大的問(wèn)題。


          不同時(shí)期業(yè)務(wù)的重心可能不同,需要關(guān)注的轉(zhuǎn)化也可能不同。



          03

          前端分析


          前端指的是用戶(hù)在申請(qǐng)時(shí)就可以統(tǒng)計(jì)得到的數(shù)據(jù),例如申請(qǐng)量、通過(guò)率、PSI、CSI和拒絕瀑布流等,漏斗分析一般也是前端分析。


          申請(qǐng)流量質(zhì)量的變化,可以關(guān)注到天的粒度,甚至可以是小時(shí)的粒度。一張折線圖就可以表現(xiàn)出來(lái),不同渠道可以放在同一張圖里方便對(duì)比。用戶(hù)質(zhì)量可以通過(guò)模型分的分布或者查詢(xún)的重要變量的分布衡量出來(lái),如多頭、收入等。


          PSI是群體穩(wěn)定性指標(biāo)(Population Stability Index),刻畫(huà)了不同期樣本在各分?jǐn)?shù)段分布的穩(wěn)定性。每個(gè)月申請(qǐng)流量的評(píng)分分布差異大不大,直接影響了決策結(jié)果的分布。



          CSI是特征穩(wěn)定性指標(biāo)(Characteristic Stability Index),用來(lái)衡量特征層面的變化。PSI對(duì)應(yīng)模型分,CSI對(duì)應(yīng)特征變量。特征有時(shí)候不像模型分能分布地那么開(kāi),像性別就只有男、女,如果還有未知,也就三種。


          因?yàn)槟P头质怯商卣鹘?jīng)過(guò)一套算法流計(jì)算出來(lái)的,模型分是一系列特征的表現(xiàn)。PSI異常的話,必然是某個(gè)或者某些特征發(fā)生異常,通過(guò)CSI分析就可以定位到哪些特征出現(xiàn)了問(wèn)題。后續(xù)就是針對(duì)性排除原因。


          在申請(qǐng)環(huán)節(jié),拒絕是一個(gè)瀑布流的過(guò)程。反欺詐拒絕的人,不用往后進(jìn)入到政策審批環(huán)節(jié),政策拒絕也不用在考慮模型拒不拒絕,因而這個(gè)流程可以統(tǒng)計(jì)出來(lái),以監(jiān)控拒絕瀑布流的穩(wěn)定性。



          04

          后端分析


          后端指的是用戶(hù)在申請(qǐng)時(shí),你無(wú)法得知,需要后延一個(gè)表現(xiàn)期才能計(jì)算得到的數(shù)據(jù),例如逾期率、模型效果等。表現(xiàn)期可長(zhǎng)可短,也可以是首逾,取決于具體的業(yè)務(wù)目標(biāo)和數(shù)據(jù)情況。


          逾期率,各家定義可能不太一樣,例如當(dāng)季逾期貸款剩余本金/當(dāng)季度放款總剩余本金,可以用來(lái)從橫向比較一下壞賬的波動(dòng)。對(duì)于模型層面,逾期率往往指的是壞用戶(hù)占比,是人數(shù)而非金額的比例。


          這個(gè)指標(biāo)計(jì)算是需要經(jīng)過(guò)一個(gè)時(shí)間窗口的,今天的用戶(hù)會(huì)是什么風(fēng)險(xiǎn),需要以后才能知道。這也就是為什么前端分析很重要了,申請(qǐng)通過(guò)用戶(hù)的質(zhì)量通過(guò)模型分和重要特征分布已經(jīng)進(jìn)行了一輪刻畫(huà)了。當(dāng)然,這些前端信息并不能完全衡量出后端的風(fēng)險(xiǎn)。


          Vintage分析是反映不同賬齡周期用戶(hù)的風(fēng)險(xiǎn)情況,直白地說(shuō),是各個(gè)時(shí)間階段(如月份)申請(qǐng)人在往后各個(gè)賬齡下有沒(méi)有出現(xiàn)過(guò)M1+逾期(或其他)的統(tǒng)計(jì)結(jié)果。vintage分析把不同期的樣本放在了一起,可以用來(lái)觀察不同期客群風(fēng)險(xiǎn)的變化,然后確定是流量本身的變化,還是宏觀形形勢(shì)的變化,還是風(fēng)控策略的變化等等。另外,vintage最常見(jiàn)的用途是確定表現(xiàn)期,因?yàn)槟阌^察到了各個(gè)賬齡下的風(fēng)險(xiǎn)表現(xiàn),取一個(gè)合適的賬齡長(zhǎng)度就有據(jù)可循了。


          遷徙率和滾動(dòng)率,我都覺(jué)得它倆本質(zhì)上并沒(méi)有說(shuō)很么區(qū)別,是反應(yīng)用戶(hù)狀態(tài)變化的比例。遷徙率呢,貸款從某一狀態(tài)進(jìn)入到下一個(gè)狀態(tài),如正常還款到M1期還款狀態(tài),M1變化成M2期還款狀態(tài)。滾動(dòng)率呢,首逾的用戶(hù)有多少會(huì)變成逾期7+,然后有多少會(huì)變成M1+,到M2+,到M3+等。逾期狀態(tài)的滾動(dòng)分析有助于我們確定建模目標(biāo)。假如逾期7+的人有很多人還會(huì)還,但逾期30+的人基本就不還款了,那我們就可以以30+為壞定義。大抵如此。


          排序性和準(zhǔn)確性,用來(lái)量化模型效果,主要通過(guò)Lift、Odds、KS、AUC、Gini等指標(biāo)進(jìn)行反映,其中KS值應(yīng)用尤為場(chǎng)景。KS值的優(yōu)勢(shì)在于它反應(yīng)的就是取最優(yōu)決策點(diǎn)時(shí)好壞用戶(hù)被拒絕掉的差異,和策略制定是直接相關(guān)的,可通過(guò)SQL和Excel計(jì)算。




          如大家所見(jiàn),在風(fēng)控領(lǐng)域所在的數(shù)據(jù)分析,應(yīng)該和其他互聯(lián)網(wǎng)領(lǐng)域的數(shù)分并無(wú)本質(zhì)區(qū)別。


          因?yàn)轱L(fēng)控和其他業(yè)務(wù)一樣,本質(zhì)都是用戶(hù)生命周期管理?;谙嗤牡讓舆壿?,數(shù)據(jù)分析必然也并無(wú)二致。

          ·················END·················

          推薦閱讀

          1. 我在字節(jié)做了哪些事

          2. 寫(xiě)給所有數(shù)據(jù)人。

          3. 從留存率業(yè)務(wù)案例談0-1的數(shù)據(jù)指標(biāo)體系

          4. 數(shù)據(jù)分析師的一周

          5. 超級(jí)菜鳥(niǎo)如何入門(mén)數(shù)據(jù)分析?


          歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」


          瀏覽 57
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文字幕日韩在线视频 | 国产操逼网站 | 午夜精品一区二区三区视频免费看 | 欧美成人乱轮 | 欧美操逼视频网 |