滴滴數據倉庫指標體系建設實踐


桔妹導讀:指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規(guī)范化、工具化管理指標體系?本文會對建設的方法論結合滴滴數據指標體系建設實踐進行解答分析。

▍1.1?指標體系定義
指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通過單點看全局,通過全局解決單點的問題。它主要由指標和體系兩部分組成。
指標是指將業(yè)務單元細分后量化的度量值,它使得業(yè)務目標可描述、可度量、可拆解,它是業(yè)務和數據的結合,是統計的基礎,也是量化效果的重要依據。
指標主要分為結果型和過程型:
結果型指標
用于衡量用戶發(fā)生某個動作后所產生的結果,通常是延后知道的,很難進行干預。結果型指標更多的是監(jiān)控數據異常,或者是監(jiān)控某個場景下用戶需求是否被滿足過程型指標
用戶在做某個動作時候所產生的指標,可以通過某些運營策略來影響這個過程指標,從而影響最終的結果,過程型指標更加關注用戶的需求為什么被滿足或沒被滿足
?
體系是由不同的維度組成,而維度是指用戶觀察、思考與表述某事物的“思維角度”,維度是指標體系的核心,沒有維度,單純說指標是沒有任何意義的。
維度主要分為定性維度和定量維度,定性維度,主要是偏文字描述類如城市、性別、職業(yè)等;定量維度,主要是數值類描述如收入、年齡等,對定量維度需要做數值分組處理。
?
▍1.2 指標體系生命周期
?
生命周期主要包含定義、生產、消費、下線四個階段。針對整個生命周期要持續(xù)做指標運維、質量保障,同時為了提高指標數據復用度,降低用戶使用成本需要做對應的數據運營工作。

▍1.3 綜合使用場景
指標體系主要是結合用戶的業(yè)務場景來進行使用,多個不同的指標和維度可以組合起來進行業(yè)務的綜合分析,用戶可通過指標的變化看到整體業(yè)務的變化,并能夠快速發(fā)現問題、定位問題。常用的場景一種是決策分析的場景,通過數據看清業(yè)務現狀進行戰(zhàn)略決策支持,另一種是運營分析場景,無論是做用戶運營、產品運營還是活動運營都需要各類指標數據的支撐去看清問題、分析問題和指導解決問題。
2.?
為什么搭建指標體系

衡量業(yè)務發(fā)展質量 ? ?
指標體系可以反映業(yè)務客觀事實,看清業(yè)務發(fā)展現狀,通過指標對業(yè)務質量進行衡量,把控業(yè)務發(fā)展情況,針對發(fā)現的業(yè)務問題聚焦解決,促進業(yè)務有序增長 建立指標因果關系 ?
主要明確結果型指標和過程型指標關系,通過結果指標回溯過程指標,找到解決問題的核心原因
指導用戶分析工作 ?
目的建立產品評估體系、活動效果評估體系、智能運營分析體系指導基礎數據建設 ?
明確基礎數據建設方向,集中資源,避免過程和結果分析指標數據的遺漏或缺失指導內容產品建設 ??
結合用戶的業(yè)務場景來進行使用,多個不同的指標和維度可以組合起來進行業(yè)務的綜合分析,用戶可通過指標的變化看到整體業(yè)務的變化,并能夠快速發(fā)現問題、定位問題統一指標消費口徑 ?
企業(yè)內統一關鍵指標業(yè)務口徑及計算口徑,統一企業(yè)業(yè)務目標,實現自上而下目標驅動
如何搭建指標體系

指標體系建設的常用方法是通過場景化進行指標體系的搭建,以用戶的視角場景化思考,自上而下業(yè)務驅動指標體系建設,所以要在特定場景下做好指標體系建設,需要先選好指標,然后用科學的方法搭建指標體系。
▍3.1?科學方法選指標
選指標常用方法是指標分級方法和OSM模型。
指標分級主要是指標內容縱向的思考,根據企業(yè)戰(zhàn)略目標、組織及業(yè)務過程進行自上而下的指標分級,對指標進行層層剖析,主要分為三級T1、T2、T3。
T1指標:公司戰(zhàn)略層面指標
用于衡量公司整體目標達成情況的指標,主要是決策類指標,T1指標使用通常服務于公司戰(zhàn)略決策層 T2指標:業(yè)務策略層面指標
為達成T1指標的目標,公司會對目標拆解到業(yè)務線或事業(yè)群,并有針對性做出一系列運營策略,T2指標通常反映的是策略結果屬于支持性指標同時也是業(yè)務線或事業(yè)群的核心指標。T2指標是T1指標的縱向的路徑拆解,便于T1指標的問題定位,T2指標使用通常服務業(yè)務線或事業(yè)群 T3指標:業(yè)務執(zhí)行層面指標
T3指標是對T2指標的拆解,用于定位T2指標的問題。T3指標通常也是業(yè)務過程中最多的指標。根據各職能部門目標的不同,其關注的指標也各有差異。T3指標的使用通常可以指導一線運營或分析人員開展工作,內容偏過程性指標,可以快速引導一線人員做出相應的動作。
?
例如:成交率的指標分級

OSM模型(Obejective,Strategy,Measurement)是指標體系建設過程中輔助確定核心的重要方法,包含業(yè)務目標、業(yè)務策略、業(yè)務度量,是指標內容橫向的思考。
O
用戶使用產品的目標是什么?產品滿足了用戶的什么需求?主要從用戶視角和業(yè)務視角確定目標,原則是切實可行、易理解、可干預、正向有益 S
為了達成上述目標我采取的策略是什么? M
這些策略隨之帶來的數據指標變化有哪些?
?
以滴滴網約車為例,按照OSM模型,它的指標是什么樣的?
O:用戶來使用滴滴這個產品,需求和目標是什么?
用戶需求及目標是便捷、快速打到車,安全到達目的地
?
那如何讓用戶感受到自己的需求被滿足了呢?
S:滴滴做的策略是: 便捷方面,提供了獨立APP版本、小程序版本,還可以多渠道打到車,例如在高德、微信、支付寶都有打車入口;起始、目的地地圖智能精準定位;最優(yōu)路線選擇等 快速方面,針對不同人群不同訴求提供了多品類產品選擇,例如快車、優(yōu)享、拼車、出租車等業(yè)務,根據早晚高峰提高熱點區(qū)域運力,減少用戶排隊時間 安全方面,司機準入機制,司機合規(guī)機制,司機畫像 M:我們需要針對這些策略去做指標,在這里面我們的指標分別是結果指標和過程指標: 結果指標:渠道轉化完成率、乘客取消率、供需比、司機服務分 過程指標:渠道發(fā)單數、渠道完單數、排隊乘客數、乘客排隊時長、司機好評率、司機接單量、司機取消數等
?
指標選取之后,下面就是最重要的分析維度選擇了,前面指標體系定義里講過維度是指標體系的核心,沒有維度,單純說指標是沒有任何意義的。所以維度選擇層面主要通過數據分析視角結合實際分析業(yè)務場景來確定。例如城市維度、商圈維度、渠道維度、時間維度、用戶標簽維度等。
在《精益數據分析》一書中給出了兩套比較常用的指標體系建設方法論,其中一個就是比較有名的海盜指標法,也就是我們經常聽到的AARRR海盜模型。海盜模型是用戶分析的經典模型,它反映了增長是系統性地貫穿于用戶生命周期各個階段的:用戶拉新(Acquisition)、用戶激活(Activation)、用戶留存(Retention)、商業(yè)變現(Revenue)、用戶推薦(Referral)。
?
AARRR模型
A拉新
通過各種推廣渠道,以各種方式獲取目標用戶,并對各種營銷渠道的效果評估,不斷優(yōu)化投入策略,降低獲客成本。涉及關鍵指標例如新增注冊用戶數、激活率、注冊轉化率、新客留存率、下載量、安裝量等A活躍
活躍用戶指真正開始使用了產品提供的價值,我們需要掌握用戶的行為數據,監(jiān)控產品健康程度。這個模塊主要反映用戶進入產品的行為表現,是產品體驗的核心所在。涉及關鍵指標例如DAU/MAU 、日均使用時長、啟動APP時長、啟動APP次數等R留存
衡量用戶粘性和質量的指標。涉及關鍵指標例如留存率、流失率等R變現
主要用來衡量產品商業(yè)價值。涉及關鍵指標例如生命周期價值(LTV)、客單價、GMV等R推薦
衡量用戶自傳播程度和口碑情況。涉及關鍵指標例如邀請率、裂變系數等?
可以根據實際業(yè)務場景,結合使用OSM和AARRR模型,來系統性的選擇不同階段所需要的核心數據指標。


3.3.2 “貨”的視角
從“貨”的視角,我們比較關心的就是成交了多少,交易額多少,花了多少,到具體數據指標主要會看GMV、成交率、取消率指標,在進一步會細分到城市、區(qū)域,一級品類、二級品類。數據的效果通過目標對比,橫向對比、歷史比較等方式進行分析確定。

3.3.3 “場”的視角
從“場”的視角,我們比較關心的就是哪個渠道用戶點擊量大曝光率大,帶來了多少新用戶,完成多少交易訂單,客單價是多少;或者是哪個活動拉新或促活效果怎么樣轉化率多少,結合場景數據實際情況制定對應策略。

以上分別從“人”、“貨”、“場”三個角度進行了數據指標和分析維度的提煉,下面我們把三類指標結合指標分級方法進行分解關聯。

怎么管理指標體系

▍4.1?痛點分析
業(yè)務視角
業(yè)務分析場景指標、維度不明確;
頻繁的需求變更和反復迭代,數據報表臃腫,數據參差不齊;
用戶分析具體業(yè)務問題找數據、核對確認數據成本較高。
技術視角
指標定義,指標命名混亂,指標不唯一,指標維護口徑不一致;
指標生產,重復建設;數據匯算成本較高;
指標消費,數據出口不統一,重復輸出,輸出口徑不一致;
產品視角
缺乏系統產品化支持從生產到消費數據流沒有系統產品層面打通;
▍4.2?管理目標
技術目標???
統一指標和維度管理,指標命名、計算口徑、統計來源唯一,??維度定義規(guī)范、維度值一致
業(yè)務目標???
統一數據出口、場景化覆蓋產品目標???
指標體系管理工具產品化落地;指標體系內容產品化落地支持決策、分析、運營例如決策北極星、智能運營分析產品等
▍4.3、模型架構

數據域
指面向業(yè)務分析,將業(yè)務過程或者維度進行抽象的集合。其中,業(yè)務過程可以概括為一個個不拆分的行為事件,在業(yè)務過程之下,可以定義指標;維度,是度量的環(huán)境,如乘客呼單事件,呼單類型是維度。為了保障整個體系的生命力,數據域是需要抽象提煉,并且長期維護更新的,變動需執(zhí)行變更流程。業(yè)務過程 指公司的業(yè)務活動事件,如,呼單、支付都是業(yè)務過程。其中,業(yè)務過程不可拆分。
時間周期 用來明確統計的時間范圍或者時間點,如最近30天、自然周、截止當日等。
修飾類型 是對修飾詞的一種抽象劃分。修飾類型從屬于某個業(yè)務域,如日志域的訪問終端類型涵蓋APP端、PC端等修飾詞。
修飾詞 指的是統計維度以外指標的業(yè)務場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞APP、PC端等。 度量/原子指標 原子指標和度量含義相同,基于某一業(yè)務事件行為下的度量,是業(yè)務定義中不可再拆分的指標,具有明確業(yè)務含義的名稱,如支付金額。
維度 維度是度量的環(huán)境,用來反映業(yè)務的一類屬性,這類屬性的集合構成一個維度,也可以稱為實體對象。維度屬于一個數據域,如地理維度(其中包括國家、地區(qū)、省市等)、時間維度(其中包括年、季、月、周、日等級別內容)。
維度屬性 維度屬性隸屬于一個維度,如地理維度里面的國家名稱、國家ID、省份名稱等都屬于維度屬性。
指標分類 主要分為原子指標、派生指標、衍生指標
原子指標????
基于某一業(yè)務事件行為下的度量,是業(yè)務定義中不可再拆分的指標,具有明確業(yè)務含義的名稱,如呼單量、交易金額派生指標????
是1個原子指標+多個修飾詞(可選)+時間周期,是原子指標業(yè)務統計范圍的圈定。派生指標又分以下二種類型:事務型指標:
是指對業(yè)務過程進行衡量的指標。例如,呼單量、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎上創(chuàng)建派生指標。存量型指標:
是指對實體對象(如司機、乘客)某些狀態(tài)的統計,例如注冊司機總數、注冊乘客總數,這類指標需要維護原子指標以及修飾詞,在此基礎上創(chuàng)建派生指標,對應的時間周期一般為“歷史截止當前某個時間”。 衍生指標
是在事務性指標和存量型指標的基礎上復合成的。主要有比率型、比例型、統計型均值?

基礎信息對應維度的業(yè)務信息,由業(yè)務管理人員、數據產品或BI分析師維護,主要包括維度名稱、業(yè)務定義、業(yè)務分類。 技術信息對應維度的數據信息,由數據研發(fā)維護,主要包括是否有維表(是枚舉維度還是有獨立的物理維表)、是否是日期維、對應code英文名稱和中文名稱、對應name英文名稱和中文名稱。如果維度有維度物理表,則需要和對應的維度物理表綁定,設置code和name對應的字段。如果維度是枚舉維,則需要填寫對應的code和name。維度的統一管理,有利于以后數據表的標準化,也便于用戶的查詢使用。
基礎信息對應指標的業(yè)務信息,由業(yè)務管理人員、數據產品或BI分析師維護,主要包括歸屬信息(業(yè)務板塊、數據域、業(yè)務過程),基本信息(指標名稱、指標英文名稱、指標定義、統計算法說明、指標類型(去重、非去重)),業(yè)務場景信息(分析維度,場景描述); 技術信息對應指標的物理模型信息,由數據研發(fā)進行維護,主要包括對應物理表及字段信息; 衍生信息對應關聯派生或衍生指標信息、關聯數據應用和業(yè)務場景信息,便于用戶查詢指標被哪些其它指標和數據應用使用,提供指標血緣分析追查數據來源的能力。


建設目的:
對于用戶:
便于用戶能夠快速定位所需指標和維度,同時通過業(yè)務場景化沉淀指標體系,能夠快速觸達用戶數據訴求 對于研發(fā):
利于后續(xù)指標生產模型設計、數據內容邊界化、數據體系建設迭代量化和數據資產的落地

4.6.3 指標體系圖譜實例

指標體系產品化


支撐指標管理規(guī)范從方法到落地的工具,自動生成規(guī)范指標,解決指標名稱混亂、指標不唯一的問題,消除數據的二義性 統一對外提供標準的指標口徑和元數據信息

工具設計流程?(方法論->定義->生產->消費)

指標定義

6.?
結束語

文章整體介紹了滴滴指標體系建設方法論和工具產品的建設情況,目前指標字典和開發(fā)工具已實現流程打通,與數據消費產品的打通后續(xù)會通過DataAPI方式提供數據服務,規(guī)劃建設中。指標體系建設方法論和工具已經在滴滴集團內進行推廣使用,滴滴網約車、普惠、車服等部門已經開始接入使用,截止目前共有5000+指標進入指標體系,覆蓋公司核心業(yè)務板塊、88個數據域、385個業(yè)務過程,52個業(yè)務場景,方法論和工具也會持續(xù)迭代實踐。

滴滴云平臺事業(yè)群滴滴基礎平臺部數據治理部-數倉團隊負責公司網約車、出租車、順風車、國際化出行業(yè)務的數據倉庫的架構、規(guī)劃、設計及數據內容產品的建設工作。支撐公司運營、產品、分析、戰(zhàn)略、安全、體驗等核心業(yè)務部門的數據決策分析,提供完整、可靠、高質量的數據服務。

專注數據倉庫體系化建設,產品化數倉理念推廣及實踐者



內容編輯 | Charlotte 聯系我們 | [email protected]

