指標(biāo)和標(biāo)簽的基礎(chǔ)理解
一、前言
有朋友問我,什么是指標(biāo),什么是標(biāo)簽,最本質(zhì)的區(qū)別在哪?如何識別?不問我,我覺得我比較清晰的,好像很明確,但是被人一問,我覺得我又不清晰了,所以重新學(xué)習(xí)了一遍,把學(xué)習(xí)過筆記分享給大家,希望對大家有幫忙和啟發(fā)。
?
二、指標(biāo)理解
1.指標(biāo)是說明總體綜合數(shù)量特征的概念,所有指標(biāo)能用數(shù)值來表示,一個完整的統(tǒng)計指標(biāo),一定要講時間、地點、范圍(百度);
2.指標(biāo)的評價較易量化,通常有一定的標(biāo)準(zhǔn)和尺度;
3.指標(biāo)是生產(chǎn)性思維、拆解式思維,講究的是化整為零,將事物分解開來進(jìn)行多角度的描述,得到很多的指標(biāo);
4.指標(biāo)最擅長的應(yīng)用是監(jiān)測、分析、評價和建模;
5.指標(biāo)是業(yè)務(wù)管理導(dǎo)向的,需要提前規(guī)劃,應(yīng)用場景很多,戰(zhàn)略目標(biāo)、市場定位、業(yè)務(wù)監(jiān)測、業(yè)績考核、任務(wù)分解、數(shù)據(jù)分析、數(shù)據(jù)建模、BI應(yīng)用等。
?
三、標(biāo)簽理解
1.?標(biāo)簽是對象的屬性,顆粒度到字段級“標(biāo)簽”則是指從原始數(shù)據(jù)清洗加工而來,能夠為業(yè)務(wù)所用并產(chǎn)生價值的數(shù)據(jù)資源,一般都需要結(jié)構(gòu)化到字段粒度,保障服務(wù)化使用。(標(biāo)簽類目體系)
2. 標(biāo)簽是合成性思維、聚合式思維,講究的是化零為整,將多個分散的指標(biāo)按照一定的原理進(jìn)行綜合加工,得出概括性的結(jié)果;
3. 標(biāo)簽經(jīng)常也被稱呼為屬性、特征、指標(biāo)、參數(shù)等;
4. 指標(biāo)是半成品,標(biāo)簽是成品,標(biāo)簽是指標(biāo)進(jìn)一步產(chǎn)品化的結(jié)果;
5. 標(biāo)簽面向數(shù)據(jù)應(yīng)用端,解答的是“數(shù)據(jù)怎么用”“數(shù)據(jù)的價值是什么”的問題;
6. 標(biāo)簽是資源,是資產(chǎn),可定價、可售賣、可交易的一種數(shù)據(jù)產(chǎn)品;
8. 標(biāo)簽是應(yīng)用導(dǎo)向的,跟隨業(yè)務(wù)需求的而變化,隨時增加;
9. 標(biāo)簽最擅長的應(yīng)用是標(biāo)注、刻畫、分類和特征提取;
10. 標(biāo)簽主要應(yīng)用在客戶分群、畫像、觸客、獲客、黏客、續(xù)客、數(shù)據(jù)建模、數(shù)據(jù)可視化等;
11. 標(biāo)簽的評價一般與使用者的感受、應(yīng)用的結(jié)果有強關(guān)聯(lián)關(guān)系,不同的人、不同的應(yīng)用場景,標(biāo)簽?zāi)馨l(fā)揮的效果可能大相徑庭。
四、標(biāo)簽分層
1. 理解根目錄、標(biāo)簽類目、標(biāo)簽、標(biāo)簽值四者的區(qū)別和聯(lián)系,對標(biāo)簽體系就比較清晰了。下面是保險資產(chǎn)層級思考,可以對應(yīng)數(shù)據(jù)中臺架構(gòu)設(shè)計思考。
?

2.?根目錄指向標(biāo)簽所屬的對象:根目錄往往是一種較為模糊、寬泛、簡單的名詞或動名詞,例如用戶、購房者、酒店、瀏覽(記錄)、交易(記錄)、報修(記錄)。按照數(shù)據(jù)思維,世上的一切事物都可以歸為人、物、關(guān)系三類對象,因此一個用來指向某個對象的詞(名詞指向人、物,動名詞指向關(guān)系)都不應(yīng)該是標(biāo)簽,往往是標(biāo)簽根目錄。在數(shù)據(jù)物理層面往往映射為某張大寬表中的主鍵,這張大寬表中的信息都是對該主鍵對象的詳細(xì)刻畫和數(shù)據(jù)記錄:大寬表的列即映射為標(biāo)簽,大寬表的行記錄則對應(yīng)于具體的對象在各標(biāo)簽屬性上的具體屬性值記錄。
?
3.類目是對標(biāo)簽的分類:客戶標(biāo)簽可以分類為基本信息、地理位置、社交關(guān)系等,這些分類名也是類目名。類目往往由名詞構(gòu)成。一個類目及其所歸類的標(biāo)簽在數(shù)據(jù)物理層面可以和某張具體表對應(yīng),例如“客戶”對象的【基本信息】類目下,有“性別”“年齡”“籍貫”等多個標(biāo)簽,一般對應(yīng)于客戶數(shù)據(jù)庫中的一張客戶基本信息表,該表中會有“性別”“年齡”“籍貫”等多個字段。
?
4.?標(biāo)簽是對象的屬性,顆粒度到字段級:“客戶姓名”“客戶電話”“客戶居住地址”等字段粒度的屬性就是“客戶”對象的標(biāo)簽。標(biāo)簽往往由前后兩個名詞構(gòu)成,前一個名詞作為對象定語修飾后一個名詞。標(biāo)簽一般對應(yīng)于某數(shù)據(jù)庫中某張數(shù)據(jù)表中的某字段。
?
5.?標(biāo)簽值是對象屬性的具體取值:例如【小明】【小紅】是“客戶姓名”標(biāo)簽的標(biāo)簽值,【男】【女】是“性別”標(biāo)簽的標(biāo)簽值。標(biāo)簽值往往是形容詞、名詞或數(shù)字,一般對應(yīng)于數(shù)據(jù)庫中某張數(shù)據(jù)表中的某字段取值。標(biāo)簽值的取值類型可以是數(shù)值型、文本型、日期型、Key-value型,但主要為數(shù)值型。數(shù)值型中又分可枚舉的離散值和不可枚舉的連續(xù)值。
?
五、標(biāo)簽的分類
標(biāo)簽的分類是為應(yīng)用服務(wù)的,大家可以按需添加。
1.?按照標(biāo)簽的變化性分為靜態(tài)標(biāo)簽和動態(tài)標(biāo)簽;
2.?按照標(biāo)簽的指代和評估指標(biāo)的不同,可分為定性標(biāo)簽和定量標(biāo)簽;
3.?按照標(biāo)簽資產(chǎn)分級分層的方式,可以分為一級標(biāo)簽、二級標(biāo)簽、三級標(biāo)簽等,每一個層級的標(biāo)簽相當(dāng)于一個業(yè)務(wù)維度的切面,符合MECE原則。
5.?按照復(fù)雜程度分為:事實標(biāo)簽、規(guī)則標(biāo)簽和模型標(biāo)簽。事實標(biāo)簽通常是寫實的,與指標(biāo)有較高的重合度,
6. 比如性別,年齡等;規(guī)則標(biāo)簽一般是有一些簡單的規(guī)則來控制,符合某種規(guī)則時才生成相應(yīng)的標(biāo)簽;模型標(biāo)簽一般需要通過某些機器學(xué)習(xí)算法來生成。
?
六、結(jié)論
標(biāo)簽是對象的屬性,一般到字段粒度,面向數(shù)據(jù)應(yīng)用端,是資源,是資產(chǎn),可定價、可售賣、可交易的一種數(shù)據(jù)產(chǎn)品,包含屬性、特征、指標(biāo)、參數(shù)等;
指標(biāo)是可量化的,用數(shù)值表示的字段,面向業(yè)務(wù)管理,需要提前規(guī)劃,擅長的應(yīng)用是監(jiān)測、分析、評價和建模。
點擊上方公眾號進(jìn)入?數(shù)據(jù)治理體系?主頁
