<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          標(biāo)簽數(shù)據(jù)——用戶(hù)標(biāo)簽有哪些類(lèi)型,如何進(jìn)行科學(xué)分類(lèi)?

          共 2249字,需瀏覽 5分鐘

           ·

          2021-02-15 20:33

          ?標(biāo)簽的分類(lèi),是理解用戶(hù)標(biāo)簽、理解用戶(hù)畫(huà)像的基礎(chǔ)。優(yōu)秀的標(biāo)簽分類(lèi),將使得標(biāo)簽畫(huà)像系統(tǒng)易于用戶(hù)的使用。


          本篇文章和大家簡(jiǎn)單介紹一下標(biāo)簽數(shù)據(jù)的分類(lèi)。


          按照不同的分類(lèi)方法,標(biāo)簽的分類(lèi)也自然不同。本文主要介紹幾種最常規(guī)的分類(lèi)方式,包括按照來(lái)源方式、按照業(yè)務(wù)場(chǎng)景、按照標(biāo)簽的數(shù)據(jù)類(lèi)型等。



          01

          按照來(lái)源分類(lèi)


          首先是按照標(biāo)簽的來(lái)源分類(lèi)。主要分為以下的幾類(lèi):


          (1)用戶(hù)自己填寫(xiě)的數(shù)據(jù)生成的標(biāo)簽


          這部分標(biāo)簽是用戶(hù)在注冊(cè)產(chǎn)品或者在各個(gè)模塊自行填寫(xiě)的信息。一般就是【性別】、【生日】、【真實(shí)姓名】、【居住地】、【身份證】等


          例如下圖是聯(lián)想的官網(wǎng),用手機(jī)號(hào)注冊(cè)成功后,進(jìn)入個(gè)人信息頁(yè)面,可以看到各種信息的填寫(xiě)。



          互聯(lián)網(wǎng)早期,很多網(wǎng)站的注冊(cè)比較麻煩,必填的信息項(xiàng)目較多,因此能拿到的數(shù)據(jù)也就多。但隨著互聯(lián)網(wǎng)紅利的消失,用戶(hù)的獲取愈發(fā)困難,在注冊(cè)階段收集用戶(hù)信息變得越來(lái)越簡(jiǎn)潔,目前絕大部分網(wǎng)站的收集就只保留了手機(jī)號(hào),用手機(jī)號(hào)及驗(yàn)證碼即可完成注冊(cè)。后續(xù)則通過(guò)一些積分、優(yōu)惠等方式激勵(lì)大家主動(dòng)填寫(xiě)。


          【優(yōu)缺點(diǎn)】這部分?jǐn)?shù)據(jù)用來(lái)做標(biāo)簽,往往是最基礎(chǔ)的。但存在的最大的問(wèn)題是標(biāo)簽覆蓋度過(guò)低,有意愿填寫(xiě)的用戶(hù)常常比例不過(guò)半。而且對(duì)于部分敏感信息,例如身份證、地址等,如果逼迫用戶(hù)填寫(xiě),用戶(hù)經(jīng)常會(huì)填寫(xiě)虛假信息。這對(duì)于后續(xù)標(biāo)簽畫(huà)像而言,不太好用。除非是12306這種強(qiáng)制性的網(wǎng)站,對(duì)身份信息能保障。


          (2)通過(guò)統(tǒng)計(jì)用戶(hù)行為,生成的統(tǒng)計(jì)標(biāo)簽


          這類(lèi)標(biāo)簽指標(biāo)是最多的。


          比如可以根據(jù)訂單表,統(tǒng)計(jì)用戶(hù)的訂單金額;可以根據(jù)搜索表,統(tǒng)計(jì)用戶(hù)的搜索次。


          【優(yōu)缺點(diǎn)】這部分?jǐn)?shù)據(jù)用來(lái)做標(biāo)簽,是比較客觀的,用戶(hù)的行為不會(huì)說(shuō)謊。但存在的一個(gè)問(wèn)題是,要對(duì)標(biāo)簽畫(huà)像系統(tǒng)產(chǎn)生價(jià)值,需要較多的邏輯處理。例如,想給用戶(hù)打一個(gè)【購(gòu)買(mǎi)力高低】的標(biāo)簽,是統(tǒng)計(jì)最近7天的成交金額,還是最近30天的?是按照訂單口徑還是金額口徑?是大于1萬(wàn)算高,還是大于1000就算高?這里都需要大量的邏輯。如果只是一個(gè)統(tǒng)計(jì)值,只能算是一個(gè)寬口徑的半加工的標(biāo)簽,真正用起來(lái)的時(shí)候,存在一些障礙。


          (3)通過(guò)算法生成的標(biāo)簽


          算法,很萬(wàn)能。


          這玩意就是,很多場(chǎng)景不得不用。比如,想打一個(gè)【準(zhǔn)媽媽】標(biāo)簽。這時(shí),你咋辦?你想盡各種邏輯,比如最近有搜索寶寶裝行為的、最近有買(mǎi)孕婦服的……很多特征都能反映【準(zhǔn)媽媽】的特點(diǎn),但是通過(guò)簡(jiǎn)單的邏輯,是無(wú)法實(shí)現(xiàn)的。這個(gè)時(shí)候,就扔給算法團(tuán)隊(duì)吧……他們會(huì)基于大量的特征,訓(xùn)練模型,最后打上【準(zhǔn)媽媽】的標(biāo)簽。


          【優(yōu)缺點(diǎn)】算法標(biāo)簽的缺點(diǎn)很突出,就是費(fèi)時(shí)費(fèi)力,做一個(gè)標(biāo)簽的時(shí)間可能要一兩個(gè)月,做統(tǒng)計(jì)標(biāo)簽都做了幾十個(gè)了……但如果算法靠譜,效果常常也不錯(cuò),對(duì)業(yè)務(wù)的價(jià)值往往也比較大。如果公司算法資源富裕,那就做吧!當(dāng)然,要有業(yè)務(wù)價(jià)值哦~


          (4)通過(guò)第三方采購(gòu)、積累的


          土豪的方式很簡(jiǎn)單,買(mǎi)!


          比如采購(gòu)點(diǎn)身份證信息、采購(gòu)點(diǎn)用戶(hù)的征信信息等等。


          【優(yōu)缺點(diǎn)】?jī)?yōu)點(diǎn)就是省事。缺點(diǎn)就是費(fèi)錢(qián),而且能買(mǎi)的標(biāo)簽通常都是比較通用的,一些個(gè)性化的,例如網(wǎng)站的訪(fǎng)問(wèn)頻次等,也是不太好采購(gòu)的。當(dāng)然還涉及數(shù)據(jù)安全的風(fēng)險(xiǎn)。



          02


          按照數(shù)據(jù)類(lèi)型分類(lèi)


          按照數(shù)據(jù)類(lèi)型,主要分為以下幾類(lèi):


          (1)數(shù)值型標(biāo)簽


          剛才上文提到的【用戶(hù)最近7天購(gòu)買(mǎi)金額】、【用戶(hù)近1天瀏覽天數(shù)】等,這些標(biāo)簽都是按照一定的規(guī)則統(tǒng)計(jì)生成的,均是數(shù)值型標(biāo)簽。其實(shí)本質(zhì)上和指標(biāo)沒(méi)有太大區(qū)別。


          組成公式是:【時(shí)間范圍】+【行為方式】+【統(tǒng)計(jì)方式】。


          下圖是達(dá)摩盤(pán)標(biāo)簽中的部分統(tǒng)計(jì)標(biāo)簽:




          時(shí)間范圍不說(shuō)了,行為方式表示這個(gè)指標(biāo)的含義,例如成交、搜索、點(diǎn)擊等。統(tǒng)計(jì)方式是【計(jì)數(shù)】、【求和】、【最值】等


          【優(yōu)缺點(diǎn)】按照不同的時(shí)間范圍、不同的行為方式、不同的統(tǒng)計(jì)方式,可以組成大量的標(biāo)簽。數(shù)量雖多,但是價(jià)值密度很低。因此,在成熟的標(biāo)簽系統(tǒng)中,這類(lèi)標(biāo)簽不會(huì)大量在計(jì)算,往往是用戶(hù)創(chuàng)建了啥就用啥。優(yōu)點(diǎn)是比較容易生成。


          (2)單值型枚舉標(biāo)簽


          這種標(biāo)簽可以是用戶(hù)自己填寫(xiě)生成的,也可以是通過(guò)數(shù)值型標(biāo)簽進(jìn)行加工,或者算法,生成的。


          這類(lèi)標(biāo)簽的最大特征,就是一個(gè)用戶(hù)在這個(gè)標(biāo)簽中,只能有一個(gè)選項(xiàng)值。而且,和數(shù)值型標(biāo)簽的區(qū)別在于,單選型標(biāo)簽的選項(xiàng)值是可窮舉的,是離散的。


          例如:【用戶(hù)的生命周期】,用戶(hù)肯定是處于【成長(zhǎng)期】、【成熟期】、【衰退期】、【沉睡期】其中的一個(gè),不可能屬于兩個(gè)或者多個(gè)。


          例如:【性別】


          (3)多值型枚舉標(biāo)簽


          和單選型標(biāo)簽的區(qū)別就在于,一個(gè)用戶(hù)可以有多個(gè)值。


          同樣,復(fù)選型標(biāo)簽也是離散值,選項(xiàng)是可窮舉的。


          例如:【用戶(hù)的收貨城市】,用戶(hù)可以有多個(gè)城市


          (4)文本型標(biāo)簽


          這類(lèi)標(biāo)簽最大的特征,是不連續(xù)、且不可窮舉。


          例如,【用戶(hù)常用熱搜詞】,每個(gè)用戶(hù)都可以有自己的常用熱搜詞,但熱搜詞的數(shù)量是巨大的,不能像單選型標(biāo)簽或者復(fù)選型標(biāo)簽?zāi)菢?,幾個(gè)、甚至最多幾十個(gè)選項(xiàng),就能覆蓋所有。


          為啥要進(jìn)行這個(gè)分類(lèi)呢?


          其實(shí)主要是在標(biāo)簽系統(tǒng)中,用標(biāo)簽篩選人群的時(shí)候有用。不同數(shù)據(jù)類(lèi)型的標(biāo)簽,在前端的交互是一定要有區(qū)分的。這個(gè)后續(xù)詳細(xì)展開(kāi)。



          03


          按照業(yè)務(wù)場(chǎng)景分類(lèi)


          這種分類(lèi)方式,根據(jù)各自業(yè)務(wù)的不同,就見(jiàn)仁見(jiàn)智了。


          這個(gè)分類(lèi),主要是用于標(biāo)簽系統(tǒng)的標(biāo)簽管理,按照業(yè)務(wù)方式進(jìn)行組織標(biāo)簽類(lèi)別,有助于用戶(hù)的便捷使用。


          下面是阿里達(dá)摩盤(pán)的標(biāo)簽分類(lèi),僅供參考



          以下是某司內(nèi)部的標(biāo)簽分類(lèi):



          以上,先到這。后續(xù)標(biāo)簽畫(huà)像系統(tǒng)的分享將繼續(xù)。

          瀏覽 239
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产乱婬片A片AAAAPp地址 | 影音先锋激情网站 | 人人操天天操 | 日韩一级特黄 | 蜜桃免费视频 |