<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【數(shù)據(jù)競賽】學特征工程就看這篇,解析IJCAI18亞軍方案之特征工程

          共 2495字,需瀏覽 5分鐘

           ·

          2020-07-31 12:13

          1??搜索競賽特征工程總結

          很多搜索推薦的工業(yè)界大模型的特征工程核心可以分為用戶側,商品側還有一些其他側(一些i2i,u2i等的上游特征)三大類。

          本篇文章,不考慮所有時間等因素,直接調研和搜索相關的競賽,并對其特征和模型訓練技巧進行總結。

          • 如果是count特征,我們的[XXX]就直接省略


          2??單階特征

          2.1??User側特征

          2.1.1??User單階特征:groupby(user)[XXX]

          1. user + [time]: 相鄰時間戳的最小/最大/均值/中位數(shù)(min/max/mean/median(time_diff)), 當前時間與最早一次/最近上一次時間的差值, 與最后一次/最近下一次時間的差值;

            反映用戶的活動頻繁度

          2. user + [query/item/...]:搜索不同query的次數(shù),商品數(shù),... nunique(query/item/shop/brand/city)

            反映用戶的興趣是否寬泛

          3. user + [istrade]: 用戶連續(xù)未購買商品數(shù),用戶連續(xù)未購買次數(shù); 用戶購買的item數(shù)和未購買的商品/商店數(shù),以及二者的比例.

            用戶的近期購買興趣,僅僅是為了看商品,還是希望買商品


          2.2??Item側特征

          2.2.1??Item/shop/brand...單階特征:groupby(item)[XXX]

          1. item/shop/brand + [buy]: 商品過去每天的曝光次數(shù)(count),被購買次數(shù)(buysum)

          2. item/shop/brand + [time & buy]: 商品過去一段時間購買的趨勢特征(后一天與前一天的購買比例/曝光比例);

          3. item/shop/brand + [time & buy]: 商品第一次被購買的時間與商品第一次曝光的時間差;

          4. item/shop/brand + [time & price/score...]: item近期商品屬性的變化,例如price/星級/好評等.(mean,std,val-mean)

          2.2.2??Item的內(nèi)部組合特征

          1. Item在shop/city/country/brand/query下的點擊率/購買率排名;

          2. shop在brand/city/country/query下的點擊率/購買率排名;

          3. brand在city/query下的點擊率/購買率排名;

          4. cate在city下的點擊率/購買率排名;


          3??組合特征

          3.1??User+Query特征(二階/高階):groupby(user+query+other)[XXX]

          同一個user在Query側的特征(滑窗)

          1. user + query, (之前/之后)有幾次相同的值(count/ratio),(之前/之后)有幾次不相同的值(count/ratio)

            此處的ratio為count再除以user+query的前后的count

          2. user + query + item/shop/brand/city/context_page_id特征, (之前/之后)有幾次相同的值(count/ratio)

          3. user + query + item_category_list特征, (之前/之后)有幾次相同的值(count/ratio)

          4. user + query + [time]: 相同query最小/最大時間(min(time))

          5. user + query + [item/shop]: 在該query之前/之后用戶訪問的item/shop數(shù)目


          3.2??User + Item特征(二階/高階):groupby(user+item+other)[XXX]

          1. user + item + [predict_category_property/query/...],(之前/之后)有幾次不同的值(nunqiue)

          2. user + shop + [predict_category_property/query/...],(之前/之后)有幾次不同的值(nunqiue)

          3. user + brand + [predict_category_property/query/...],(之前/之后)有幾次不同的值(nunqiue)

          4. user + city + [predict_category_property/query/...],(之前/之后)有幾次不同的值(nunqiue)

          5. user + item/: 用戶在之前之后點擊了多少價格更低的商品,銷量更高的商品,評價數(shù)更多的店鋪,好評率高的店鋪,星級高的店鋪,服務態(tài)度高的店鋪,物流好的店鋪,描述評分高的店鋪


          4??特征重要性


          80cd6c3da0ce3cdbdd9481bfccbadae3.webp

          5??小結
          1. 從特征重要性看,除去一些基礎特征和穿越特征(例如next diff等),Query相關的特征占比非常大;而且從答辯PPT看來,Query相關的特征也是幫助最大的一波,而這在大模型模塊是可以重點參考的;

          2. 第二部分是rank相關的特征(某個item在某個品牌下的銷量排名等),該部分特征是方案中提升很大的另一部分;


          6??參考文獻
          1. IJCAI-18亞軍分享:https://tianchi.aliyun.com/forum/postDetail?postId=5311

          2. IJCAI-18亞軍特征重要性:https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution/blob/master/file/fea_importance.csv

          3. 答辯PPT:https://tianchi.aliyun.com/forum/postDetail?spm=5176.12586969.1002.9.6d0a48c58rjez0&postId=5311


          往期精彩回顧





          獲取一折本站知識星球優(yōu)惠券,復制鏈接直接打開:

          https://t.zsxq.com/yFQV7am

          本站qq群1003271085。

          加入微信群請掃碼進群:

          瀏覽 21
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  五月天色色网址 | 欧美深喉吞精 | 亚洲v欧洲v | 国产乱来╳╳A片视频 | 成人吧欧美色图 |