<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【數(shù)據(jù)科學(xué)】魚水說競賽:如何做好「特征工程」?

          共 922字,需瀏覽 2分鐘

           ·

          2021-09-13 23:01


          對話1:特征工程流程


          競賽小白

          在參加結(jié)構(gòu)化比賽時,做特征工程時候,是先篩選特征,還是先做特征編碼呢?

          魚佬


          可以先利用一些統(tǒng)計值篩選特征,比如缺失比例大于99%,或者信息量較少的特征。


          然后再去做特征編碼,在編碼后也可以利用模型去篩選特征。

          競賽小白

          那特征篩選是一定要做的嗎?在訓(xùn)練模型之后做?

          魚佬


          如果原始數(shù)據(jù)的特征足夠有效,則可以不做特征篩選。


          在做加特征的時候也要注意不要加無效的特征,否則也會增加篩選的難度。

          競賽小白

          利用統(tǒng)計值篩選和利用模型篩選區(qū)別大嗎?

          魚佬


          利用統(tǒng)計值篩選,會更加靠譜一些。如果利用模型篩選,則是「嵌入式」的篩選方法。


          對話2:類別編碼方法


          競賽小白

          對于類別字段,有OneHot、標(biāo)簽編碼、頻率編碼和目標(biāo)編碼,都要做嗎?

          魚佬


          并不是都要做。首先看類別字段的取值空間,如果足夠小,則可以考慮OneHot。


          然后再去通過EDA分析一下頻率編碼和目標(biāo)編碼是不是足夠有區(qū)分性。再去決定做不做。

          競賽小白

          類別取值的空間會影響具體的編碼操作?

          魚佬


          這個肯定的。普通類別和高基數(shù)類別的操作是不一樣的。


          對話3:特征交叉


          競賽小白

          如何根據(jù)特征A和特征B構(gòu)造新的特征?

          阿水


          A+B、A-B、A*B

          group(A)[B]等

          競賽小白

          意思是都可以試試?

          阿水


          建議從EDA先分析,如果能分析新特征與標(biāo)簽存在相關(guān)性,則可以做。


          對話4:特征篩選


          競賽小白

          在比賽中,基于模型如何篩選特征?

          阿水


          我個人比較喜歡排列重要性、shap value、null importance。

          競賽小白

          那如何篩選之后分?jǐn)?shù)下降,怎么辦?

          阿水


          那就可以考慮保留下來,好的篩選方法篩選結(jié)果一般不會對精度有很大影響。


          往期精彩回顧




          本站qq群851320808,加入微信群請掃碼:
          瀏覽 18
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲无码一级片 | 91 国产 爽 黄 在线相亲 | 色操在线 | 亚洲精品乱码久久久久久蜜桃欧美 | 欧美极品网站 |