<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          煉丹神器|python的開(kāi)源庫(kù):Shapash

          共 2984字,需瀏覽 6分鐘

           ·

          2021-07-27 15:50

          ↑ 點(diǎn)擊藍(lán)字 關(guān)注極市平臺(tái)

          作者丨時(shí)晴
          來(lái)源丨煉丹筆記
          編輯丨極市平臺(tái)

          極市導(dǎo)讀

           

          一個(gè)python的開(kāi)源庫(kù),可以讓煉丹師們?cè)跓挼み^(guò)程中理解自己為什么能練出"好"丹。 >>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺(jué)的最前沿

          最近時(shí)晴又發(fā)現(xiàn)了個(gè)煉丹神器Shapash,就迫不及待的要推薦給大家.這是個(gè)python的開(kāi)源庫(kù),可以讓煉丹師們?cè)跓挼み^(guò)程中理解自己為什么能練出"好"丹.相信諸位煉丹師和我一樣,不僅追求一個(gè)好的模型,同時(shí)也追究模型的可解釋性,廢話(huà)不多說(shuō),我們看看"太陽(yáng)女神"如何解釋我們的模型吧.

          shapash適用于很多模型:Catboost,Xgboost,LightGBM,Sklearn Ensemble等.可以簡(jiǎn)單的用pip進(jìn)行安裝:

          $pip install shapash

          我們用一個(gè)實(shí)際的例子來(lái)說(shuō)明shapash的用法.我們先訓(xùn)練一個(gè)回歸模型,用于預(yù)測(cè)房?jī)r(jià).

          數(shù)據(jù)下載鏈接:https://www.kaggle.com/c/house-prices-advanced-regression-techniques

          先用shapash讀入數(shù)據(jù):

          import pandas as pd
          from shapash.data.data_loader import data_loading
          # house_dict里面是特征名到特征含義的映射

          house_df, house_dict = data_loading('house_prices')
          y_df=house_df['SalePrice'].to_frame()
          X_df=house_df[house_df.columns.difference(['SalePrice'])]

          看下數(shù)據(jù)如下:

          對(duì)類(lèi)別特征進(jìn)行編碼:

          from category_encoders import OrdinalEncoder

          categorical_features = [col for col in X_df.columns if X_df[col].dtype == 'object']
          encoder = OrdinalEncoder(cols=categorical_features).fit(X_df)
          X_df=encoder.transform(X_df)

          我們可以看到,所有特征都變成數(shù)值了:

          找個(gè)任意的回歸模型訓(xùn)練,這里我用隨機(jī)森林:

          from sklearn.model_selection import train_test_split
          from sklearn.ensemble import RandomForestRegressor
          Xtrain, Xtest, ytrain, ytest = train_test_split(X_df, y_df, train_size=0.75)
          reg = RandomForestRegressor(n_estimators=200, min_samples_leaf=2).fit(Xtrain,ytrain)
          #預(yù)估測(cè)試集
          y_pred = pd.DataFrame(reg.predict(Xtest), columns=['pred'], index=Xtest.index)

          這里我們不探討該模型效果,直接看看如何用"太陽(yáng)女神"解釋該模型:

          from shapash.explainer.smart_explainer import SmartExplainer
          xpl = SmartExplainer(features_dict=house_dict) # Optional parameter 
          xpl.compile(
              x=Xtest,
              model=reg,
              preprocessing=encoder,# Optional: use inverse_transform method
              y_pred=y_pred # Optional
          )

          然后使用一行代碼,就可以解釋模型了:

          app = xpl.run_app()

          我們可以看到特征重要性:

          已經(jīng)特征多大程度影響預(yù)估:

          當(dāng)我們選擇特征重要性最低的特征時(shí),可以發(fā)現(xiàn)該特征影響的樣本較少,影響值的范圍也小了很多(-2000~2000).

          此外還有一些可視化的特性等待大家探索:

          如果覺(jué)得有用,就請(qǐng)分享到朋友圈吧!

          △點(diǎn)擊卡片關(guān)注極市平臺(tái),獲取最新CV干貨

          公眾號(hào)后臺(tái)回復(fù)“79”獲取CVPR 2021:TransT 直播鏈接~


          極市干貨
          YOLO教程:一文讀懂YOLO V5 與 YOLO V4大盤(pán)點(diǎn)|YOLO 系目標(biāo)檢測(cè)算法總覽全面解析YOLO V4網(wǎng)絡(luò)結(jié)構(gòu)
          實(shí)操教程:PyTorch vs LibTorch:網(wǎng)絡(luò)推理速度誰(shuí)更快?只用兩行代碼,我讓Transformer推理加速了50倍PyTorch AutoGrad C++層實(shí)現(xiàn)
          算法技巧(trick):深度學(xué)習(xí)訓(xùn)練tricks總結(jié)(有實(shí)驗(yàn)支撐)深度強(qiáng)化學(xué)習(xí)調(diào)參Tricks合集長(zhǎng)尾識(shí)別中的Tricks匯總(AAAI2021
          最新CV競(jìng)賽:2021 高通人工智能應(yīng)用創(chuàng)新大賽CVPR 2021 | Short-video Face Parsing Challenge3D人體目標(biāo)檢測(cè)與行為分析競(jìng)賽開(kāi)賽,獎(jiǎng)池7萬(wàn)+,數(shù)據(jù)集達(dá)16671張!



          CV技術(shù)社群邀請(qǐng)函 #

          △長(zhǎng)按添加極市小助手
          添加極市小助手微信(ID : cvmart4)

          備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)


          即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群


          每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與 10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺(jué)開(kāi)發(fā)者互動(dòng)交流~



          覺(jué)得有用麻煩給個(gè)在看啦~  
          瀏覽 61
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  无码一区二区三区四区五区六区七区八区 | 国产高清无码视频在线观看 | 激情乱伦91网站 | 国产欧美一区二区 | a 天堂8在线资源 |