使用sklearn的cross_val_score進行交叉驗證

向AI轉(zhuǎn)型的程序員都關(guān)注了這個號??????
機器學(xué)習(xí)AI算法工程?? 公眾號:datayx
在構(gòu)建模型時,調(diào)參是極為重要的一個步驟,因為只有選擇最佳的參數(shù)才能構(gòu)建一個最優(yōu)的模型。但是應(yīng)該如何確定參數(shù)的值呢?所以這里記錄一下選擇參數(shù)的方法,以便后期復(fù)習(xí)以及分享。
(除了貝葉斯優(yōu)化等方法)其它簡單的驗證有兩種方法:1、通過經(jīng)常使用某個模型的經(jīng)驗和高超的數(shù)學(xué)知識。2、通過交叉驗證的方法,逐個來驗證。
很顯然我是屬于后者所以我需要在這里記錄一下
sklearn 的 cross_val_score:
我使用是cross_val_score方法,在sklearn中可以使用這個方法。交叉驗證的原理不好表述下面隨手畫了一個圖:

(我都沒見過這么丑的圖)簡單說下,比如上面,我們將數(shù)據(jù)集分為10折,做一次交叉驗證,實際上它是計算了十次,將每一折都當(dāng)做一次測試集,其余九折當(dāng)做訓(xùn)練集,這樣循環(huán)十次。通過傳入的模型,訓(xùn)練十次,最后將十次結(jié)果求平均值。將每個數(shù)據(jù)集都算一次
交叉驗證優(yōu)點:
1:交叉驗證用于評估模型的預(yù)測性能,尤其是訓(xùn)練好的模型在新數(shù)據(jù)上的表現(xiàn),可以在一定程度上減小過擬合。
2:還可以從有限的數(shù)據(jù)中獲取盡可能多的有效信息。
我們?nèi)绾卫盟鼇磉x擇參數(shù)呢?
我們可以給它加上循環(huán),通過循環(huán)不斷的改變參數(shù),再利用交叉驗證來評估不同參數(shù)模型的能力。最終選擇能力最優(yōu)的模型。
下面通過一個簡單的實例來說明:(iris鳶尾花)


關(guān)于 cross_val_score 的 scoring 參數(shù)的選擇,通過查看官方文檔后可以發(fā)現(xiàn)相關(guān)指標(biāo)的選擇可以在這里找到
https://scikit-learn.org/stable/modules/model_evaluation.html
機器學(xué)習(xí)算法AI大數(shù)據(jù)技術(shù)
?搜索公眾號添加:?datanlp
長按圖片,識別二維碼
閱讀過本文的人還看了以下文章:
TensorFlow 2.0深度學(xué)習(xí)案例實戰(zhàn)
基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測
《基于深度學(xué)習(xí)的自然語言處理》中/英PDF
【全套視頻課】最全的目標(biāo)檢測算法系列講解,通俗易懂!
《美團機器學(xué)習(xí)實踐》_美團算法團隊.pdf
《深度學(xué)習(xí)入門:基于Python的理論與實現(xiàn)》高清中文PDF+源碼
《深度學(xué)習(xí):基于Keras的Python實踐》PDF和代碼
python就業(yè)班學(xué)習(xí)視頻,從入門到實戰(zhàn)項目
2019最新《PyTorch自然語言處理》英、中文版PDF+源碼
《21個項目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實踐詳解》完整版PDF+附書代碼
《深度學(xué)習(xí)之pytorch》pdf+附書源碼
PyTorch深度學(xué)習(xí)快速實戰(zhàn)入門《pytorch-handbook》
【下載】豆瓣評分8.1,《機器學(xué)習(xí)實戰(zhàn):基于Scikit-Learn和TensorFlow》
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼
汽車行業(yè)完整知識圖譜項目實戰(zhàn)視頻(全23課)
李沐大神開源《動手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材
筆記、代碼清晰易懂!李航《統(tǒng)計學(xué)習(xí)方法》最新資源全套!
《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼
FashionAI服裝屬性標(biāo)簽圖像識別Top1-5方案分享
重要開源!CNN-RNN-CTC 實現(xiàn)手寫漢字識別
同樣是機器學(xué)習(xí)算法工程師,你的面試為什么過不了?
前海征信大數(shù)據(jù)算法:風(fēng)險概率預(yù)測
【Keras】完整實現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個項目,讓你掌握深度學(xué)習(xí)圖像分類
VGG16遷移學(xué)習(xí),實現(xiàn)醫(yī)學(xué)圖像識別分類工程項目
特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊
如何利用全新的決策樹集成級聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?
Machine Learning Yearning 中文翻譯稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在線識別手寫中文網(wǎng)站
中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學(xué)習(xí)與特征工程
不斷更新資源
深度學(xué)習(xí)、機器學(xué)習(xí)、數(shù)據(jù)分析、python
?搜索公眾號添加:?datayx??
