【數(shù)據(jù)競賽】時間序列競賽炸榜技巧
時間序列元特征

在時間序列等相關(guān)的問題中,除了許多傳統(tǒng)的時間序列相關(guān)的統(tǒng)計特征之外,還有一類非常重要的特征,這類特征并不是基于手工挖掘的,而是由機器學(xué)習(xí)模型產(chǎn)出的,但更為重要的是,它往往能為模型帶來巨大的提升。

在實際的競賽中也是百試不爽,基本每次使用都可以帶來一定的提升,屢試不爽。

對時間序列抽取元特征,一共需要進行兩個步驟,第一步抽取元特征,第二步則是將元特征拼接到一起重新訓(xùn)練預(yù)測得到最終的預(yù)測結(jié)果。
元特征抽取
元特征抽取部分,我們先把數(shù)據(jù)按時間序列分為兩塊,
使用時間序列的第二塊數(shù)據(jù)訓(xùn)練模型得到模型2; 使用模型1對第二塊的數(shù)據(jù)進行預(yù)測得到第二塊數(shù)據(jù)的元特征,使用模型2對第測試集的預(yù)測得到測試集元特征;

最終預(yù)測
接著元特征抽取部分得到的元特征,將元特征做為新的特征加入重新得到新的模型并重新進行預(yù)測得到最終的結(jié)果。


#?train_data1,train_data2,test_data
##?step1
model_meta1?=?train_model(train_data1)
model_meta2?=?train_model(train_data2)
meta_feature1?=?model_meta1.predict(train_data2)
meta_feature2?=?model_meta2.predict(test_data)
##?step2
model?=?train_model([train_data2,meta_feature1])?
pred??=?model.predict([test_data,meta_feature2])?
適用于所有的時間序列預(yù)測問題。
往期精彩回顧 本站qq群955171419,加入微信群請掃碼:
評論
圖片
表情
