【收藏】時(shí)間序列預(yù)測(cè)入門必讀的4篇論文
時(shí)間序列預(yù)測(cè)是一個(gè)發(fā)展歷史悠久的技術(shù)領(lǐng)域,近些年隨著機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法的應(yīng)用,時(shí)間序列預(yù)測(cè)方法在越來(lái)越多的傳統(tǒng)領(lǐng)域煥發(fā)光彩。
入門必讀的4篇論文見文末↓

時(shí)間序列預(yù)測(cè)常用的傳統(tǒng)的統(tǒng)計(jì)學(xué)算法有ARIMA, ETS, GARCH等,常用的機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法有廣義線性模型、xgboost、LSTM、CNN、Transformer等。
統(tǒng)計(jì)學(xué)習(xí)方法需要結(jié)合時(shí)序領(lǐng)域特有的統(tǒng)計(jì)學(xué)分析(e.g. 自相關(guān)系數(shù)ACF、偏相關(guān)系數(shù)PACF、平穩(wěn)性檢驗(yàn)等),將數(shù)據(jù)通過(guò)差分的方式轉(zhuǎn)換成平穩(wěn)序列后,再通過(guò)線性回歸的方式建模。
它的長(zhǎng)處在于結(jié)合了大量的專家對(duì)于時(shí)間序列的知識(shí),因此不需要大量樣本數(shù)據(jù)即可構(gòu)建模型,短處在于需要從業(yè)人員對(duì)時(shí)序相關(guān)的統(tǒng)計(jì)學(xué)有深入的理解,并且當(dāng)存在非線性特征等復(fù)雜情況時(shí),需要進(jìn)行手工特殊處理,不利于規(guī)模化預(yù)測(cè)。
機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法將時(shí)序預(yù)測(cè)問(wèn)題作為回歸問(wèn)題處理,通過(guò)選擇合適的特征和模型結(jié)構(gòu),基于訓(xùn)練集數(shù)據(jù)構(gòu)建模型。它的長(zhǎng)處是不需要結(jié)合時(shí)序領(lǐng)域特有的統(tǒng)計(jì)學(xué)分析,算法可以從訓(xùn)練集中總結(jié)規(guī)律,并且使用模型不是時(shí)序領(lǐng)域獨(dú)有的,對(duì)于數(shù)據(jù)科學(xué)的從業(yè)人員更友好,短處是需要基于大量樣本數(shù)據(jù)才可訓(xùn)練模型,并且模型通常不具備可解釋性(廣義線性模型除外)。
當(dāng)然,當(dāng)前商業(yè)、工業(yè)領(lǐng)域往往存在海量數(shù)據(jù),對(duì)自動(dòng)化、準(zhǔn)確性的要求比可解性的要求更高。所以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的應(yīng)用也越來(lái)越廣泛。

時(shí)間序列預(yù)測(cè)在供應(yīng)鏈、金融、工業(yè)等眾多領(lǐng)域有著廣泛的應(yīng)用。
如:客流預(yù)測(cè)、水位預(yù)測(cè)、交通流量預(yù)測(cè)、用電量預(yù)測(cè)、零件異常檢測(cè)、水位異常檢測(cè)、航班定價(jià)、電影定價(jià)、人員排班計(jì)劃、生產(chǎn)排程計(jì)劃等等。
傳統(tǒng)行業(yè)越來(lái)越多地精細(xì)化運(yùn)營(yíng)需求,為時(shí)間序列預(yù)測(cè)算法提供了廣闊的用武之地。
與CV、NLP等標(biāo)準(zhǔn)化應(yīng)用不同,時(shí)間序列預(yù)測(cè)項(xiàng)目與業(yè)務(wù)場(chǎng)景結(jié)合緊密。預(yù)測(cè)對(duì)象、顆粒度、前置期、準(zhǔn)確性指標(biāo)等對(duì)于構(gòu)建模型最關(guān)鍵的因素往往并非一目了然,只有通過(guò)對(duì)不同場(chǎng)景的需求進(jìn)行深入分析才能找到合適解決方案。因此從業(yè)者不但需要掌握各種方法的原理,還需要能夠結(jié)合業(yè)務(wù)具體使用場(chǎng)景分析項(xiàng)目的需求,找到合適的算法。這對(duì)從業(yè)者的能力提出了很高的要求,也是業(yè)內(nèi)時(shí)間序列預(yù)測(cè)資深專家短缺的原因。
接下來(lái)推薦幾篇經(jīng)典論文供大家學(xué)習(xí)復(fù)現(xiàn)。幫你快速梳理時(shí)序預(yù)測(cè)算法的種類的原理。

01 Forecasting at Scale
Prophet是Facebook開發(fā)的時(shí)間序列預(yù)測(cè)軟件包,在業(yè)內(nèi)具有廣泛的應(yīng)用。《Forecasting at Scale》介紹了Prophet的算法原理。
02 Deep AR: Probabilistic Forecasting with Autoregressive Recurrent Networks
Deep AR…一文提出了一種基于LSTM的時(shí)間序列預(yù)測(cè)算法,適用于高通量時(shí)間序列預(yù)測(cè)。該方法不僅能給出預(yù)測(cè)結(jié)果,還能給出結(jié)果的置信區(qū)間。本文作者來(lái)自亞馬遜算法研究所。論文中的算法DeepAR已經(jīng)集成在Amazon Sagemaker機(jī)器學(xué)習(xí)平臺(tái),對(duì)外提供預(yù)估服務(wù)的功能。
03 A Multi-Horizon Quantile Recurrent Forecaster(2018)
※推薦理由:
在時(shí)間序列預(yù)測(cè)的領(lǐng)域中,有很多場(chǎng)景既要對(duì)短期的時(shí)間進(jìn)行預(yù)測(cè),又要對(duì)長(zhǎng)期的時(shí)間進(jìn)行預(yù)測(cè)。通常機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法在短期預(yù)測(cè)上具有優(yōu)勢(shì),但是在長(zhǎng)期預(yù)測(cè)上表現(xiàn)不佳。本文提出了一種特殊的MLP網(wǎng)絡(luò)結(jié)果,能夠很好地兼顧短期和長(zhǎng)期預(yù)測(cè)。此外,訓(xùn)練時(shí)間序列預(yù)測(cè)模型時(shí)往往需要通過(guò)滑動(dòng)窗口的形式產(chǎn)生訓(xùn)練集樣本,使得數(shù)據(jù)進(jìn)行了大量復(fù)制,占用了大量?jī)?nèi)存資源。為了解決這一問(wèn)題,本文提出了叉式訓(xùn)練(fork-training)方法,在不復(fù)制數(shù)據(jù)的情況下,達(dá)到滑動(dòng)窗相似的訓(xùn)練效果。本文是亞馬遜算法研究所在時(shí)間序列領(lǐng)域的又一力作。
※推薦理由:
在實(shí)踐中經(jīng)常會(huì)出現(xiàn)需要在不同層級(jí)做預(yù)測(cè)的情況,比如說(shuō)預(yù)測(cè)某個(gè)產(chǎn)品的銷量,既需要在較高層級(jí)的全國(guó)層面做預(yù)測(cè),也要在較低層級(jí)的省市層面預(yù)測(cè)。一般上的方法無(wú)法保證低層級(jí)的預(yù)測(cè)累加的結(jié)果和高層級(jí)的結(jié)果是一致的,給結(jié)果的應(yīng)用造成了困擾。本論文提出了一種方法,用于解決不同層級(jí)預(yù)測(cè)結(jié)果不一致的問(wèn)題。
除了上述4篇論文之外,我還請(qǐng)到了時(shí)間序列預(yù)測(cè)算法專家YY,直播分享《時(shí)間序列預(yù)測(cè)算法入門與實(shí)戰(zhàn)》。

什么是時(shí)間序列?
什么是時(shí)間序列預(yù)測(cè)?
時(shí)間序列預(yù)測(cè)的范式
時(shí)間序列預(yù)測(cè)的專有名詞
時(shí)間序列的評(píng)估
時(shí)間序列與機(jī)器學(xué)習(xí)
代碼實(shí)現(xiàn)
背景:某餐飲企業(yè)有14家門店,我們需要預(yù)測(cè)未來(lái)一個(gè)月每家門店每天的營(yíng)業(yè)額,以指導(dǎo)門店排班。
時(shí)序預(yù)測(cè)算法專家2天直播分享
↑掃碼0.1元即可獲取↑
前50名預(yù)約的同學(xué),還額外附贈(zèng)時(shí)間序列預(yù)測(cè)必讀paper20篇~

