時間序列預測入門必讀的4篇論文
時間序列預測是一個發(fā)展歷史悠久的技術(shù)領(lǐng)域,傳統(tǒng)的統(tǒng)計學算法(e.g. ARIMA, ETS, GARCH)以及近年來的機器學習(e.g. 廣義線性模型,xgboost)、深度學習算法(e.g. LSTM,CNN,Transformer) 都可以用于時間序列預測,不同方法各有長處和短處。
傳統(tǒng)的統(tǒng)計學習方法需要結(jié)合時序領(lǐng)域特有的統(tǒng)計學分析(e.g. 自相關(guān)系數(shù)ACF、偏相關(guān)系數(shù)PACF、平穩(wěn)性檢驗等),將數(shù)據(jù)通過差分的方式轉(zhuǎn)換成平穩(wěn)序列后,再通過線性回歸的方式建模。傳統(tǒng)統(tǒng)計學算法的長處在于結(jié)合了大量的專家對于時間序列的知識,因此不需要大量樣本數(shù)據(jù)即可構(gòu)建模型,短處在于需要從業(yè)人員對時序相關(guān)的統(tǒng)計學有深入的理解,并且當存在非線性特征等復雜情況時,需要進行手工特殊處理,不利于規(guī)模化預測。
機器學習、深度學習算法將時序預測問題作為回歸問題處理,通過選擇合適的特征和模型結(jié)構(gòu),基于訓練集數(shù)據(jù)構(gòu)建模型。機器學習、深度學習算法的長處是不需要結(jié)合時序領(lǐng)域特有的統(tǒng)計學分析,算法可以從訓練集中總結(jié)規(guī)律,并且使用模型不是時序領(lǐng)域獨有的,對于數(shù)據(jù)科學的從業(yè)人員更友好,短處是需要基于大量樣本數(shù)據(jù)才可訓練模型,并且模型通常不具備可解釋性(廣義線性模型除外)。當前商業(yè)、工業(yè)領(lǐng)域往往存在海量數(shù)據(jù),對自動化、準確性的要求比可解性的要求更高。
時間序列預測在供應鏈、金融、工業(yè)等眾多領(lǐng)域有著廣泛的應用。與CV、NLP等標準化應用不同,時間序列預測項目與業(yè)務(wù)場景結(jié)合緊密。預測對象、顆粒度、前置期、準確性指標等對于構(gòu)建模型最關(guān)鍵的因素往往并非一目了然,只有通過對不同場景的需求進行深入分析才能找到合適解決方案。因此從業(yè)者不但需要掌握各種方法的原理,還需要能夠結(jié)合業(yè)務(wù)具體使用場景分析項目的需求,找到合適的算法。這對從業(yè)者的能力提出了很高的要求,也是業(yè)內(nèi)時間序列預測資深專家短缺的原因。
接下來推薦幾篇經(jīng)典論文供大家學習復現(xiàn)。幫你快速梳理時序預測算法的種類的原理。
1、基于歷史數(shù)據(jù)對未來做出預測×2篇
01 Forecasting at Scale
02 Deep AR: Probabilistic Forecasting with Autoregressive Recurrent Networks
※推薦理由:
1) Prophet是Facebook開發(fā)的時間序列預測軟件包,在業(yè)內(nèi)具有廣泛的應用。《Forecasting at Scale》介紹了Prophet的算法原理。
2)Deep AR…一文提出了一種基于LSTM的時間序列預測算法,適用于高通量時間序列預測。該方法不僅能給出預測結(jié)果,還能給出結(jié)果的置信區(qū)間。本文作者來自亞馬遜算法研究所。論文中的算法DeepAR已經(jīng)集成在Amazon Sagemaker機器學習平臺,對外提供預估服務(wù)的功能。
2、兼顧長短期預測×1篇
03 A Multi-Horizon Quantile Recurrent Forecaster(2018)
※推薦理由:
在時間序列預測的領(lǐng)域中,有很多場景既要對短期的時間進行預測,又要對長期的時間進行預測。通常機器學習、深度學習算法在短期預測上具有優(yōu)勢,但是在長期預測上表現(xiàn)不佳。本文提出了一種特殊的MLP網(wǎng)絡(luò)結(jié)果,能夠很好地兼顧短期和長期預測。此外,訓練時間序列預測模型時往往需要通過滑動窗口的形式產(chǎn)生訓練集樣本,使得數(shù)據(jù)進行了大量復制,占用了大量內(nèi)存資源。為了解決這一問題,本文提出了叉式訓練(fork-training)方法,在不復制數(shù)據(jù)的情況下,達到滑動窗相似的訓練效果。本文是亞馬遜算法研究所在時間序列領(lǐng)域的又一力作。
?
3、多層級預測×1篇
04 Prediction of hierarchical time series using structured regularization and its application to artificial neural networks (2020)
※推薦理由:
在實踐中經(jīng)常會出現(xiàn)需要在不同層級做預測的情況,比如說預測某個產(chǎn)品的銷量,既需要在較高層級的全國層面做預測,也要在較低層級的省市層面預測。一般上的方法無法保證低層級的預測累加的結(jié)果和高層級的結(jié)果是一致的,給結(jié)果的應用造成了困擾。本論文提出了一種方法,用于解決不同層級預測結(jié)果不一致的問題。
上述4篇論文在深度之眼《時間序列預測項目班》中都有系統(tǒng)地講解,其第1篇論文《Forecasting at Scale》的講解業(yè)已開源給本公號粉絲,掃下方二維碼即可獲取。
——?講解大綱?——
1、時間序列概述
什么是時間序列?
什么是時間序列預測?
時間序列預測的范式
時間序列預測的專有名詞
時間序列的評估
時間序列與機器學習
2、Prophet算法
前言
Prophet 整體視角
模型建模
模型訓練
模型預測
PS:會講解論文代碼
↑掃碼支付0.1元即可獲取↑
30天內(nèi)無限次回看
前50名預約的同學,還額外附贈時間序列預測必讀paper20篇~

