3行代碼完成時(shí)序建模,最新開源的時(shí)序算法發(fā)布!
?Datawhale開源?
方向:時(shí)間序列開源項(xiàng)目
時(shí)序是什么?時(shí)序預(yù)測(cè)可以為業(yè)務(wù)帶來哪些價(jià)值? 產(chǎn)品銷量預(yù)測(cè)、電池剩余壽命預(yù)測(cè)……這些高價(jià)值場(chǎng)景如何提高預(yù)測(cè)準(zhǔn)確率? 深度學(xué)習(xí)模型在時(shí)序預(yù)測(cè)有什么優(yōu)勢(shì)? 如何尋得一款集前沿高尖時(shí)序技術(shù)的產(chǎn)品,為業(yè)務(wù)所用? 近日,百度飛槳重磅發(fā)布了一款 開源時(shí)序建模算法庫——PaddleTS ,可以幫助開發(fā)者實(shí)現(xiàn)時(shí)序數(shù)據(jù)處理、分析、建模、預(yù)測(cè)全流程,具有更優(yōu)的使用體驗(yàn):- 超易用 :3行代碼即可完成時(shí)序建模
- 速度快 :模型訓(xùn)練效率比同類產(chǎn)品快2倍
- 效果好 :時(shí)序?qū)俚淖詣?dòng)建模與集成預(yù)測(cè)效果突出
-
零售企業(yè) :準(zhǔn)確的預(yù)測(cè)產(chǎn)品銷量,可以為企業(yè)備貨、配送、運(yùn)營(yíng)策略的制定提供有效依據(jù),顯著降本增效;
- 電網(wǎng)公司 :準(zhǔn)確的預(yù)測(cè)發(fā)電量與用電量,可以使電網(wǎng)的調(diào)度更加合理化,發(fā)揮最大效能;
- 制造企業(yè) :提前預(yù)測(cè)生產(chǎn)設(shè)備可能發(fā)生的故障,可以提前預(yù)警、維修,降低停工造成的損失;
- 新能源車企 :實(shí)時(shí)預(yù)測(cè)電池剩余電量、預(yù)測(cè)剩余壽命,可以更經(jīng)濟(jì)、更合理的使用車輛;
- 金融領(lǐng)域 :利率、股票、現(xiàn)金流、外匯等走勢(shì)預(yù)測(cè)都對(duì)經(jīng)濟(jì)產(chǎn)生重大影響。
?
工業(yè)設(shè)備異常檢測(cè)
經(jīng)典的機(jī)器學(xué)習(xí)算法應(yīng)用到時(shí)間序列預(yù)測(cè)中,其優(yōu)勢(shì)在于模型使用靈活、訓(xùn)練簡(jiǎn)單,但也存在明顯的缺點(diǎn),需要大量的人工工作在特征工程上。近年來,深度學(xué)習(xí)逐步在語音、視覺、自然語言理解等領(lǐng)域得到廣泛應(yīng)用,其算法的優(yōu)勢(shì)明顯。首先,它可以自動(dòng)捕捉關(guān)鍵特征,不需要依賴統(tǒng)計(jì)學(xué)知識(shí),不需要復(fù)雜的特征工程;其次,它在建模流程與準(zhǔn)確率上有著機(jī)器學(xué)習(xí)不可比擬的優(yōu)勢(shì);此外,它還具備很多功能優(yōu)勢(shì),如使用靈活、表達(dá)力強(qiáng)、兼容多樣性等。
既然深度學(xué)習(xí)這么優(yōu)秀,怎么為時(shí)序場(chǎng)景業(yè)務(wù)所用呢?
PaddleTS提供了一系列先進(jìn)的基于深度學(xué)習(xí)技術(shù)的時(shí)序建模算法及相關(guān)組件
,它功能豐富、簡(jiǎn)單易用、效果領(lǐng)先,包括能源、交通、制造等多個(gè)行業(yè)客戶早已應(yīng)用起來,還不快來試試~~

- GitHub傳送門
https://github.com/PaddlePaddle/PaddleTS
PaddleTS相關(guān)技術(shù)交流群
1. 微信掃描下方二維碼,關(guān)注公眾號(hào),填寫問卷后進(jìn)入微信群
2. 查看 群公告 領(lǐng)取福利

功能全面豐富
PaddleTS覆蓋 時(shí)序預(yù)測(cè) 和 時(shí)序異常檢測(cè) 兩大核心應(yīng)用場(chǎng)景,針對(duì)建模全流程,提供了豐富的功能。既支持單變量也支持多變量的時(shí)序分析,同時(shí)還具備模型融合、自動(dòng)建模及豐富的建模工具組件。PaddleTS無論是在功能豐富度上,還是在集成的時(shí)序算法數(shù)量上,都超過了市面上典型的開源時(shí)序產(chǎn)品。除了基礎(chǔ)能力以外,產(chǎn)品還有以下特色功能:
-
全面的數(shù)據(jù)類型支持 :PaddleTS提供的 協(xié)變量支持 功能,支持歷史觀測(cè)協(xié)變量、未來可知協(xié)變量、靜態(tài)協(xié)變量和分類變量等各種協(xié)變量數(shù)據(jù)類型,幫助開發(fā)者有效利用各種數(shù)據(jù)充分發(fā)揮數(shù)據(jù)的價(jià)值。
- 主流新穎的深度模型 :PaddleTS集成了 Transformer、TCN、 VAE、TS2Vec 、 N-beats 等豐富的深度學(xué)習(xí)模型,可以很好的捕捉復(fù)雜時(shí)序場(chǎng)景中的多變量動(dòng)態(tài)依賴關(guān)系,解決長(zhǎng)周期、多變量、小樣本等問題,取得更好的模型效果。
- 豐富的分析建模工具集 :PaddleTS內(nèi)置了 時(shí)序特征處理、數(shù)據(jù)分析、回測(cè)、滾動(dòng)預(yù)測(cè)、自動(dòng)建模、模型融合 等分析建模過程中非常實(shí)用的功能,可以幫助開發(fā)者減少編碼數(shù)量,提升開發(fā)效率。

簡(jiǎn)單易用、快速上手
不需要深刻的專業(yè)背景和復(fù)雜的特征工程
3行代碼實(shí)現(xiàn)時(shí)序建模
PaddleTS覆蓋了大部分主流深度學(xué)習(xí)模型,開發(fā)者只需將數(shù)據(jù)按照格式要求灌入數(shù)據(jù)集,再通過簡(jiǎn)單的歸一化處理即可進(jìn)行模型訓(xùn)練預(yù)測(cè)。相較于傳統(tǒng)統(tǒng)計(jì)模型對(duì)開發(fā)者統(tǒng)計(jì)知識(shí)的要求,機(jī)器學(xué)習(xí)模型在訓(xùn)練前復(fù)雜的特征工程,開發(fā)者使用PaddleTS構(gòu)建深度學(xué)習(xí)模型更加快速、簡(jiǎn)單。- 時(shí)序建模代碼示例
dataset?=?TSDataset.load_from_dataframe(df,?**kwargs)
mlp?=?MLPRegressor(in_chunk_len?=?7?*?24,?out_chunk_len?=?24)
mlp.fit(dataset)
兼容第三方庫,機(jī)器學(xué)習(xí)模型也能高效利用
P addleTS默認(rèn)集成了sklearn、pyod等第三方庫,解決了傳統(tǒng)機(jī)器學(xué)習(xí)方法不能直接用于時(shí)序數(shù)據(jù),且建模過程復(fù)雜等問題。 開發(fā)者通過幾行代碼即可實(shí)現(xiàn)傳統(tǒng)機(jī)器學(xué)習(xí)的調(diào)用,搭配PaddleTS中豐富的建模全流程工具,充分滿足個(gè)性化需求。-
時(shí)序預(yù)測(cè)代碼示例
ts_forecasting_model?=?make_ml_model(sklearn.linear_model.LinearRegression,?in_chunk_len=16,?out_chunk_len=1)
ts_forecasting_model.fit(tsdataset)
res?=?ts_forecasting_model.predict(tsdataset)
- 時(shí)序異常檢測(cè)代碼示例
ts_anomaly_model?=?make_ml_model(pyod.models.knn.KNN,?in_chunk_len=16)
ts_anomaly_model.fit(tsdataset)
res?=?ts_anomaly_model.predict(tsdataset)
時(shí)序?qū)俚淖詣?dòng)建模與集成預(yù)測(cè)器
策略更優(yōu)、操作更簡(jiǎn)單
PaddleTS將傳統(tǒng)的自動(dòng)建模和集成學(xué)習(xí)工具進(jìn)行改良優(yōu)化,針對(duì)時(shí)序場(chǎng)景重新設(shè)計(jì)了更加便捷的建模工具。 自動(dòng)建模AutoTS :在該模塊中內(nèi)置了默認(rèn)搜索空間、超參優(yōu)化算法、重采樣策略與參數(shù)評(píng)估策略,開發(fā)者僅需 2行代碼 即可完成自動(dòng)建模的主體訓(xùn)練流程定義。-
AutoTS功能代碼示例
autots_model?=?AutoTS(MLPRegressor,?96,?24)
autots_model.fit(tsdataset)
集成預(yù)測(cè)器Ensemble
:該模塊采用集成學(xué)習(xí)的思想,提供兩種集成預(yù)測(cè)器,開發(fā)者通過簡(jiǎn)單的操作即可把多個(gè)PaddleTS預(yù)測(cè)器集合成一個(gè),滿足多數(shù)場(chǎng)景下的集成需求。
-
Ensemble功能代碼示例
ensemble_model?=?StackingEnsembleForecaster(96,24,estimators=[(NHiTSModel,?nhits_params),(RNNBlockRegressor,?rnn_params),?(MLPRegressor,?mlp_params)])
ensemble_model.fit(ts_train,?ts_val)
速度快、效果優(yōu) ?
PaddleTS基于飛槳框架,對(duì)數(shù)據(jù)加載、模型訓(xùn)練、模型預(yù)測(cè)等核心環(huán)節(jié)精心打磨優(yōu)化,效率相比同類開源產(chǎn)品有非常大的優(yōu)勢(shì)。
訓(xùn)練環(huán)境:GPU CUDA 11.2,設(shè)備 NVIDIA A30
指標(biāo)說明:MAE,即絕對(duì)平均誤差,它表示預(yù)測(cè)值和觀測(cè)值之間絕對(duì)誤差的平均值,越小則預(yù)測(cè)效果越好
此外,相較于同類產(chǎn)品,使用PaddleTS中的AutoTS自動(dòng)建模工具可以取得更優(yōu)的建模效果,在大多數(shù)情況下優(yōu)于專家經(jīng)驗(yàn)調(diào)參。
? WTH數(shù)據(jù)集:包含2010年至2013年4年間近1600個(gè)美國(guó)地區(qū)的當(dāng)?shù)貧夂驍?shù)據(jù)
*利用默認(rèn)的TPE算法,運(yùn)行50次參數(shù)試驗(yàn)PaddleTS直播課預(yù)告
11月8日(周二)19:00 ,百度資深工程師將為大家深度解析 時(shí)序建模算法庫PaddleTS ,歡迎大家 掃描海報(bào)二維碼 報(bào)名直播課,與各位開發(fā)者進(jìn)行技術(shù)和業(yè)務(wù)深度交流!

更多精彩直播推薦

