【數(shù)據(jù)競賽】數(shù)據(jù)競賽中最貴的四個特征
作者:杰少
四大量化強(qiáng)特

本文介紹四個在量化問題中非常重要的特征,對量化有興趣的朋友可以參考學(xué)習(xí),此處的資料主要來源于Optiver團(tuán)隊在Kaggle賽事中的分享。

bid/ask spread
由于不同的股票在市場上的交易水平不同,我們采用最佳報價(best offer price)和最佳買入價(best bid price)的比值來計算買賣價差。
買賣價差的計算公式可采用以下形式:
注:最佳買入價是有人愿意購買的最高價格,最佳報價(或出價)是有人愿意出售的最低價格。
Weighted averaged price
訂單(Order) Book是股票估值的重要來源之一。公允的賬面價值評估必須考慮兩個因素:訂單的水平和規(guī)模。我們可以使用加權(quán)平均價格(WAP)來計算股票的瞬時估值,并以實(shí)際波動率為目標(biāo)。
WAP的公式如下,它考慮了最高級別的價格和數(shù)量信息:
在大多數(shù)情況下,在連續(xù)交易時間內(nèi),訂單簿不應(yīng)出現(xiàn)bid order高于offer或ask order的情況。
Log returns
假設(shè)是股票在時刻的價格,我們通過下面的方式計算和時刻的log return,
通常我們會計算在10分鐘之內(nèi)的log return。Log returns有很多優(yōu)勢,例如:
它們可以在時間軸上相加: 一般的returns不可能低于-100%,但是log return是不受限的;
Realized volatility
模型的有價值輸入是股票對數(shù)收益的標(biāo)準(zhǔn)差。對于在較長或較短時間間隔內(nèi)計算的對數(shù)收益率,標(biāo)準(zhǔn)差會有所不同,因此通常:
將其標(biāo)準(zhǔn)化為1年期,而年化標(biāo)準(zhǔn)差就被稱為波動率(volatility)。
我們一般會使用WAP作為股票的價值來計算log returns。

1.bid/ask spread
def ba_spread(best_offer, best_bid):
ba_spread = best_offer / best_bid - 1.0
return ba_spread
2.WAP
def wap(book):
wap = (book['bid_price1'] * book['ask_size1'] +\
book['ask_price1'] * book['bid_size1']) / (book['bid_size1']+ book['ask_size1'])
return wap
3.Log returns
def log_return(list_stock_prices):
return np.log(list_stock_prices).diff()
4.Realized volatility
def realized_volatility(series_log_return):
return np.sqrt(np.sum(series_log_return**2)) 
股票等問題的建模。

Introduction to financial concepts and data 往期精彩回顧 本站qq群851320808,加入微信群請掃碼:
評論
圖片
表情
