【Python】我常用的幾個Python金融分析庫,太強(qiáng)了~
共 5573字,需瀏覽 12分鐘
·
2024-07-29 12:00
1 NumPy
從根本上說,所有金融模型都依賴于數(shù)字運(yùn)算。NumPy 是用 Python 進(jìn)行科學(xué)和數(shù)學(xué)計算的基礎(chǔ)庫。它不僅在 Python 中引入了 n 維數(shù)組和矩陣,還包含一些基本的數(shù)學(xué)函數(shù)來操作這些數(shù)據(jù)結(jié)構(gòu)。本文后面提到的大多數(shù)高級金融 Python 庫都依賴于 NumPy。
例如,創(chuàng)建兩個 2×2 復(fù)數(shù)矩陣并打印總和:
import numpy as np
a = np.array([[1+2j, 2+1j], [3, 4]])
b = np.array([[5, 6+6j], [7, 8+4j]])
print(a+b)
輸出:
[[6.+2.j 8.+7.j]
[10.+0.j 12.+4.j]]
2 SciPy
NumPy 庫為操作和存儲數(shù)據(jù)提供了基本的數(shù)學(xué)結(jié)構(gòu)。但要基于這些數(shù)據(jù)建立復(fù)雜的模型,還需要一個包含更高級統(tǒng)計工具和操作的存儲庫,這就是 SciPy。
SciPy提供了對建立任何統(tǒng)計模型所需的高級科學(xué)計算至關(guān)重要的函數(shù)和算法。其中包括插值、優(yōu)化、聚類、轉(zhuǎn)換和數(shù)據(jù)整合算法。在進(jìn)行任何類型的數(shù)據(jù)分析或構(gòu)建任何類型的預(yù)測模型時,這些操作都是必不可少的。
為了演示插值,我首先使用 NumPy 用任意函數(shù)創(chuàng)建一些數(shù)據(jù)點(diǎn),然后比較不同的插值方法:
from scipy.interpolate import interp1d
import pylab
x = np.linspace(0, 5, 10)
y = np.exp(x) / np.cos(np.pi * x)
f_nearest = interp1d(x, y, kind='nearest')
f_linear = interp1d(x, y)
f_cubic = interp1d(x, y, kind='cubic')
x2 = np.linspace(0, 5, 100)
pylab.plot(x, y, 'o', label='data points')
pylab.plot(x2, f_nearest(x2), label='nearest')
pylab.plot(x2, f_linear(x2), label='linear')
pylab.plot(x2, f_cubic(x2), label='cubic')
pylab.legend()
pylab.show()
3 Pandas
Pandas建立了一種直觀易用的數(shù)據(jù)結(jié)構(gòu)--DataFrame,專門用于分析和建立模型。
Pandas以 NumPy 引入的數(shù)組為基礎(chǔ),針對表格、多維和異構(gòu)數(shù)據(jù)進(jìn)行了優(yōu)化。最常見的操作,如分組、連接、合并或填充、替換和歸納空值,都可以在一行中執(zhí)行。
此外,Pandas還提供了從各種標(biāo)準(zhǔn)格式導(dǎo)入數(shù)據(jù)的函數(shù),以及用于快速繪圖、檢索基本統(tǒng)計數(shù)據(jù)或輸出數(shù)據(jù)的其他函數(shù)。
創(chuàng)建 DataFrame
import pandas as pd
df_1 = pd.DataFrame({'col1': [1,2], 'col2': [3,4]})
合并dataframe
df_2 = pd.DataFrame({'col3': [5,6], 'col4': [7,8]})
df = pd.concat([df_1,df_2], axis = 1)
4 statsmodels
SciPy 提供了一個統(tǒng)計工具庫,允許用戶構(gòu)建模型,而 pandas 則使其易于實(shí)現(xiàn)。statsmodels 以這些庫為基礎(chǔ),對不同的統(tǒng)計模型進(jìn)行了更高級的測試。
對于任何給定的模型,每個估計器都有大量的結(jié)果統(tǒng)計和診斷列表,目的是讓用戶全面了解模型的性能。這些結(jié)果將根據(jù)現(xiàn)有的統(tǒng)計庫進(jìn)行測試,以確保其正確性。
例如,導(dǎo)入一個內(nèi)置數(shù)據(jù)集:
import numpy as np
import statsmodels.api as sm
rand_data = sm.datasets.randhie.load(as_pandas=False)
rand_exog = rand_data.exog.view(float).reshape(len(rand_data.exog), -1)
rand_exog = sm.add_constant(rand_exog, prepend=False)
并用泊松模型對數(shù)據(jù)集進(jìn)行擬合:
poisson_mod = sm.Poisson(rand_data.endog, rand_exog)
poisson_res = poisson_mod.fit(method="newton")
print(poisson_res.summary())
5 Quandl
Quandl 是金融數(shù)據(jù)源庫,提供了的大量經(jīng)濟(jì)、金融和市場數(shù)據(jù)。大多數(shù)原始數(shù)據(jù)集在注冊后可免費(fèi)訪問(需要一個 API 密鑰),更高級和更深入的數(shù)據(jù)集則需要付費(fèi)。
6 Zipline
Zipline是一個強(qiáng)大的 Python 算法交易庫, 將統(tǒng)計、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)源聯(lián)系,且為 Quantopian(一個用于構(gòu)建和執(zhí)行交易策略的免費(fèi)平臺)提供支持。
Quandl的數(shù)據(jù)可以輕松導(dǎo)入,自定義算法也可以輕松設(shè)計、測試和實(shí)施。這包括算法的回溯測試和實(shí)時交易。一個基本算法是這樣的:
from zipline.api import order, record, symbol
def initialize(context):
pass
def handle_data(context, data):
order(symbol('AAPL'), 10)
record(AAPL=data.current(symbol('AAPL'), 'price'))
我們從 zipline 中導(dǎo)入訂單、記錄和符號函數(shù),建立了一個記錄蘋果股票價格的算法。
7 Pyfolio
在 zipline 中設(shè)計和測試算法后,pyfolio 庫提供了一種生成包含性能統(tǒng)計數(shù)據(jù)的簡便方法。這些統(tǒng)計數(shù)據(jù)包括年度/月度回報、回報量化、滾動貝塔/夏普比率、投資組合周轉(zhuǎn)率等。生成單只股票的示例數(shù)據(jù)表:
import pyfolio as pf
stock_rets = pf.utils.get_symbol_rets('FB')
pf.create_returns_tear_sheet(stock_rets, live_start_date='2015-12-1')
輸出結(jié)果將是一系列包含性能指標(biāo)的表格和圖表。
8 TA-Lib
接下來的兩個庫是 zipline 和 pyfolio 的替代品。第一個是技術(shù)分析庫,簡稱 TA-Lib,它使用 C++ 編寫,但也有 Python 的封裝。與 zipline 一樣,TA-Lib 提供了常見的金融工具,如重疊研究、動量指標(biāo)、成交量指標(biāo)、波動率指標(biāo)、價格轉(zhuǎn)換、周期指標(biāo)、模式識別和純統(tǒng)計功能。
9 QuantLib
QuantLib 是 zipline 和 pyfolio 的第二個替代庫,與 TA-Lib 類似,QuantLib 也是用 C++ 編寫,然后導(dǎo)出到 Python。
QuantLib旨在創(chuàng)建一個免費(fèi)、開源的建模、交易和風(fēng)險管理庫。該庫包含設(shè)計和實(shí)施高級算法的工具,其中包括市場慣例、收益曲線模型、求解器、PDE、蒙特卡羅等功能。
10 Matplotlib
前面用于金融的 python庫包含了金融數(shù)據(jù)源、金融數(shù)據(jù)的最佳數(shù)據(jù)結(jié)構(gòu)以及統(tǒng)計模型和評估機(jī)制。但沒有一個庫提供了用于金融建模的最重要的 Python 工具之一:數(shù)據(jù)可視化(本文中的所有可視化均由 matplotlib 提供)。
可視化不僅對于理解金融數(shù)據(jù)的趨勢很重要,而且對于向非技術(shù)人員傳達(dá)見解也很重要。Python 中有許多數(shù)據(jù)可視化庫,每個庫都有其優(yōu)點(diǎn)和缺點(diǎn),但在金融建模中最容易實(shí)現(xiàn)的是 matplotlib。這主要是因?yàn)樵S多庫都已經(jīng)依賴 matplotlib。
來源:activestate
往期精彩回顧
交流群
歡迎加入機(jī)器學(xué)習(xí)愛好者微信群一起和同行交流,目前有機(jī)器學(xué)習(xí)交流群、博士群、博士申報交流、CV、NLP等微信群,請掃描下面的微信號加群,備注:”昵稱-學(xué)校/公司-研究方向“,例如:”張小明-浙大-CV“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~(也可以加入機(jī)器學(xué)習(xí)交流qq群772479961)
