【讀書報告】金融數(shù)據(jù)挖掘
Start:關(guān)注本公眾號后,可直接聯(lián)系后臺獲取排版美化的詳細文檔!
Hints:本篇文章所編纂的資料均來自網(wǎng)絡(luò),特此感謝參與奉獻的有關(guān)人員。
序言
?好記性不如爛筆頭。讀過的書,不管好與壞,做個筆記,方便日后回顧。
章節(jié)
數(shù)據(jù)挖掘的定義:
數(shù)據(jù)挖掘是從大量的,不完全的,有噪聲的,模糊的,隨機的實際應用數(shù)據(jù)中,提取隱含其中的,人們事先不知道的,但又潛在有用的信息和知識的過程。
數(shù)據(jù)挖掘的方面:
-數(shù)據(jù)
數(shù)值數(shù)據(jù)、文本數(shù)據(jù)、圖形數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù)
-方法
過程:數(shù)據(jù)準備、數(shù)據(jù)處理、解釋或預測
-目的
數(shù)據(jù)挖掘的主要目的是解釋或預測。解釋指解釋現(xiàn)象,找出現(xiàn)象背后的原因;預測利用規(guī)律對事物未來的發(fā)展進行預測
?
第一章?有監(jiān)督的金融數(shù)據(jù)分類分析-Logit、LDA、QDA與KNN
第一節(jié)?Logistic分類法
第二節(jié)?LDA、QDA與KNN分類法
第二章?無監(jiān)督的金融數(shù)據(jù)分類分析-聚類分析
第一節(jié)?系統(tǒng)聚類法和K-means聚類法
?
第三章?金融數(shù)據(jù)抽樣
第一節(jié)?交叉驗證方法(Cross Validation)
- 基礎(chǔ)交叉驗證法 Basic cross validation
- 除一交叉驗證法 Leave one out cross validation
- K組交叉驗證法 K-Fold cross validation
第二節(jié)?拔靴法 Bootstrap
?
第四章線性模型篩選
第一節(jié)?子集篩選法(subset selection methods)
一 最優(yōu)子集篩選法(Best Subset Selection)
二 逐步選擇法(Stepwise Selection)
1 向前篩選Forward Stepwise Selection
2 向后篩選 Backward Stepwise Selection
3 混合篩選法
三 選擇最優(yōu)模型的標準
1 Cp
2 AIC
3 BIC
4 adjusted R2
第二節(jié)?收縮篩選法
一 嶺回歸 Ridge Regression
二 Lasso方法
?
第五章?克服維數(shù)災難
第一節(jié)?主成分分析法
第二節(jié)?部分最小二乘法
?
第六章?決策樹
第一節(jié)?決策樹的分類和基本知識
一 回歸樹
二 分類樹
第二節(jié)?三種提高樹狀模型預測精度的方法
一 Bagging
二 Random Forest
三 Boosting
?
第七章?支持向量機
第一節(jié)?最大邊際分類器
第二節(jié)?支持向量機
?
公眾號二維碼
End:如果有興趣了解金融量化交易和其他數(shù)據(jù)分析的實用技術(shù),歡迎關(guān)注本公眾號
