原創(chuàng) | 支持向量機在金融領域的應用
作者:金一鳴 審校:陳之炎 本文約4400字,建議閱讀8分鐘 本文選擇一個簡單直觀的應用實戰(zhàn)——根據(jù)股價基本 歷史數(shù)據(jù)來預測股市漲跌。


圖1.1-1 二分類問題可以有無數(shù)條分割線來對其分類

可以理解成一個分類標簽,整個式子就是一個分類器了,計算過程如下:
(正樣本超平面),同樣的黑球(負樣本)可以表示成
(負樣本超平面)。因此該問題的決策函數(shù)他就是線性支持向量機):函數(shù)邊界:一個數(shù)據(jù)點到超平面的距離|w ? x + b|,所以最小函數(shù)邊界可以表示為:
1.1. 3
1.1. 4
幾何邊界:在函數(shù)邊界基礎上抽象成空間上的概念,可表示空間中點到平面的距離。對法向量w加上規(guī)范化的限制,這樣即使w和b成倍增加也不會影響超平面在空 間中的改變。所以最小幾何邊界可表示成:
1.1. 5
1.1. 6


1.1. 7

1.1. 8
的問題也就是求
所以式子也可以寫成:
1.1. 9


1.1. 10
= 1 時,Xi + b>1;當
= —1 時,
1.1. 11



圖 1.2-1: 現(xiàn)實中各種分類情況
1.2.12

1.2.13

1.2.14


1.2.15
1.2.16

Open (當天開盤價)High (當天最高價)
Low (當天最低價)
Volume (當天成交的股票數(shù)量)
Money (當天成交的金額)
利用Pandas可以很方便查看數(shù)據(jù)集的基本結構和屬性。

表2.1-1 數(shù)據(jù)格式







編輯:于騰凱
校對:林亦霖
數(shù)據(jù)派研究部介紹
數(shù)據(jù)派研究部成立于2017年初,以興趣為核心劃分多個組別,各組既遵循研究部整體的知識分享和實踐項目規(guī)劃,又各具特色:
算法模型組:積極組隊參加kaggle等比賽,原創(chuàng)手把手教系列文章;
調研分析組:通過專訪等方式調研大數(shù)據(jù)的應用,探索數(shù)據(jù)產(chǎn)品之美;
系統(tǒng)平臺組:追蹤大數(shù)據(jù)&人工智能系統(tǒng)平臺技術前沿,對話專家;
自然語言處理組:重于實踐,積極參加比賽及策劃各類文本分析項目;
制造業(yè)大數(shù)據(jù)組:秉工業(yè)強國之夢,產(chǎn)學研政結合,挖掘數(shù)據(jù)價值;
數(shù)據(jù)可視化組:將信息與藝術融合,探索數(shù)據(jù)之美,學用可視化講故事;
網(wǎng)絡爬蟲組:爬取網(wǎng)絡信息,配合其他各組開發(fā)創(chuàng)意項目。
點擊文末“閱讀原文”,報名數(shù)據(jù)派研究部志愿者,總有一組適合你~
轉載須知
如需轉載,請在開篇顯著位置注明作者和出處(轉自:數(shù)據(jù)派THUID:DatapiTHU),并在文章結尾放置數(shù)據(jù)派醒目二維碼。有原創(chuàng)標識文章,請發(fā)送【文章名稱-待授權公眾號名稱及ID】至聯(lián)系郵箱,申請白名單授權并按要求編輯。
未經(jīng)許可的轉載以及改編者,我們將依法追究其法律責任。
點擊“閱讀原文”加入組織~

