PCA的數(shù)學(xué)原理
日期 : 2021年07月08日
正文共 :7172字
PCA(Principal Component Analysis)是一種常用的數(shù)據(jù)分析方法。PCA通過(guò)線性變換將原始數(shù)據(jù)變換為一組各維度線性無(wú)關(guān)的表示,可用于提取數(shù)據(jù)的主要特征分量,常用于高維數(shù)據(jù)的降維。網(wǎng)上關(guān)于PCA的文章有很多,但是大多數(shù)只描述了PCA的分析過(guò)程,而沒(méi)有講述其中的原理。這篇文章的目的是介紹PCA的基本數(shù)學(xué)原理,幫助讀者了解PCA的工作機(jī)制是什么。
當(dāng)然我并不打算把文章寫(xiě)成純數(shù)學(xué)文章,而是希望用直觀和易懂的方式敘述PCA的數(shù)學(xué)原理,所以整個(gè)文章不會(huì)引入嚴(yán)格的數(shù)學(xué)推導(dǎo)。希望讀者在看完這篇文章后能更好的明白PCA的工作原理。
數(shù)據(jù)的向量表示及降維問(wèn)題

向量的表示及基變換


其中
是向量A的模,也就是A線段的標(biāo)量長(zhǎng)度。








協(xié)方差矩陣及優(yōu)化目標(biāo)










滿足 是一個(gè)對(duì)角矩陣,并且對(duì)角元素按從大到小依次排列,那么P的前K行就是要尋找的基,用P的前K行組成的矩陣乘以X就使得X從N維降到了K維并滿足上述優(yōu)化條件。


算法及實(shí)例










進(jìn)一步討論
— THE END —

評(píng)論
圖片
表情
