稀疏主成分分析

稀疏主成分分析(sparse PCA)是最近發展出來的一類特徵提取算法。

基本介紹

  • 中文名:稀疏主成分分析
  • 外文名:sparse PCA
  • 對應:特徵提取算法
  • 屬性:數據變數的線性組合
主成分分析(PCA)被公認為是一類很有效的特徵提取算法,能夠進行特徵提取和數據降維,有很好的數學解釋。但是,由於主成分分析最終給出的主成分是原來的數據變數的線性組合,有時當我們需要對主成分進行分析和解釋時,就無法解釋每一個主成分對應的特徵是什麼。比如,把主成分分析套用到基因數據處理時,可能我們就無法解釋某些主成分所對應的基因到底怎么解釋。另外一種情形就是,當變數特別多時,也不好對主成分進行合理的解釋,比如對光譜的主成分進行分析。
稀疏主成分分析即是為了解決這個問題而引進的一個算法。它會把主成分係數(構成主成分時每個變數前面的係數)變的稀疏,也即是把大多數係數都變成零,通過這樣一種方式,我們就可以把主成分的主要的部分凸現出來,這樣主成分就會變得較為容易解釋。
實現主成分分析稀疏化,最終會轉化為最佳化問題, 也即對本來的主成分分析(PCA)中的問題增加一個懲罰函式。 這個懲罰函式包含有稀疏度的信息。當然,最終得到的問題是NP-困難問題,為了解決它,我們就需要採用一些方法逼近這個問題的解。這也是不同稀疏主成分分析算法不同的由來

相關詞條

熱門詞條

聯絡我們