線性判別分析

簡介

線性判別分析是一種經典的線性學習方法，在二分類問題上最早由Fisher在1936年提出，亦稱Fisher線性判別。線性判別的思想非常樸素：給定訓練樣例集，設法將樣例投影到一條直線上，使得同類樣例的投影點儘可能接近，異樣樣例的投影點儘可能遠離；在對新樣本進行分類時，將其投影到同樣的直線上，再根據投影點的位置來確定新樣本的類別。LDA與方差分析（ANOVA）和回歸分析緊密相關，這兩種分析方法也試圖通過一些特徵或測量值的線性組合來表示一個因變數。然而，方差分析使用類別自變數和連續數因變數，而判別分析連續自變數和類別因變數（即類標籤）。邏輯回歸和機率回歸比方差分析更類似於LDA，因為他們也是用連續自變數來解釋類別因變數的。LDA的基本假設是自變數是常態分配的，當這一假設無法滿足時，在實際套用中更傾向於用上述的其他方法。LDA也與主成分分析（PCA）和因子分析緊密相關，它們都在尋找最佳解釋數據的變數線性組合。LDA明確的嘗試為數據類之間不同建立模型。另一方面，PCA不考慮類的任何不同，因子分析是根據不同點而不是相同點來建立特徵組合。判別的分析不同因子分析還在於，它不是一個相互依存技術：即必須區分出自變數和因變數（也稱為準則變數）的不同。在對自變數每一次觀察測量值都是連續量的時候，LDA能有效的起作用。當處理類別自變數時，與LDA相對應的技術稱為判別反應分析。

優點

Fisher提出LDA距今已近七十年，仍然是降維和模式分類領域套用中最為廣泛採用而且極為有效的方法之一，其典型套用包括人臉檢測、人臉識別、基於視覺飛行的地平線檢測、目標跟蹤和檢測、信用卡欺詐檢測和圖像檢索、語音識別等。之所以有如此廣泛的套用，其主要原因是，LDA（包括其多類推廣）具有以下優點：可以直接求得基於廣義特徵值問題的解析解，從而避免了在一般非線性算法中，如多層感知器，構建中所常遇到的局部最小問題無需對模式的輸出類別進行人為的編碼，從而使 LDA 對不平衡模式類的處理表現出尤其明顯的優勢。與神經網路方法相比，LDA 不需要調整參數，因而也不存在學習參數和最佳化權重以及神經元激活函式的選擇等問題；對模式的歸一化或隨機化不敏感，而這在基於梯度下降的各種算法中則顯得比較突出。在某些實際情形中，LDA 具有與基於結構風險最小化原理的支持向量機（SVM）相當的甚至更優的推廣性能，但其計算效率則遠優於SVM。正則判別分析法（CDA）尋找最優區分類別的坐標軸（k-1個正則坐標，k為類別的數量）。這些線性函式是不相關的，實際上，它們通過n維數據云定義了一個最最佳化的k-1個空間，能夠最優的區分k個類（通過其在空間的投影）。。

多類LDA：當出現超過兩類的情況時，可以使用由費舍爾判別派生出的分析方法，它延伸為尋找一個保留了所有類的變化性的子空間。這是由 C.R.Rao 總結出來的。假設，C個類中每一個類都有均值和相同的協方差。

要實現典型的LDA技術前提是所有的樣本都必須提前準備完畢。但有些情況下，沒有現成的完整數據集或者輸入觀察數據是流的形式。這樣，就要求LDA的特徵提取有能力隨著觀察新樣本的增加而更新LDA的特徵，而不是在整個數據集上運行算法。例如，在移動機器人或實時臉部識別等實時套用中，提取的LDA特徵能隨著新觀察值實時更新是非常重要的。這種能夠通過簡單觀察新樣本來更新LDA特徵的技術就叫做增量LDA算法，在過去二十年里，它已經被廣泛的研究過。Catterjee和Roychowdhury提出了一種增量自組織LDA算法來更新LDA特徵。另外，Demir和Ozmehmet提出利用誤差改正和赫布學習規則的線上本地學習算法來更新LDA特徵。最後，Aliyari等人提供了快速增量LDA算法。

線性判別分析

基本介紹

簡介

優點

套用領域

相關詞條

熱門詞條