回歸診斷

概念

回歸診斷主要用於檢驗關於回歸假設是否成立，以及檢驗模型形式是否錯誤，否則我們通過最小二乘法求得的回歸方程就缺乏理論依據。這些檢驗主要探究的問題為：

1）殘差是否為隨機性、是否為正態性、是否不為異方差；

2）高度相關的自變數是否引起了共線性；

3）模型的函式形式是否錯誤或在模型中是否缺少重要的自變數；

4）樣本數據中是否存在異常值。

發展歷程

隨著高速電子計算機的日益廣泛套用，回歸分析愈來愈成為各個領域科技工作者分析數據的一種常用工具。但是，在長期地廣泛實際套用中，人們逐漸地發現經典的最小二乘估計的結果並不總是令人滿意，於是統計學家們從多方面進行努力試圖改進最小二乘估計，例如，為了克服設計陣的病態性，提出了以嶺估計為代表的多種有偏估計。為了解決自變數個數較多的大型回歸模型的變數取捨問題，提出了眾多的回歸自變數選擇準則和算法。為了克服最小二乘估計對異常值的敏感性，提出了各種穩健回歸。為了考察模型假設條件的合理性及數據對統計推斷影響大小，逐漸發展起來了“回歸診斷”這一新的研究領域。以上諸方面的新結果構成了回歸分析近期發展的主體。

分類

從總體上講，回歸診斷尚屬較新的研究分支，因此關於它的研究範圍及採用的術語，在各家筆下也不盡相同。這裡，把殘差分析、數據變換和影響分析等統統包羅在回歸診斷這個總題目下。這是因為殘差分析和數據變換可以看作模型的診斷，而影響分析則看作數據的診斷。

1.殘差分析

回歸診斷中要解決的第一個基本問題——模型假設的合理性，不少文獻概括為殘差分析。這是因為這個問題的解決在很大程度是靠對殘差作種種統計分析來實現。

在回歸診斷中，殘差分析的發展雖然相對說來比較早,但也只是廿年前的事.究其原因主要是這類問題計算量都很大,只有現代電子計算技術得到廣泛套用之後,它的研究和套用才能成為可能。

殘差是最重要的一種回歸診斷量,它蘊含了有關模型基本假設的許多重要信息。殘差分折就是對殘差進行統計處理，從中提煉出這些信息的方法.基於不同的考慮和模型的不同用處，人們定義了許多種殘差——普通殘差，學生化殘差，遞歸殘差、偏殘差等。

殘差圖是殘差分析的一個重要工具.它通過簡單的圖示直觀地顯示出殘差的各種趨勢，以更方便診斷出模型假設的某些不合理性。

2.數據變換

當對數據作了殘差分析，,發現模型的某些假設不滿足或不能近似滿足時，我們需要對數據作適當變換。在這裡，最重要的變換類是Box-Cox的冪變換，它已得到廣泛套用。

這方面的近期研究多集中在如下三方面：

回歸診斷

基本介紹

概念

發展歷程

分類

1.殘差分析

2.數據變換

3.影響分析

未來發展

相關詞條

熱門詞條