可加模型

簡介

可加模型是一種非參數模型，如果說二維散點圖的平滑是簡單線性回歸模型的一般化，那么加性模型就是多元回歸模型的一般化。加性模型非常具有靈活性，因為它不象參數模型那樣需要假設某種函式形式，只要預測變數對回響變數的影響是獨立即可，也稱為可加和假設。

擬合

加性模型的擬合是通過一個疊代過程（向後擬合算法）對每個預測變數進行樣條平滑。其算法要在擬合誤差和自由度之間進行權衡最終達到最優。在R中可以利用mgcv包中的gam函式實現加性模型，我們仍以trees數據集作為例子，其中Volume為回響變數，Girth和Height為預測變數。

------------------------

model=gam(Volume~s(Girth)+s(Height),data=trees)

par(mfrow=c(1,2))

plot(model,se=T,resid=T,pch=16)

------------------------

上面顯示的是各預測變數的偏殘差圖，表示了各預測變數對回響變數的獨立影響，縱軸括弧中的數字表示EDF（estimated degrees of freedom），Height的估計自由度為1，即是線性關係。建模結果存在model變數中，它同樣可以用summary、predict、anova等泛型函式作進一步處理
------------------------
summary(model)
　　Approximate significance of smooth terms:
　　edf Ref.df F p-value
　　s(Girth) 2.693 3.368 203.8 < 2e-16 ***
　　s(Height) 1.000 1.000 16.0 0.000459 ***
　　R-sq.(adj) = 0.973 Deviance explained = 97.7%
　　GCV score = 8.4734 Scale est. = 7.1905 n = 31
------------------------
從上面的結果報告可以觀察到各預測變數的EDF值，後面的P值表示平滑函式是否顯著的減少了模型誤差。偽判定係數R-sq顯示了模型的解釋能力為97.7%。

弱點

加性模型容易被誤用往往是因為沒有注意到其前提假設，在本例中樹圍和樹高對樹木體積的影響並非是可加性的，顯然二者之間存在互動作用，應該用s(Girth,Height)作為預測變數。

gam函式中也能加入線性預測變數，構成半參數加性模型，還可以設定family參數實現廣義加性模型。

此外，加性模型的弱點在於其結果不象參數模型那樣容易解釋，但它用於探索性數據分析和預測工作時是非常有用的分析工具。如果把加性模型當作模型擬合工具而非探索性工具時，其平滑參數的設定就變得非常重要

可加模型

基本介紹

可加模型

簡介

擬合

弱點

線性可加模型

廣義加性模型

提出背景

廣義加性模型

廣義加性模型優缺點

相關詞條

熱門詞條