加性模子是一种非参数模子,假如说二维散点图的滑腻是简朴线性回归模子的一般化,那么加性模子就是多元回归模子的一般化。加性模子很是具有机动性,因为它不象参数模子那样需要假设某种函数形式,只要预测变量对响应变量的影响是独当即可,也称为可加和假设。
加性模子的拟合是通过一个迭代进程(向后拟合算法)对每个预测变量举办样条滑腻。其算法要在拟合误差和自由度之间举办衡量最终到达最优。在R中可以操作mgcv包中的gam函数实现加性模子,我们仍以trees数据集作为例子,个中Volume为响应变量,Girth和Height为预测变量。
————————
model=gam(Volume~s(Girth)+s(Height),data=trees)
par(mfrow=c(1,2))
plot(model,se=T,resid=T,pch=16)
————————
上图显示的是各预测变量的偏残差图,暗示了各预测变量对响应变量的独立影响,纵轴括号中的数字暗示EDF(estimated degrees of freedom),Height的预计自由度为1,等于线性干系。建模功效存在model变量中,它同样可以用summary、predict、anova等泛型函数作进一步处理惩罚
————————
summary(model)
Approximate significance of smooth terms:
edf Ref.df F p-value
s(Girth) 2.693 3.368 203.8 < 2e-16 ***
s(Height) 1.000 1.000 16.0 0.000459 ***
R-sq.(adj) = 0.973 Deviance explained = 97.7%
GCV score = 8.4734 Scale est. = 7.1905 n = 31
————————
从上面的功效陈诉可以调查到各预测变量的EDF值,后头的P值暗示滑腻函数是否显著的淘汰了模子误差。伪鉴定系数R-sq显示了模子的表明本领为97.7%。
加性模子容易被误用往往是因为没有留意到其前提假设,在本例中树围和树高对树木体积的影响并非是可加性的,显然二者之间存在交互浸染,应该用s(Girth,Height)作为预测变量。
gam函数中也能插手线性预测变量,组成半参数加性模子,还可以配置family参数实现广义加性模子。另外,加性模子的弱点在于其功效不象参数模子那样容易表明,但它用于摸索性数据阐明和预测事情时长短常有用的阐明东西。假如把加性模子看成模子拟合东西而非摸索性东西时,其滑腻参数的设定就变得很是重要。
加性模子(Additive Model)在R中的实现
最后更新 2017-12-04 08:00 星期一 所属:
其他教程 浏览:439
