回归分析
1:如何创建简单线性回归、多项式回归、多元线性回归 7:深层次的分析-泛化能力和变量相对重要性 一、如何创建简单线性回归、多项式回归、多元线性回归 简单线性回归 :##采用R自带的women数据集,分析体重和更改的关系 fit1 = lm(weight~height,data=women) summary(fit) 参数解释: R方模型的整体评价是怎么样的,R方(0.991)可以解释99.1%的因变量Weight的值。 Estimate 参数的截距项和系数 Pr(>|t|)系数是否显著 H0:t检验所以是为0的原假设 多项式回归: 多项式回归其实也是单个的自变量对因变量的解释,只不过对自变量做了算数如对身高^2的算数 fit2= lm(weight~height+I(height^2),data=women) summary(fit2) 七、深层次的分析 模型的泛化能力和变量相对重要性方法 泛化能力:模型对新数据表现如何就叫做模型泛化能力,方法交叉验证: 所谓的交叉验证,将数据分为训练数据和测试数据,先训练数据做回归,再保留样本做预测。 栗子: 创建函数:shrinkage可获得初始R方和交叉验证后的R方 shrinkage= function(fit,k=10){ require(bootstrap) theta.fit =function(x,y){lsfit(x,y)}