您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > SAS线性回归分析案例
SAS线性回归分析案例线性回归20214788陈磊计算2SouthWestJiaoTongUniversity-------------------------------------------------------------------线性回归分为一元线性回归和多元线性回归。一元线性回归的模型为Y=β0+β1X+ε,这里X是自变量,Y是因变量,ε是随机误差项。通常假设随机误差的均值为0,方差为σ2(σ20),σ2与X的值无关。若进一步假设随机误差服从正态分布,就叫做正态线性模型。一般情况,设有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已知,但含有一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。当函数形式为未知参数的线性函数时,称为线性回归分析模型。如果存在多个因变量,则回归模型为:Y=β0+β1X1+β2X2+?+βiXi+ε。由于直线模型中含有随机误差项,所以回归模型反映的直线是不确定的。回归分析的主要目的是要从这些不确定的直线中找出一条最能拟合原始数据信息的直线,并将其作为回归模型来描述因变量和自变量之间的关系,这条直线被称为回归方程。通常在回归分析中,对ε有以下最为常用的经典假设。1、ε的期望值为0.2、ε对于所有的X而言具有同方差性。3、ε是服从正态分布且相互独立的随机变量。对线性回归的讲解,本文以例题为依托展开。在下面的例题中既有一元回归分析,又有二元回归分析。例题(《数据据分析方法》_习题2.4_page79)某公司管理人员为了解某化妆品在一个城市的月销量Y(单位:箱)与该城市中适合使用该化妆品的人数X1(单位:千人)以及他们人均月收入X2(单位:元)之间的关系,在某个月中对15个城市作了调查,得到上述各量的观测值如表2.12所示。假设Y与X1,X2之间满足线性回归关系yi=β0+β1xi1+β2xi2+εi,i=1,2,…,15其中εi独立同分布于N(0,σ2).(1)求线性回归系数β0,β1,β2的最小二乘估计和误差方差σ2的估计,写出回归方程并对回归系数作解释;(2)求出方差分析表,解释对线性回归关系显著性检验结果。求复相关系数的平方R2的值并解释其意义;(3)分别求β1和β2的置信度为95%的置信区间;(4)对α=0.05,分别检验人数X1及收入X2对销量Y的影响是否显著,利用与回归系数有关的一般假设检验方法检验X1和X2的交互作用(即X1X2)对Y的影响是否显著;数据导入据的方式,比如:1、从文件读入数据,infile‘F:\mylib\ch2_2_4.txt’;2、利用已经建立过数据集,procregdata=mylib.ch2_2_4;另外还可以从外部直接导入Excel等方式。上面的程序,是直接在编辑框内输入。过程调用本题所要调用的过程是procreg过程。procreg过程是SAS系统中众多回归分析过程的一种,它除可拟合一般线性回归模型外,还提供多种选取最优模型的方法及模型诊断检查方法。其中(1)、(2)、(3)主要用到多元线性回归分析的结果。(4)将用到一元线性回归分析的结果。常用选项有Selection=,指定变量选择方法:FORWARD(向前输入法)、BACKWARD(向后删除法)、STEPWISE(逐步回归法)、ADJRSQ(修正复相关系数准则)、CP(Cp准则)等。NOINT,表示在模型中不包括常数项;STB,输出标准化的回归系数;CLI,输出单个预测值置信区间;R,进行残差分析,并输出分析结果;I,输出(XTX)?1矩阵。格式:MODEL因变量名=自变量名列/[选项]例:modely=x1x2/selection=stepwise;/*逐步回归*/运行程序后,得到结果参数估计表(1)最小二乘估计:β?=(β?0,β?1,β?2)=(3.45261,0.49600,0.00920)回归方程:Y=3.45261+0.49600X1+0.00920X2方差分析表(2)误差方差估计值:δ?2=MSE=4.74040复相关系数的平方:R2=0.9989(R-Square)显著性:由复相关系数的值可以看出是高度显著的(Y与X1,X2)复相关系数的平方也可以通过计算得到:R2=SSR/SST=53845/53902=0.9989(3)置信区间:β?k+?t1?α(n?p)s(β?k)t0.975(12)=2.17881(通过查t分布表得到)也可以通过函数Y=TINV(p,DF)求得。β1=0.496+/-2.179*0.00605,得出(0.4828,0.5092)β2=0.0092+/-2.179*0.00096811,得出(0.0071,0.0113)(4)复相关系数为:0.9910,X1对Y影响显著(4)复相关系数平方为:0.4087,X2对Y的影响不显著(4)复相关系数的平方为:0.9030,X1X2对Y的影响显著利用模块进行线性回归分析(一)一元线性回归分析启动SAS系统,依次单击“解决方案”-“分析”-“分析家”,然后单击“文件”-“打开”,打开数据集“ch2_2_4.sas7bdat”,如图依次单击“统计”-“回归”-“简单”,弹出对话框(1)变量设置在左侧的变量列表里选中y,单击“Dependent”按钮,将其设为因变量;选中x2,单击“Explanatory”按钮,将其设为自变量。“Model”设置栏中默认选中“Linear”,表示线性回归。(2)Tests设置单击“Tests”按钮,弹出对话框置信度默认值为0.05,可更改。单击“OK”。(3)Plots设置单击“Plots”按钮,弹出作图选项设置对话框,选择“Residul”选项卡。“Studentized”表示学生化残差,“Normalquantile-quantileplot”代表正态QQ图检验。设置如图变量列表自变量因变量置信度a的值单击“OK”,并在主设置对话框单击“OK”,于是并得到结果残差栏正态检验栏变量栏方差分析参数估计单击“Analysis(newproject)”对话框中的“PlotofRSTUDENTvsx2”,弹出残差图对话框再单击“PlotofRSTUDENTvsNQQ”,弹出QQ图由学生化残差的正态QQ图可以看出,模型误差项近似正态分布。回归方程(二)多元线性回归分析启动SAS系统,依次单击“解决方案”-“分析”-“分析家”,然后单击“文件”-“打开”,打开数据集“ch2_2_4.sas7bdat”。依次单击“统计”-“回归”-“线性”,弹出对话框选取自变量x1、x2,因变量y。单击“Model”按钮,弹出对话框自变量选择方式在“Selectionmethod”栏中提供了自变量选择方式,如:Stepwiseselection,表示逐步回归法;AdjustedR-square,表示修正复相关系数准则。本例选择逐步回归法。单击“OK”。Plots设置与一元回归分析情况类似。最后单击“OK”。多元线性分析结果:另外,单击“Analysis(newproject)”对话框中的“code”即可弹出程序对话框。以上过程主要讲解线性回归在SAS系统中的用法,因而对结果分析部分比较少。比如:由QQ图可以看出各点趋近于一条直线,表明误差项近似正态分布。
本文标题:SAS线性回归分析案例
链接地址:https://www.777doc.com/doc-7845899 .html