您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 直线回归分析-卫生统计学
第十四章直线回归分析SimplelinearregressionanalysisRegression释义2020/4/26直线回归分析3第十四章直线回归分析直线回归分析回归模型的一般形式回归分析的步骤回归分析的应用条件残差分析直线回归分析的应用回归分析应注意的问题直线回归与相关分析的区别和联系2020/4/26直线回归分析4一、直线回归分析线性(直线)相关:分析两个变量的相关关系的方向及密切程度的统计方法欲分析两个变量在数量上的依存关系或者由一个易测变量推测另一个难测变量,采用回归分析。简单直线(线性)回归:涉及一个应变量和一个自变量多重直线(线性)回归:涉及一个应变量和多个自变量例:体重与体表面积、胰岛素水平与血糖水平用身高、体重、肺活量估计心室输出量2020/4/26直线回归分析5一、直线回归分析回归模型的一般形式直线回归分析的步骤直线回归分析的条件残差分析2020/4/26直线回归分析6(一)回归模型的一般形式例14.1某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用核磁共振法测量其腹腔内脂肪面积(cm2),结果如教材188页表14.1所示。试建立腹腔内脂肪面积(y)和腰围(x)的直线回归方程。散点图2020/4/26直线回归分析8(一)回归模型的一般形式若描述男性腰围和腹腔内脂肪面积在数量上的依存关系(回归分析),应变量为腹腔内脂肪面积,自变量为腰围。y表示应变量,因变量,响应变量(dependentvariable,responsevariable)x表示自变量,解释变量,预测因子(independentvariable,explanatoryvariable,predictor)用数学上的二元一次方程形式表示直线回归模型2020/4/26直线回归分析9(一)回归模型的一般形式总体回归模型表示为:样本回归模型表示:bxayˆiiixy2020/4/26直线回归分析10(一)回归模型的一般形式a的意义a截距、常数项(intercept,constant)x=0时,y的估计值a的单位与y值相同当x可能取0时,a才有实际意义。bxayˆayˆ2020/4/26直线回归分析11(一)回归模型的一般形式b的意义b斜率(slope)b的单位为(y的单位/x的单位)b0,直线从左下方走向右上方,y随x增大而增大;b0,直线从左上方走向右下方,y随x增大而减小;b=0,表示直线与x轴平行,x与y无直线关系在回归分析中,将b称为回归系数(regressioncoefficient)bxayˆ2020/4/26直线回归分析12(一)回归模型的一般形式回归系数b:描述y与x在数量上的依存关系b表示x每增加(减)一个单位,y平均改变b个单位例:1~7岁儿童以年龄(岁)估计体重(Kg)的回归方程为例:以凝血酶浓度(单位/毫升)估计凝血时间(秒)的回归方程为bxayˆxy27ˆxy98.678.21ˆ2020/4/26直线回归分析13(一)回归模型的一般形式的意义给定x时,y的估计值给定x时,y的平均值(总体均数的点估计)举例yˆbxayˆxy27ˆ2020/4/26直线回归分析14(二)直线回归分析的基本步骤1.绘制散点图(观察是否有直线趋势、异常点)2.估计回归参数,列出回归方程3.对回归方程进行假设检验4.解释回归系数的统计学意义5.评价回归方程的拟合效果2020/4/26直线回归分析152020/4/26直线回归分析16(二)直线回归分析的基本步骤1.绘制散点图(观察是否有直线趋势、异常点)2020/4/26直线回归分析17(二)直线回归分析的基本步骤2.估计回归参数,列出回归方程求解a、b,实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。最小二乘法原理估计残差(residual)或剩余即实测值y与假定回归线上的估计值的纵向距离最小二乘法(leastsumofsquares):回归的残差平方和最小,即各实测点至直线的纵向距离的平方和最小。iiiyyˆyˆ22)ˆ(iiyyi22)ˆ(iiyyi2020/4/26直线回归分析19(二)直线回归分析的基本步骤2.估计回归参数,列出回归方程最小二乘法原理估计的回归直线必过点公式为可使用计算器计算或软件计算),(yxxy111.2392.96ˆ2020/4/26直线回归分析212020/4/26直线回归分析22(二)直线回归分析的基本步骤3.对回归方程进行假设检验方差分析回归系数的t检验b≠0,推断是否=0,若=0,则回归关系不存在。H0:=0,无直线回归关系;H1:≠0,有直线回归关系;2020/4/26直线回归分析23(二)直线回归分析的基本步骤方差分析将应变量y的总变异划分成两部分,一部分是由直线回归所致的变异,另一部分是由残差所致的变异总的离均差平方和相应划分为两部分总的自由度相应划分为两部分SSSSSS总回归剩余总回归剩余2020/4/26直线回归分析24ThetotalvariationofYxP(x,y)yY)(YY)(YYY)(YYY222)ˆ()ˆ()(YYYYYY2020/4/26直线回归分析25y的总变异(离均差平方和)分解总变异:(sumofsquaresaboutthemeanofy)剩余(残差)的变异:(sumofsquaresaboutregression)回归的贡献,回归平方和:(sumofsquaresduetoregression)2()SSYY总2()SSYY回归2()SSYY剩余2020/4/26直线回归分析26y的自由度分解总的自由度:n-1回归自由度:1剩余自由度:n-22020/4/26直线回归分析27(二)直线回归分析的基本步骤方差分析2020/4/26直线回归分析282020/4/26直线回归分析29(二)直线回归分析的基本步骤回归系数的t检验2bbtSnxxxyblSS2nSSSxy残2020/4/26直线回归分析302020/4/26直线回归分析31/2,(2)nbbtS2020/4/26直线回归分析3260708090100110120130708090100110腰围(cm)腹腔内脂肪面积(cm2)(二)直线回归分析的基本步骤•在散点图上绘制回归直线2020/4/26直线回归分析33(二)直线回归分析的基本步骤4.解释回归系数的统计学意义xy111.2392.96ˆ)/(111.22cmcmb2020/4/26直线回归分析34(二)直线回归分析的基本步骤5.评价回归方程的拟合效果剩余标准差:剩余标准差反映的是扣除x对y的直线影响后y的变异剩余标准差越小,回归模型的拟合效果越好2ˆ2YXYYSMSn剩余2020/4/26直线回归分析35(二)直线回归分析的基本步骤5.评价回归方程的拟合效果决定系数(确定系数):R2决定系数反映的是回归引起的变异占y总变异的比重决定系数越大(越接近1),回归的拟合效果越好R2=0.5812SSRSS回总2020/4/26直线回归分析36(二)直线回归分析的基本步骤1.绘制散点图(观察是否有直线趋势、异常点)2.估计回归参数,列出回归方程3.对回归方程进行假设检验4.解释回归系数的统计学意义5.评价回归方程的拟合效果2020/4/26直线回归分析37举例试对14名40~60岁健康妇女的体重(Kg)与基础代谢(KJ/d)进行回归分析2020/4/26直线回归分析38举例①绘制散点图280033003800430048005300580030354045505560657075体重(kg)基础代谢(KJ/day)2020/4/26直线回归分析39举例②建立回归方程xy423.61788.1106ˆ③假设检验(t检验)及④结果解释③假设检验(t检验)及④结果解释2020/4/26直线回归分析42⑤评价回归方程的拟合效果2020/4/26直线回归分析43(三)直线回归分析的条件线性(linear):因变量y与自变量x呈直线关系独立(independent):各观察值间相互独立正态性(normality):给定x,y的残差服从正态分布等方差性(equalvariance):在自变量x的取值范围内,不论x取何值,y都具有相同的方差。2020/4/26直线回归分析45(四)残差分析残差分析作用(直观图示)评价资料是否符合回归分析的条件识别异常点了解资料和回归模型之间的关系iiiyyˆ2020/4/26直线回归分析46残差图2020/4/26直线回归分析48二、直线回归分析的应用预测和估计回归分析中的区间估计总体回归系数的置信区间估计给定x=xp时,y的总体均数的置信区间估计给定x=xp时,个体y值的容许区间估计2020/4/26直线回归分析491、总体回归系数的可信区间估计根据t分布原理估计:总体回归系数置信区间bnstb2,1总体回归直线的95%的置信带2020/4/26直线回归分析51二、直线回归分析的应用复习总体均数的置信区间:均数界值×标准误个体的容许区间(参考值范围):均数界值×标准差2020/4/26直线回归分析522、的置信区间估计Yˆ样本总体y的均数给定x时y的均数(y的条件均数)YYY2,2,2.21()()nnYXYXXYtSYtSnXX根据t分布原理根据:2020/4/26直线回归分析533、个体y的预测值的容许区间估计给定x时,y值的容许区间(y值可能的变动范围)。2,2,2.21()1()nYnYXXXYtSYtSnXXy个体值95%预测带2020/4/26直线回归分析552020/4/26直线回归分析562020/4/26直线回归分析572020/4/26直线回归分析582020/4/26直线回归分析592020/4/26直线回归分析60三、回归分析应注意的问题作回归分析应有实际意义进行回归分析时,应先绘制散点图进行回归分析时,应避免超出自变量的取值范围,任意外延残差图是考察是否满足回归分析条件的简单有效的方法2020/4/26直线回归分析61四、直线回归与相关的区别与联系区别1.相关、回归分析的应用不同相关表示相互关系,两变量的关系是平行的;回归表示两变量在数量上依存关系,自变量与因变量关系。2.对资料的要求不同相关要求双变量正态分布,回归分析条件(4个)当x和y都是随机的,可以进行相关和回归分析;当y是随机的(x是控制的),理论上只能作回归而不能作相关分析3.统计量的计算、意义不同r没有单位,b有单位;取值范围不同;计算不同;意义不同2020/4/26直线回归分析62联系均表示直线关系;符号相同:共变方向一致;假设检验结果等价(四种方法);一定程度上,可相互解释。总回SSSSrbbrllrblllrllbyxxyxxyyyyxxxyxxxy2..,,四、直线回归与相关的区别与联系2020/4/26直线回归分析63根据数据信息,回答:1.能否分析标准品lgA浓度与火箭电泳高度的相关关系?2.能否进行两者的回归分析?2020/4/26直线回归分析642020/4/26直线回归分析65小结直线回归分析回归模型的一般形式回归分析的步骤回归分析的应用条件残差分析直线回归分析的应用回归分析应注意的问题直线回归与相关分析的区别和联系作业:思考与练习132页第1、2题
本文标题:直线回归分析-卫生统计学
链接地址:https://www.777doc.com/doc-5064404 .html