您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 医学统计学简单回归分析
第十二章简单线性回归Simplelinearregressionanalysis流行病学与卫生统计学教研室曹明芹Regression释义2020/4/24简单线性回归3第十二章简单线性回归线性回归线性回归的应用残差分析回归分析应注意的问题非线性回归2020/4/24简单线性回归4一、线性回归线性相关:分析两个变量的相关关系的方向及密切程度的统计方法欲分析两个变量在数量上的依存关系或者由一个易测变量推测另一个难测变量,采用回归分析。简单线性回归:涉及一个应变量和一个自变量多重线性回归:涉及一个应变量和多个自变量例:体重与体表面积、胰岛素水平与血糖水平用身高、体重、肺活量估计心室输出量2020/4/24简单线性回归5一、线性回归简单线性回归模型的一般形式线性回归分析的基本步骤线性回归分析的条件2020/4/24简单线性回归6(一)简单线性回归模型的一般形式例:随机抽取15名健康成年人,测定其血液的凝血酶浓度(单位/毫升)及凝固时间(秒),数据如下表所示:12131415161718190.50.70.91.11.3凝血酶浓度(单位/毫升)凝血时间(秒)2020/4/24简单线性回归8(一)简单线性回归模型的一般形式若描述凝血酶浓度和凝血时间在数量上的依存关系时(回归分析),应变量为凝血酶浓度,自变量为凝血酶时间。Y表示应变量,因变量,响应变量(dependentvariable,responsevariable)X表示自变量,解释变量,预测因子(independentvariable,explanatoryvariable,predictor)用数学上的二元一次方程形式表示简单线性回归2020/4/24简单线性回归9(一)简单线性回归模型的一般形式总体回归模型表示为:样本回归模型表示:ˆYabXiiiYX2020/4/24简单线性回归10(一)简单线性回归模型的一般形式a的意义a截距、常数项(intercept,constant)X=0时,Y的估计值a的单位与Y值相同当X可能取0时,a才有实际意义。ˆYabX2020/4/24简单线性回归11(一)简单线性回归模型的一般形式b的意义b斜率(slope)b的单位为(Y的单位/X的单位)b0,直线从左下方走向右上方,Y随X增大而增大;b0,直线从左上方走向右下方,Y随X增大而减小;b=0,表示直线与X轴平行,X与Y无直线关系在回归分析中,将b称为回归系数(regressioncoefficient)ˆYabX2020/4/24简单线性回归12(一)简单线性回归模型的一般形式b的意义b表示X每增加(减)一个单位,Y平均改变b个单位例:1~7岁儿童以年龄(岁)估计体重(Kg)的回归方程为例:以凝血酶浓度(单位/毫升)估计凝血时间(秒)的回归方程为ˆYabXˆ72YXˆ21.786.98YX2020/4/24简单线性回归13(一)简单线性回归模型的一般形式的意义给定X时,Y的估计值给定X时,Y的平均值(总体均数的点估计)举例ˆYˆYabX2020/4/24简单线性回归14(二)线性回归分析的基本步骤1.绘制散点图(观察是否有线性趋势、异常点)2.估计回归参数,列出回归方程3.对回归方程进行假设检验4.在散点图上绘制回归直线5.解释回归系数的统计学意义6.评价回归方程的拟合效果2020/4/24简单线性回归15(二)线性回归分析的基本步骤绘制散点图(观察是否有线性趋势、异常点)12131415161718190.50.70.91.11.3凝血酶浓度(单位/毫升)凝血时间(秒)2020/4/24简单线性回归16(二)线性回归分析的基本步骤估计回归参数,列出回归方程求解a、b,实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。最小二乘法原理估计残差(residual)或剩余即实测值Y与假定回归线上的估计值的纵向距离最小二乘法(leastsumofsquares):回归的残差平方和最小,即各实测点至直线的纵向距离的平方和最小。ˆiiiYYˆY2020/4/24简单线性回归18(二)线性回归分析的基本步骤估计回归参数,列出回归方程最小二乘法原理估计的回归直线必过点公式为可使用计算器计算或软件计算),(YXxyxxlblaYbXˆYabX2020/4/24简单线性回归19(二)线性回归分析的基本步骤对回归方程进行假设检验方差分析回归系数的t检验b≠0,推断是否=0,若=0,则回归关系不存在。H0:=0,无直线回归关系;H1:≠0,有直线回归关系;2020/4/24简单线性回归20(二)线性回归分析的基本步骤方差分析将应变量Y的总变异划分成两部分,一部分是由线性回归所致的变异,另一部分是由残差所致的变异总的离均差平方和相应划分为两部分总的自由度相应划分为两部分SSSSSS总回归剩余总回归剩余应变量Y的总变异的分解XP(X,Y)YY)(YY)(YYY)(YYY2020/4/24简单线性回归22Y的总变异(离均差平方和)分解总变异:(sumofsquaresaboutthemeanofY)剩余(残差)的变异:(sumofsquaresaboutregression)回归的贡献,回归平方和:(sumofsquaresduetoregression)2()SSYY总2()SSYY回归2()SSYY剩余2020/4/24简单线性回归23Y的自由度分解总的自由度:n-1回归自由度:1剩余自由度:n-22020/4/24简单线性回归24(二)线性回归分析的基本步骤方差分析ANOVAb19.684119.68478.757.000a3.24913.25022.93314RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),凝血酶浓度a.DependentVariable:凝血时间b.2020/4/24简单线性回归25(二)线性回归分析的基本步骤回归系数的t检验2bbtSnCoefficientsa21.774.78227.860.000-6.980.787-.926-8.874.000(Constant)凝血酶浓度Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:凝血时间a.2020/4/24简单线性回归26(二)线性回归分析的基本步骤在散点图上绘制回归直线解释回归系数的统计学意义2020/4/24简单线性回归27(二)线性回归分析的基本步骤评价回归方程的拟合效果剩余标准差:剩余标准差反映的是扣除X对Y的线性影响后Y的变异剩余标准差越小,回归方差的拟合效果越好2ˆ2YXYYSMSn剩余2020/4/24简单线性回归28(二)线性回归分析的基本步骤评价回归方程的拟合效果决定系数(确定系数):r2决定系数反映的是回归引起的变异占Y总变异的比重决定系数越大(越接近1),回归的拟合效果越好2SSr回归总SS2020/4/24简单线性回归29(二)线性回归分析的基本步骤1.绘制散点图(观察是否有线性趋势、异常点)2.估计回归参数,列出回归方程3.对回归方程进行假设检验4.在散点图上绘制回归直线5.解释回归系数的统计学意义6.评价回归方程的拟合效果2020/4/24简单线性回归30教材例题对14名40~60岁健康妇女的体重(Kg)与基础代谢(KJ/d)进行回归分析:绘制散点图280033003800430048005300580030354045505560657075体重(kg)基础代谢(KJ/day)2020/4/24简单线性回归31教材例题建立回归方程XY423.61788.1106ˆ教材例题假设检验(方差分析)教材例题假设检验(t检验)2020/4/24简单线性回归34教材例题绘制直线3000400050006000354045505560657075体重(Kg)基础代谢(KJ/d)2020/4/24简单线性回归35教材例题评价回归方程的拟合效果2020/4/24简单线性回归36(三)线性回归分析的条件线性(linear):因变量Y与自变量X呈线性关系独立(independent):各观察值间相互独立正态性(normality):给定X,Y服从正态分布等方差性(equalvariance):在自变量X的取值范围内,不论X取何值,Y都具有相同的方差。2020/4/24简单线性回归38二、线性回归的应用回归分析中的区间估计总体回归系数的置信区间估计给定X=Xp时,Y的总体均数的置信区间估计给定X=Xp时,个体Y值的容许区间估计2020/4/24简单线性回归39二、线性回归的应用复习总体均数的置信区间:均数界值×标准误个体的容许区间(参考值范围):均数界值×标准差2020/4/24简单线性回归401、总体回归系数的可信区间估计根据t分布原理估计:总体回归系数置信区间bnstb2,12020/4/24简单线性回归412、的置信区间估计Yˆ样本总体Y的均数给定X时Y的均数(Y的条件均数)YYY2,2,2.21()()nnYXYXXYtSYtSnXX根据t分布原理根据:总体回归直线的95%的置信带2020/4/24简单线性回归433、个体Y的预测值的容许区间估计给定X时,Y值的容许区间(Y值可能的变动范围)。2,2,2.21()1()nYnYXXXYtSYtSnXXY个体值95%预测带2020/4/24简单线性回归45三、残差分析残差分析作用(直观图示)评价资料是否符合回归分析的条件识别异常点了解资料和回归模型之间的关系ˆiiiYY2020/4/24简单线性回归48四、回归分析应注意的问题作回归分析应有实际意义进行回归分析时,应先绘制散点图进行回归分析时,应避免超出自变量的取值范围,任意外延残差图是考察是否满足回归分析条件的简单有效的方法2020/4/24简单线性回归49•直线回归与直线相关的区别与联系区别相关、回归分析的作用不同相关表示相互关系,没有依存关系;而回归有依存关系;r没有单位,b有单位;对资料的要求不同:相关要求双变量正态分布,回归分析条件(4个)当X和Y都是随机的,可以进行相关和回归分析;当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析;2020/4/24简单线性回归50联系均表示线性关系;符号相同:共变方向一致;假设检验结果等价(四种方法);总回SSSSrbbrllrblllrllbyxxyxxyyyyxxxyxxxy2..,,•直线回归与直线相关的区别与联系2020/4/24简单线性回归51五、非线性回归通过自变量的变化实现线性化变换自变量实现线性回归的步骤教材例12-62020/4/24简单线性回归52小结线性回归回归方程的一般形式回归参数的解释回归方程的建立(计算器)假设检验方法评价回归方程的拟合效果回归分析的条件回归与相关区别与联系残差分析
本文标题:医学统计学简单回归分析
链接地址:https://www.777doc.com/doc-5017113 .html