您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > (易洪刚)多元线性回归.
医用多元统计分析方法多重线性回归模型MultipleLinearRegressionModel易洪刚DepartmentofBiostatistics,SchoolofPublicHealth,NanjingMedicalUniversityEmail:ohcepf@163.com医用多元统计分析方法主要内容1多重线性回归模型简介2偏回归系数的估计3方程的假设检验4偏回归系数的假设检验5决定系数与剩余标准差6回归与t检验、方差分析的关系7标准偏回归系数与自变量的贡献医用多元统计分析方法某地13岁男童身高,体重,肺活量的实测数据(部分)编号身高(cm)x1体重(kg)x2肺活量(L)y1135.132.01.753163.646.22.755156.237.12.757167.841.52.759145.033.02.5011165.549.53.0013153.341.02.7515160.547.22.2517147.640.52.0019155.144.72.7521143.031.51.7523160.840.42.7525158.237.52.0027144.534.72.2529156.532.01.75医用多元统计分析方法身高与肺活量的关系y身高(x1)1301401501601701.522.53医用多元统计分析方法身高与肺活量的关系.regyx1Source|SSdfMSNumberofobs=15-------------+------------------------------F(1,13)=8.74Model|1.0985683311.09856833ProbF=0.0111Residual|1.63476513.125751154R-squared=0.4019-------------+------------------------------AdjR-squared=0.3559Total|2.7333333314.195238095RootMSE=.35461-------------------------------------------------------------------------y|Coef.Std.Err.tP|t|[95%Conf.Interval]--------+----------------------------------------------------------------x1|.0299623.01013722.960.011.0080622.0518624_cons|-2.2362561.565632-1.430.177-5.61861.146087-------------------------------------------------------------------------医用多元统计分析方法体重与肺活量的关系y体重(x2)30354045501.522.53医用多元统计分析方法体重与肺活量的关系.regyx2Source|SSdfMSNumberofobs=15-------------+------------------------------F(1,13)=11.50Model|1.2827088711.28270887ProbF=0.0048Residual|1.4506244613.111586497R-squared=0.4693-------------+------------------------------AdjR-squared=0.4285Total|2.7333333314.195238095RootMSE=.33405-------------------------------------------------------------------------y|Coef.Std.Err.tP|t|[95%Conf.Interval]--------+----------------------------------------------------------------x2|.0511685.01509193.390.005.0185644.0837726_cons|.3747994.59865380.630.542-.91851361.668112-------------------------------------------------------------------------医用多元统计分析方法问题:身高、体重两者与肺活量有无线性关系?用身高和体重同时预测肺活量有多高的精度?身高的贡献大,还是体重的贡献大?医用多元统计分析方法单变量分析的局限性:复杂性疾病致病机制遗传因素?环境暴露?交互作用?医用多元统计分析方法主要内容1多重线性回归模型简介2偏回归系数的估计3方程的假设检验4偏回归系数的假设检验5决定系数与剩余标准差6回归与t检验、方差分析的关系7标准偏回归系数与自变量的贡献直线回归模型?医用多元统计分析方法1多重线性回归模型简介医用多元统计分析方法1多重线性回归模型简介多重回归multipleregressionmultiplelinearregression因变量dependentvariableresponsevariable(响应变量)自变量independentvariableexplanatoryvariable(解释变量)医用多元统计分析方法回归模型因变量y,自变量为x1,x2,,xma为截距(intercept),又称常数项(constant),表示各自变量均为0时y的估计值bi称为偏回归系数(partialregressioncoefficient),简称为回归系数称为y的估计值或预测值(predictedvalue)mmxbxbxbay2211ˆyˆ医用多元统计分析方法例:根据某地29名13岁男童的身高x1(cm),体重x2(kg)和肺活量y(L)建立的回归方程为:2105406.0005017.05657.0ˆxxyyˆ当x1=150,x2=32时,=1.9168,表示对所有身高为150cm,体重为32kg的13岁男童,估计平均肺活量为1.9168(L)。包含误差项的回归模型回归模型的应用条件回归模型的矩阵形式医用多元统计分析方法回归模型医用多元统计分析方法包含误差的回归模型1122ˆmmyabxbxbx01122ˆiiimimiiiybbxbxbeyex预测值残差实测值医用多元统计分析方法回归模型的应用条件01122ˆiiimimiiiybbxbxbeyexei称为残差:自变量与因变量的关系是线性的(Linear);Cov(ei,ej)=0,即独立性(Independence);ei~N(0,2),即正态性(Normality);Var(ei)=2,即方差齐性(Equalvariance);LINE2岁身高X与成年后身高Y的散点图Y成年后的身高(英寸)X两岁时的身高(英寸)3032343638406365676971回归模型的应用条件x=x3时的E(y)x=x2时y的分布x=x1时y的分布x=x2时的E(y)x3x2x1x=x1时的E(y)0xyx=x3时y的分布0+1x正态性、方差齐性回归模型的应用条件医用多元统计分析方法回归方程的矩阵形式121nnyyyY)1(1212111111mnmnnmmxxxxxxX121nneeeE1)1(10mmbbbBEYEXBYˆ=XBYˆmmxbxbxbay2211ˆ医用多元统计分析方法回归方程的矩阵形式1305406.0005017.05657.0B0.325.15612.466.16314.309.13910.321.1351X75.175.200.275.1Y2204.04.3005406.09.139005017.05657.000.20920.00.3205406.01.135005017.05657.075.1YXBE小结:医用多元统计分析方法1多重线性回归模型简介01122ˆiiimimiiiybbxbxbeyex医用多元统计分析方法主要内容1多重线性回归模型简介2偏回归系数的估计3方程的假设检验4偏回归系数的假设检验5决定系数与剩余标准差6回归与t检验、方差分析的关系7标准偏回归系数与自变量的贡献医用多元统计分析方法2偏回归系数的估计最小二乘法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小!成都市男中小学生12个年龄组的平均身高紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照射不同时间的细胞密度(个/mm3)免疫球蛋白A(IgA,g)与火箭电泳高度(Y,mm)的关系建湖县1978~1985年疟疾逐月发病数月份月发病人数医用多元统计分析方法Y体重增量(g)X进食量(g)6007008009001000110120130140150160170180190ˆ23.94720.2305YX直线回归方程:残差(residual)2偏回归系数的估计医用多元统计分析方法bXaYˆYY1112131415165.05.56.06.51ˆlY2ˆlY点到回归直线的纵向距离平方和为最小!2偏回归系数的估计医用多元统计分析方法2偏回归系数的估计最小二乘法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小nimminiiixbxbxbbyyyQ122211012ˆ医用多元统计分析方法2偏回归系数的估计最小二乘法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小医用多元统计分析方法正规方程及矩阵计算法imimmimiimiimiiimmiiiiiiiimmiiiiiiimmiiiyxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb2221102222212102112211210122110YXXBXYXXXB1)(2偏回归系数的估计医用多元统计分析方法正规方程及矩阵计算法0.325.15612.466.16314.309.13910.321.1351X75.175.200.275.1Y0.322.464.300.325.1566.1639.1391.1351111'X2偏回归系数的估计医用多元统计分析方法39.4083280.16523970.107680.16523937.67706070.442470.107670.442400.29XX325.2427650.9826000.64YX00259687.000127508.009813142.000127508.000113681.012610946.0009813142.012610946.063235900.151XX从而解得:10.565664()0.00
本文标题:(易洪刚)多元线性回归.
链接地址:https://www.777doc.com/doc-3044859 .html