您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 生身体结构与体能的线性回归分析
生身体结构与体能的线性回归分析摘要本文旨在针对上海市中学生的身体结构与体能建立线性模型,为此选择了8个可能影响这一指标的变量,共3000多数据。首先利用了最小二乘法得到初步回归方程,发现此方程存在回归方程显著但回归系数不显著的问题。在对模型的检验中发现了一条由自变量引起的异常数据,并将它删除得到了不包含异常值的数据集。在此基础上还进行了多重共线性诊断,结果显示变量间不存在高度相关。所得的回归方程说明在被选取的8个变量中对因变量(学生BMI指数)的主要因素是学生的体重、肱三头肌和小腿的长短。关键词:多元线性回归,回归模型一、问题分析体能是指人体运动中形成的能量储备,身体每个部位的结构都有自己特定的功能,结构是实体,功能是状态,结构为功能而存在,功能以结构为基础。一旦身体结构出现异常或病变,体能也会随之出现变异是体质在一定范围内的延伸,体能能力包括身体形态和机能以及运动素质其中每个因素的水平,都会影响到体能整体的水平,3个构成因素中,运动素质是体能的外在表现,本研究用线性回归的方法,对上海市7-17岁中学生(因学校采用序号,学校的序号为:1-21,男生:1668人,女生:1501人)的体能进行研究,找出能够反映中学生体能能力的有效指标,并与身体结构指标建立相应的联系。对于给定的数据进行分析和对相关变量进行筛选的问题,然后加入性别的因素。二、变量说明变量含义yBMI:身体质量指数1x性别2x年龄3x身高4x体重5x肱三头肌6x小腿7x俯卧撑个数8x20米往返跑时间三、模型的建立首先用普通最小二乘回归构造y(BMI)关于x1(性别),x2(年龄),x3(身高),x4(体重),x5(肱三头肌),x6(小腿),x7(俯卧撑个数)与x8(20米往返跑时间)的多元线性回归方程,得到以下结果:表3-1模型汇总模型RR方调整R方标准估计的误差1.980a.960.960.72900a.预测变量:(常量),x8,x6,x1,x7,x2,x5,x4,x3。表3-2Anovab模型平方和df均方FSig.1回归40112.46985014.0599434.785.000a残差1679.3633160.531总计41791.8323168a.预测变量:(常量),x8,x6,x1,x7,x2,x5,x4,x3。b.因变量:y由表3-3知,普通最小二乘估计得到的回归方程式:8765432104.001.0038.0048.0347.0198.0063.0206.0739.31ˆxxxxxxxxy(3.1)由于数据的量纲不同,标准化后的回归方程较未标准化的回归方程是判断各解释变量对因变量影响程度的更合理的标准:*8*7*6*5*4*3*2*1*17.005.061.077.0491.1868.0054.0028.0ˆxxxxxxxxy(3.2)表3-3系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)31.739.258123.210.000x1-.206.031-.028-6.706.000x2.063.009.0546.966.000x3-.198.002-.868-81.025.000x4.347.0021.491161.639.000x5.048.004.07711.767.000x6.038.004.0619.549.000x7-.001.001-.005-1.103.270x8.004.001.0173.043.002a.因变量:y表3-1中显示了调整后的R2=0.96,表明自变量可以解释因变量96%的变化。同时由表3-2知,对回归方程的检验P值接近于0,也就是说回归方程显著。但是表3-3知,x7的P值为0.27,超过了给定的显著性水平α=0.05,它与因变量的关系不显著,考虑是否剔除这个变量。四、模型的检验4.1异方差检验检验异方差的方法繁多,本文采用了残差图分析法,作为判断数据是否存在异方差的依据。图4-1是8个指标与普通最小二乘得到的残差分析图。观察到,由于xi的取值并不均匀,因此有些图会出现点分布左密右稀的情况,但这并不代表数据存在异方差。需要注意的是点基本都是均匀无规则地分布在0e的两侧,所以从各幅残差分析图来看,各项指标并不存在异方差。图4-14.2t检验:在多元线性回归中,回归方程显著并不意味着每个变量对y的影响都显著,所以我们要从回归方程中剔除那些次要的、可有可无的变量,重新建立更为简单的回归方程,所以需要对每个变量进行显著性检验。由表3-3,我们可以先剔除x7,用y与其余7个变量作回归,计算结果表4-1。表4-1系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)31.717.257123.503.000x1-.204.031-.028-6.648.000x2.063.009.0546.920.000x3-.198.002-.867-81.173.000x4.346.0021.491161.666.000x5.048.004.07811.898.000x6.038.004.0619.506.000x8.003.001.0142.861.004a.因变量:y最终方程保留了7个变量,此时y与其余7个变量的关系显著性很高。4.2多重共线性的诊断在用OLS建模的分析中已经注意到回归方程高度相关,但有大部分系数通不过显著性检验的情况,这更加让人怀疑回归方程中存在的多重共线性问题。首先通过计算方差扩大因子VIF来判断哪些变量存在共线性:表4-2系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)31.717.257123.503.000x1-.204.031-.028-6.648.000.7141.400x2.063.009.0546.920.000.2104.765x3-.198.002-.867-81.173.000.1118.975x4.346.0021.491161.666.000.1506.684x5.048.004.07811.898.000.2973.366x6.038.004.0619.506.000.3073.252x8.003.001.0142.861.004.5011.995a.因变量:y用方差扩大因子法进行判断,表4-2中7个方差扩大因子都小于10,说明现有自变量间不具有共线性,可以作为最终回归模型。五、结论本文对上海市中学生身体结构与体能的线性关系,最终确定了线性模型:8654321003.0038.0048.0346.0198.0063.0204.0717.31ˆxxxxxxxy(5.1)标准化回归方程:*8*6*5*4*3*2*1*014.0061.0078.0491.1867.0054.0028.0ˆxxxxxxxy(5.2)回归模型说明在8个被选作回归的变量中,对中学生BMI指标的主要影响是学生的体重、肱三头肌、小腿的长短、年龄。标准化的回归方程则说明在七个变量中,对学生的BMI指数影响最大的是x4学生的体重,x5学生的肱三头肌次之,x3学生的身高影响最弱。六、参考文献[1]中国学生体质健康调研组.2000全国学生体质健康调研报告北京:高等学校出版社.2002.9—33.[2]全国学生体质健康调查组.科学技术成果报告——中国青少年儿童身体形态、机能与素质的研究.北京:科学文献出版社,1982.[3]刘永平袁运平邓万金,广东省高水平百米跑运动员体能结构特征模型的构建与应用,广州体育学院《广州体育学院学报》第3期2014年.
本文标题:生身体结构与体能的线性回归分析
链接地址:https://www.777doc.com/doc-2202196 .html