您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 应用回归分析期中中作业
大学生在校成绩影响因素调查报告摘要:为了了解大学生考研情况受何种因素影响,重点以南京师范大学为例进行调研。调研发现其中大学生在校成绩成为其中重要影响因素。为了更进一步的分析出其中因素影响状况,特将大学生在校成绩作为研究对象,重点从获奖情况,经济支持和家庭经济状况对此问题进行回归分析,希望从中可以找出一些对于课题有价值的数据。关键词:大学生在校成绩支出收入专业满意度回归分析数据来源:南京师范大学数学科学学院2014年暑期社会实践团队——大学生考因素影响暑期社会实践团队调查统计数据。此次数据共调查247,从中随机抽取25作为我们的研究数据,共涉及4个变量,即获得校级奖项次数,在校期间月支出,家庭人均年收入,和对其专业满意度(1-100)。序号在校期间平均成绩y分获得校级奖项次数x1次在校期间月支出x2元家庭人均年收入x3元专业满意度x41895780150007827729502800067367310302000056489298015000775936120030000846731107024000357680110023000678874139040000789783105030000661071199025000561164314004000043129067509000691355017004800032148447801400091157829602900075168531400400007917683870130004418736142034000651982311003000060209169502100080218781120270009522761130034000342390412802700097248528902000065257848701200071一、具体分析过程:运用最小二乘法建立y与x1,x2,x3,x4的回归方程,运用spss如图相关性yx1x2x3x4yPearson相关性1.479**-.207-.184.758**显著性(双侧).000.062.098.000N8282828282x1Pearson相关性.479**1.029-.070.579**显著性(双侧).000.793.534.000N8282828282x2Pearson相关性-.207.0291.920**-.022显著性(双侧).062.793.000.845N8282828282x3Pearson相关性-.184-.070.920**1-.032显著性(双侧).098.534.000.777N8282828282x4Pearson相关性.758**.579**-.022-.0321显著性(双侧).000.000.845.777N8282828282**.在.01水平(双侧)上显著相关。有图表可知,根据相关系数和p值,这说明y与自变量线性相关,用y与自变量作多元线性回归是比较合适的。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.816a.666.5996.272142.287a.预测变量:(常量),专业满意度x4,家庭人均年收入x3元,获得校级奖项次数x1次,在校期间月支出x2元。b.因变量:在校期间平均成绩y分Anovab模型平方和df均方FSig.1回归1567.8444391.9619.963.000a残差786.7962039.340总计2354.64024a.预测变量:(常量),专业满意度x4,家庭人均年收入x3元,获得校级奖项次数x1次,在校期间月支出x2元。b.因变量:在校期间平均成绩y分系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)63.91810.3076.201.00042.41885.418获得校级奖项次数x1次1.073.816.2221.315.203-.6282.774在校期间月支出x2元-.012.013-.291-.890.384-.040.016家庭人均年收入x3元.000.000.132.403.691-.001.001专业满意度x4.322.093.5953.480.002.129.515a.因变量:在校期间平均成绩y分回归方程为:y=63.918+1.073x1-0.012x2+0*x3+0.322x4残差图为从残差图中可以看出其主要集中在第1,3象限,说明随机误差存在一阶正自相关,DW=2.287。因为2DW4,所以存在负自相关性。置信水平为95%的置信区间:由回归系数表可以看出:β1的置信区间为[-0.628,2.744]β2的置信区间为[-0.040,0.16]β3的置信区间为[-0.001,0.001]β4的置信区间为[0.129,0.515]复相关系数R=0.816,决定系数R2=0.66,所以由决定系数看回归方程较为显著。方差分析表,F=9.963,P值=0.00,表明回归方程高度显著,说明x1,x2,x3,x4,整体上对y有高度显著的线性影响。异方差性检验相关系数yx1x2x3x4Spearman的rhoy相关系数1.000.630**-.263-.224.811**Sig.(双侧)..001.204.282.000N2525252525x1相关系数.630**1.000-.142-.180.646**Sig.(双侧).001..499.390.000N2525252525x2相关系数-.263-.1421.000.884**-.187Sig.(双侧).204.499..000.372N2525252525x3相关系数-.224-.180.884**1.000-.195Sig.(双侧).282.390.000..351N2525252525x4相关系数.811**.646**-.187-.1951.000Sig.(双侧).000.000.372.351.N2525252525**.在置信度(双测)为0.01时,相关性是显著的。由此可知其不存在异方差性。异常值检验残差e标准化残差学生化残差删除学生化残差库克距离杠杆值1.97.37.38.38.00.02518-4.26-.80-.84-.84.01.06994-8.43-1.59-1.62-1.64.02.027786.111.151.231.23.04.104526.541.231.251.25.01.013586.291.191.251.25.03.081404.66.88.90.90.01.03682-2.31-.44-.45-.44.00.03667-4.78-.90-.93-.93.01.04761-4.59-.87-.91-.91.02.081356.391.201.241.25.02.04911-7.39-1.39-1.44-1.45.03.04983-6.29-1.19-1.25-1.25.03.084672.83.53.55.55.00.05217-3.97-.75-.78-.78.01.06993-4.07-.77-.80-.80.01.063164.58.86.88.88.01.024574.12.78.79.79.00.01479-5.05-.95-.98-.98.01.0485511.202.112.242.30.12.09554.87.17.18.18.00.117774.83.91.93.93.01.03105-4.43-.84-.86-.86.01.03545由上表知删除学生化残差中绝对值最大的为2.243,所以该组数中没有异常值。二、分析结果总结通过从247个数据中随机抽取的25个数据做多元线性回归分析。得到其回归方程为:y=63.918+1.073x1-0.012x2+0.322x4。并且从决定系数上看回归方程较为显著,且x1,x2,x4,整体上对y有高度显著的线性影响,而x3对其影响不大。从统计数据中来看,不存在异方差性,且数据中无异常值的出现。对于回归方程:y=63.918+1.073x1-0.012x2+0.322x4。其中固定x4,x2,x3。每当x1增加1时,分数增加1.073分。固定x1,x2,x3,每当x4增加1时,分数增加0.322。且从回归方程中看,x3对y的影响是不存在的,X2对y是负影响的。所以综合x1,x2,x3,x4.来看。Y受x1和x4的影响较大。
本文标题:应用回归分析期中中作业
链接地址:https://www.777doc.com/doc-2458225 .html