您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 某类研究学者的能力与相关因素分析
数学与计算科学学院实验报告实验项目名称某类研究学者的年薪与相关因素分析所属课程名称数学实验实验类型综合实验实验日期班级学号姓名成绩1一、实验概述:【实验目的】1.研究某类研究学者的年薪与相关因素分析问题;2.运用回归模型来解决实际问题;3.提高我们的编程、分析问题、建立模型的能力;4.运用不同的方法检验模型,并进行残差分析。【实验原理】1.利用回归模型求解实际问题;2.MATLAB绘图方法;3.模型检验原理;4.残差分析原理;5.最优回归方程的选取原理。【实验环境】Windows7Word2007MATLAB7.0二、实验内容:【实验方案】1、问题分析对于工薪阶层的人群关心年薪与哪些因素有关,以此可制订出他们自己的奋斗目标。某科学基金会希望估计从事某科学研究者的年薪Y与他们的研究成果(论文、著作等)的质量指标X1、从事研究工作的时间X2、能成功获得资助的指标X3之间的关系,为此按一定的试验设计方法调查了24位研究者,得到如下数据:i123456789101112xi13.55.35.15.84.26.06.85.53.17.24.54.9Xi29201833311325305472511Xi36.16.47.46.77.55.96.04.05.88.35.06.4yi33.240.338.746.841.437.539.040.730.152.938.231.8i131415161718192021222324xi18.06.56.63.76.27.04.04.55.95.64.83.9Xi223353921740352333273415Xi37.67.05.04.45.57.06.03.54.94.38.05.0yi43.344.142.533.634.248.038.035.940.436.845.235.1试建立Y和X1,X2,X3之间关系的数学模型,并对该模型进行各种统计分析,能得到一个什么样的结论?2、符号说明1)设从事某科学研究者的年薪为Y;2)研究成果(论文、著作等)的质量指标为X1;3)从事研究工作的时间为X2;24)能成功获得资助的标准为X3。3、问题假设1)从事某科学研究者的年薪有三项指标:研究成果(论文、著作等)的质量指标X1、从事研究工作的时间X2和能成功获得资助的标准X3,它们构成模型的回归自变量;2)因变量是某科学研究者的年薪Y;3)自变量X1,X2,X3与因变量Y之间具有显著的线性关系,且考虑(X1,X2,X3)固定取几组值;4)实际观测值与估计值之间的偏差均值为0,方差为2,并且实际观测值的统计规律为正态分布。4、模型建立及求解回归模型01122332~(0,)YxxxN利用MATLAB软件求解得b=17.83451.09470.32011.3023bint=13.629522.03950.40251.78700.24220.39810.67531.9292r=0.70901.9265-0.11663.3268-0.72321.2521-2.09542.03173-0.28191.32880.9248-3.2545-0.5524-1.1704-1.5559-0.73760.17480.5816-3.23131.2184-0.8386-1.40810.80851.6829rint=-2.68674.1048-1.62005.4729-3.63563.40240.05146.6022-4.05422.6079-2.18644.6907-5.50511.3144-1.24965.3130-3.57033.0066-1.79414.4518-2.66484.5144-6.4195-0.0895-3.65492.5501-4.71482.3739-4.88261.7708-4.19972.7246-3.05753.4071-2.89714.0602-6.2401-0.2225-2.09604.5328-4.36432.6871-4.85432.0381-2.49494.1119-1.78805.15384stats=0.909466.88390.00003.11521)回归模型中参数20123,,,,的估计值由以上输出结果知,回归模型中的参数分别是0123ˆˆˆˆ17.8345,1.0947,0.3201,1.3023,2ˆ3.1152,回归方程为123ˆ17.83451.09470.32011.3023yxxx2)模型检验需要检验H0:01230a.F检验法:由输出结果可知,F值从stats中读取,F=66.8839,根据F检验准则知,拒绝H0,即认为X1,X2,X3与Y的线性关系显著。b.相关系数r的评价:stats中的第一个数据就是相关系数r的平方,即r^2=0.9094,则|r|=0.9536,即回归自变量与因变量具有较强的线性相关性。c.p值检验:stats中的第三个数据就是p值,即p=0.0000,同样说明回归自变量X1,X2,X3与因变量Y的线性关系显著。以上使用的三种统计推断方法推断的结果是一致的,都认为自变量X1,X2,X3与因变量Y的线性关系显著。说明以上模型假设和回归模型能够基本反映X1,X2,X3与Y的关系。3)残差分析a.残差向量正态性的图形检验使用MATLAB程序进行线性回归分析,其r,rint分别代表残差向量和残差向量的区间估计。利用残差向量r和MATLAB语句,得到图形(见实验过程)理论上可以证明,若ei=ri(i=1,2,...,24)是来自正态分布总体的样本,则点“+”呈现的三点应在一条直线上。从图形可知,误差的正态型假设是合理的。b.残差图分析利用残差向量r,残差的区间估计值rint和MALAB语句,得到图形(见实验过程)可见图中所示的三个奇异点,删除奇异点后,重新建立回归方程,MATLAB输出结果为:b=18.89720.88310.31611.3586stats=0.9511110.10690.00001.6481即回归模型中的参数分别是:50123ˆˆˆˆ18.8972,0.8831,0.3161,1.3586,2ˆ110.1069,回归方程为:12318.89720.88310.31611.3586.yxxx(时序残差图见实验过程)4)最优回归方程的选取:主要通过筛选自变量,得到一个最佳的回归方程,常用的方法是逐步回归法。在MATLAB中执行程序语句,得到如图结果(见实验过程)图中显示了回归及方差分析的各种信息,有回归方程的系数、系数的区间估计值、均方误差、负相关系数平方、F统计量值和p值。通过对某类研究学者的年薪与相关因素分析的关系模型逐步回归分析知,最佳的回归方程是所有自变量X1,X2,X3都在回归模型中,并且是线性函数关系,即前面计算得到的回归方程就是最佳的回归方程。【实验过程】(实验步骤、记录、数据、分析)6由图可知无奇异点,建立的线性回归模型比较适合与样本数据。7【实验结论】(结果)可见某类研究学者的年薪Y与研究成果(论文、著作等)的质量指标X1、从事研究工作的时间X2和能成功获得资助的标准X3线性相关。并且,当发表的研究成果的质量指标和成功获得资助的标准越高时,他的年薪也越高,这与实际情况相符。【实验小结】(收获体会)通过此次试验,我了解了更多关于回归模型方面的知识,并且可以通过MATLAB软件建立回归模型求出回归方程,并通过不同的方法对该模型进行分析优化模型,而且得到了其残差、时序残差图等。这不仅对于我来说是一个很好的锻炼机会,提高编程能力解决实际问题,而且对于以后的工作也有一定的辅助作用。三、指导教师评语及成绩:评语评语等级优良中及格不及格1.实验报告按时完成,字迹清楚,文字叙述流畅,逻辑性强2.实验方案设计合理3.实验过程(实验步骤详细,记录完整,数据合理,分析透彻)4实验结论正确.8成绩:指导教师签名:批阅日期:附录1:源程序1.回归模型求解:clearclcA=[3.55.35.15.84.26.06.85.53.17.24.54.98.06.56.63.76.27.04.04.55.95.64.83.9;920183331132530547251123353921740352333273415;6.16.47.46.77.55.96.04.05.88.35.06.47.67.05.04.45.57.06.03.54.94.38.05.0];a=ones(24,1);X=[a,A'];Y=[33.240.338.746.841.437.539.040.730.152.938.231.843.344.142.533.634.248.038.035.940.436.845.235.1]';Alpha=0.05;[b,bint,r,rint,stats]=regress(Y,X,Alpha)2.残差向量的正态性检验:clearclcA=[3.55.35.15.84.26.06.85.53.17.24.54.98.06.56.63.76.27.04.04.55.95.64.83.9;920183331132530547251123353921740352333273415;6.16.47.46.77.55.96.04.05.88.35.06.47.67.05.04.45.57.06.03.54.94.38.05.0];a=ones(24,1);X=[a,A'];Y=[33.240.338.746.841.437.539.040.730.152.938.231.843.344.142.533.634.248.038.035.940.436.845.235.1]';Alpha=0.05;[b,bint,r,rint,stats]=regress(Y,X,Alpha)normplot(r)3.时序残差图:clearclcA=[3.55.35.15.84.26.06.85.53.17.24.54.98.06.56.63.76.27.04.04.55.95.64.83.9;920183331132530547251123353921740352333273415;6.16.47.46.77.55.96.04.05.88.35.06.47.67.05.04.45.57.06.03.54.94.38.05.0];a=ones(24,1);9X=[a,A'];Y=[33.240.338.746.841.437.539.040.730.152.938.231.843.344.142.533.634.248.038.035.940.436.845.235.1]';Alpha=0.05;[b,bint,r,rint,stats]=regress(Y,X,Alpha)rcoplot(r,rint)4.修正后的时序残差图:clearclcA=[3.55.35.14.26.06.85.53.17.24.58.06.56.63.76.27.04.55.95.64.83.9;920183113253054725233539217402333273415;6.16.47.47.55.96.04.05.88.35.07.67.05.04.45.57.03.54.94.38.05.0];a=ones(21,1);X=[a,A'];Y=[33.240.338.741.437.539.040.730.152.938.243.344.142.533.634.248.035.940.436.845.235.1]';Alpha=0.05;[b,bint,r,rint,stats]=regress(Y,X,Alpha)rcoplot(r,rint)xlabel('数据');ylabel('概率');title('时序残差图');5.最优回归方程的选取:clearclcA=[3.55.35.15.84.26.06.85.53.17.24.54.98.06.56.63.7
本文标题:某类研究学者的能力与相关因素分析
链接地址:https://www.777doc.com/doc-2291445 .html