您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 项目二相关与回归分析案例及练习要求
项目二:相关与回归分析一、实验目的1、掌握Pearson简单相关分析方法,并根据相关系数判断两变量的相关程度。2、熟悉偏相关系数、Kendalltau-b和Spearman等级相关系数的计算方法,理解其区别与联系。3、掌握一元与多元回归分析方法,对回归模型估计和检验,并对结果进行分析。4、了解曲线回归分析方法。并对回归结果进行分析。二、实验内容和要求1、现有杭州市区1978-2014年的GDP、城镇居民年人均可支配收入和年人均消费支出的数据资料(example1.sav),如下:表5-1杭州市区GDP、年人均可支配收入、人均消费支出和CPI指数年份GDP(亿元)人均可支配收入(元)人均消费支出(元)定基CPI指数(%)197814.1995338301100.1197916.7206396365100.5198020.8220521491101.3198122.9243540513103.3198224.8297532532105.4198328.2171578535107.6198435.3781729679110.9198544.85741026908130.0198651.363911691072137.8198760.523412601118152.3198870.847415651515185.7198977.220817641615218.7199089.649619851685228.81991109.662821281894245.91992141.328725802296271.51993208.657135253183329.61994278.831452494559400.51995369.779463015559466.51996472.737772066095515.51997541.426578966766550.11998590.572684657235560.01999631.733590857424562.22000711.158696687790566.720011226.0891108968968563.920021404.2278117789215557.120031664.7332128989949.76554.320042036.27381456511212.78568.220052349.54591660113438577.820062748.312119026.8614471.74584.820073273.884221689.3614895.75605.220083813.983424103.5816719.10634.920094069.868726863.9318594.75626.020104740.77883003520219650.420115589.85743406522642681.620126213.24863751122800698.720136639.86093931024833716.120149201.16004463232165730.5数据来源:历年《杭州统计年鉴》和《2014年杭州市国民经济和社会发展统计公报》。要求:(1)求人均可支配收入、GDP、人均消费性支出与消费价格指数的双变量Pearson相关系数。相关性incomebcpiincomePearson相关性1.841**显著性(双侧).000N3737bcpiPearson相关性.841**1显著性(双侧).000N3737**.在.01水平(双侧)上显著相关。相关性gdpbcpigdpPearson相关性1.751**显著性(双侧).000N3737bcpiPearson相关性.751**1显著性(双侧).000N3737**.在.01水平(双侧)上显著相关。相关性payoutbcpipayoutPearson相关性1.873**显著性(双侧).000N3737bcpiPearson相关性.873**1显著性(双侧).000N3737**.在.01水平(双侧)上显著相关。(2)画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并给出方程的估计标准误差。模型汇总模型RR方调整R方标准估计的误差1.994a.989.988912.186a.预测变量:(常量),income。(3)求人均可支配收入倚GDP的直线回归方程。解释方程结果,并给出方程的估计标准误差。模型汇总模型RR方调整R方标准估计的误差1.985a.969.9692250.284a.预测变量:(常量),gdp。(4)求人均消费支出倚GDP的直线回归方程。解释方程结果,并给出方程的估计标准误差。模型汇总和参数估计值因变量:payout方程模型汇总参数估计值R方Fdf1df2Sig.常数b1线性.952698.757135.0002500.6903.553自变量为gdp。模型汇总模型RR方调整R方标准估计的误差1.976a.952.9511865.083a.预测变量:(常量),gdp。(5)若将GDP的单位改为万元,再做第3和第4题,观察单位变化对回归方程的影响。无影响(6)求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。(7)求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。(8)以定基居民消费价格指数为控制变量,对居民年人均可支配收入和消费支出进行偏相关分析。(9)计算居民年人均消费支出倚GDP,居民年人均可支配收入和消费价格指数的多元线性回归方程,确定最终模型并对估计结果进行解释。*(10)求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数(提示:一个变量Y对另一个变量X的弹性系数E定义为:E=Y的增长率÷X的增长率)。2、由表5-2所示的2013年浙江省各地级市GDP、第三产业就业人数数据资料(example2.sav),进行Kendalltau-b和Spearman等级相关分析。表5-22013年浙江省11地市经济数据单位:亿元/万人地区杭州宁波嘉兴湖州绍兴舟山GDP8343.527128.873147.661803.153967.29930.85三产就业人数288.93200.44101.8263.52114.0030.98地区温州金华衢州台州丽水--GDP4003.862958.781056.573153.34983.08--三产就业人数259.56113.5140.14147.1450.54--数据来源:《2014年浙江统计年鉴》。练习一、请打开数据文件exercise1.sav,该数据文件是有关浙江省人均可支配收入、服务业产值等基本信息资料。试根据文件中的数据资料,运用SPSS软件进行以下分析。1、Pearson线性相关分析:计算城镇居民人均可支配收入、地区生产总值、服务业产值和服务业就业人数的Pearson线性相关系数和sig值,并判断变量间的相关程度。表1双变量间的Pearson线性相关系数居民人均可支配收入地区生产总值服务业产值服务业就业人数居民人均可支配收入地区生产总值服务业产值服务业就业人数相关性城镇居民可支配收入地区生产总值服务业产值服务业城镇就业人数城镇居民可支配收入Pearson相关性1.995**.990**.996**显著性(双侧).000.000.000N30303030地区生产总值Pearson相关性.995**1.998**.997**显著性(双侧).000.000.000N30303030服务业产值Pearson相关性.990**.998**1.995**显著性(双侧).000.000.000N30303030服务业城镇就业人数Pearson相关性.996**.997**.995**1显著性(双侧).000.000.000N30303030**.在.01水平(双侧)上显著相关。相关程度判断:各项Sig0.01,表明在置信度99%下,相关系数在0.990到0.998之间,高度相关2、偏相关分析:以地区生产总值为控制变量,计算双变量的偏相关系数和sig值,并将计算结果填入下表。居民人均可支配收入服务业产值服务业就业人数居民人均可支配收入服务业产值服务业就业人数相关性控制变量城镇居民可支配收入服务业产值服务业城镇就业人数地区生产总值城镇居民可支配收入相关性1.000-.464.497显著性(双侧)..011.006df02727服务业产值相关性-.4641.000-.002显著性(双侧).011..993df27027服务业城镇就业人数相关性.497-.0021.000显著性(双侧).006.993.df272703、一元线性回归分析(1)建立居民人均可支配收入倚服务业产值的直线回归方程,将计算结果填入下表:表2居民人均可支配收入的一元线性回归回归系数T值P值常数项3205.9777.8140.000服务业产值2.05036.9120.000得到的线性回归方程:Y=3205.977+2.050X。(2)分析回归模型的判别系数及其含义:P值等于0,小于0.05,表明拟合效果显著。(3)回归方程的经济含义是,服务业产值每增加1亿元,_城镇居民可支配收入增加2.050元。_(4)回归方程整体显著性检验sig0.05,整体拟合效果显著。4、多元线性回归分析(1)建立以居民人均可支配收入为因变量,外商直接投资和服务业就业人数为自变量的直线回归方程,将计算结果填入下表:表3居民人均可支配收入的多元线性回归回归系数T值P值共线性统计量容差VIF常数项-5714.828-7.241.000服务业就业人数38.60710.826.000.04323.335外商直接投资34.2401.886.070.04323.335得到的线性回归方程:居民可支配收入=-5714.828+38.607*服务业就业人数+34.240*外商直接投资。(2)分析回归模型的判别系数及其含义:服务业就业人数的P值小于0.05,拟合效果显著,外商直接投资的P值大于0.05,效果不显著。(3)假设服务业就业人数不变时,外商直接投资每增加1万美元,_居民可支配收入增加34.240元。_(4)回归方程整体显著性检验表二中的sig小于0,。05,整体拟合效果显著。(5)回归方程的多重共线性诊断结果。(6)对模型实施逐步向后回归,请写出回归估计方程和主要诊断结果:。5、曲线回归分析(1)曲线回归的系数表表4居民人均可支配收入的二次回归回归系数标准误T值P值常数2037.735320.8326.351.000服务业产值2.824.12622.371.000服务业产值2-4.669E-5.000-6.389.000(2)以城镇人均可支配收入为因变量,服务业产值为自变量,估计的二次方程是居民人均可支配收入=2037.735+2.824*服务业产值+(-4.669E-005)*(服务业产值)^2(3)二次方程的判定系数R2=0.992,标准误为1097.108,而对比原线性回归时,R2=0.980,标准误差为1707.499,因此,二次方程比线性回归的拟合效果更好。(4)方差分析结果,F值为1670.577,显著性水平为0.000,方程具有统计显著性。6、等级相关分析请打开数据文件exercise2.sav,该数据文件是2013年浙江省各地市GDP和年末高校在校生人数的基本信息资料。试根据文件中的数据资料,运用SPSS软件进行以下分析。表52013年浙江省11地市的GDP和高校在校生人数单位:亿元/人地区杭州宁波嘉兴湖州绍兴舟山GDP8343.527128.873147.661803.153967.29930.85高校在校生人数47182014895463731266737753223301地区温州金华衢州台州丽水--GDP4003.862958.781056.573153.34983.08--高校在校生人数7915881281129373201839750--数据来源:《2014年浙江统计年鉴》。按GDP规模排
本文标题:项目二相关与回归分析案例及练习要求
链接地址:https://www.777doc.com/doc-1961859 .html