您好,欢迎访问三七文档
探究全国单位房价的价格和城镇居民收入之间的关系一、选题的意义和原因:鉴于全国房价一直在涨,对于年轻的工作族来说,房价是一个很大的影响因素。所以想了解关于单位房价到底有什么因素在影响它,初步认为有城镇居民的收入水平占重要地位,但是也考虑到居民储蓄额度变化和房屋建设的成本以及开发商的土地购置费用等因素有影响。初步判断均认为这个重要因素对于房价的影响都是正相关的。至于是否还有影响较大的遗漏变量偏差,我们会在接下来的检验中详细的叙述。二、数据的收集和整理数据来源于中经网和国家统计局插入Excel三、数据描述性分析认为城镇居民收入是影响单位房价的重要因素:被解释变量Y(单位房价)和解释变量x1(城镇居民收入水平)样本数量均值标准差最大值最小值偏度峰度6021524.8710538.3148879.336941.40.7252.78四、回归结果分析和检验一元线性回归的检验:选取模型:Y=a+ßX+UiY:房价:单位房价X:选取居民收入水平现在对它进行一元线性回归的假设:研究单位房价和城镇居民收入水平之间的关系:回归后得到的数据:结果分析:分析:由单位房价y和城镇居民收入X的回归可以知道:Y=-2174.967+0.41*XR^2=0.82SER=2016.2(424.13)(0.026)t(ß)=15.86P值=0.000(双边)ß的95%的双边置信区间是(0.36,0.46);a的95%的置信区间是(-3023.94,-1326.0)假设H:ß=0H1:ß0或ß0由于P值小于0.05且F值为251.44所以拒绝原假设并且可以得出结论居民的收入水平对北京市房价每平方米有着重大的影响虽然R^2已经足够大,但是考虑到居民的储蓄额和开发商购买土地和投资额的影响,可能有遗漏变差,所以考虑加入这些遗漏变量。采用多元回归模型:Y=a+ß1X1+ß2X2+ß3X3+ß4X4+ui(1)由于一个自变量对于解释一个因变量可能有遗漏变量误差,仅考虑房价与居民收入的关系来说,是有遗漏变量偏差的。现在考虑加入居民储蓄额和土地的建设成本以及投资额等,并进行相关的假设检验以判断其相关性。(2)加入多变量之后的结果是:分析结果:Y=-2333.114+0.39X1-0.17X2-0.08X3+2.18X4R^2=0.843SER=1950.4(444.04)(0.089)(10.90)(0.56)(0.95)t(ß1=0)=4.41t(ß2=0)=-0.15t(ß3=0)=-0.14t(ß4=0)=2.29t(ß0=0)=-5.25ß1的P值为0.00;ß2的p值是0.880.05接受原假设;ß3的p值是0.889同理接受原假设,影响不显著;ß4的p值为0.0260.05拒绝原假设,故其影响较为显著。由T检验知道,ß1在5%的显著水平下显著,而ß2在5%的水平下不显著,不能拒绝原假设ß2=0;同时ß3在5%的显著水平下不显著,ß4在5%的显著水平下显著,拒绝原假设ß4=0;所以总结一下是:对于单位房价的影响,居民收入和土地购置费用对于单位房价的影响较为显著。ß0的95%的置信区间为(-322.98,-1443.25)ß1的95%的置信区间为(0.21,0.57)ß2的95%的置信区间为(-0.23,0.20)ß3的95%的置信区间为(-1.20,1.04)ß4的95%的置信区间为(0.27,4.08)修正后的R^2及SER为:R^2=0.843SER=1950.4得出的结论是:在5%的置信区间中,居民储蓄和开发商的投资额对单位房价的影响没有那么显著,相反居民收入和土地的建设成本影响显著。进一步检验采用Y单位房价和居民收入以及土地的建设成本这l两个显著性因素影响的模型:Y=a+ß1X1+ß4X4+ui进行线性回归和多重共线性分析:结果分析:Y=-2379.72+0.38X1+2.19X2(406.1)(0.022)(0.94)ß1的t值是17.19,P值是0.000;ß2的t值是2.34;P值是0.0230.05所以拒绝原假设ß2=0;R^2=0.844SER=1916.7F值为192.88ß1的95%的置信区间是(0.33,0.42)ß4的95%的置信区间是(0.32,4.07)这个模型较之前的多元模型有稍微的改变,提高些微的R^2现在进行多重共线性的检验:(1)先假设检验两个系数是否相等:假设:H0:ß1=ß4H1:ß1≠ß4Yi=ß0+ß1X1i+ß2X2i+ui模型转变为Yi=ß0+(ß1-ß2)X1i+ß2(X1i+X2i)+ui重新整理数据:转变为ß1-ß2=0的检验令ß1-ß2=h1假设转为H0:h1=0H1:h1≠0构建t统计量,t=h1*-0/SE(h1*)做回归得到:T检验结果为:t=-1.82-0/0.83=-2.195%的显著水平是1.96故可以在5%的显著水平下拒绝原假设即h1≠0意味着ß1≠ß2(2)检验两个系数是否同时为0H0:ß1=ß2=0H1:ß1ß2不同时为0(3)VIF检验:带入调整后的数据:得到结果如下:结果分析:容忍度的倒数,VIF越大,显示共线性越严重。经验判断方法表明:当0<VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性。从Stata的结果可以看出ß1和ß4不存在多重共线性。五、面板数据的回归分析(1)时间的固定效应分析:结果分析:模型:Yit=ß0+ß1Xit+ß3St+uiYit=-3038.146+0.58XitR^2=0.92SER=1515.9(752.44)(0.031)ß1的95%的置信区间为(0.51,0.65)且P值为0,t检验值为18.59拒绝ß1为0的假设。y03这一年的p值大于0.05,故不显著;但是其他年份的P值都小于0.05.时间效应较为显著。(2)个体(收入)的固定效应分析:分析:模型:Yit=ß0+ß1Xit+ß2Zi+uiYit=2332.34+0.34XitR^2=0.92SER=1419.5(710.80)(0.021)由各省的P值都为0以及其t检验的值来说,说明个体的固定效应是有一定的影响的。(3)既有时间又有个体效应的分析:时间和个体固定效应的分析:Yit=ß1Xit+ai+bt+uiYit=0.72Xit+provincefixedeffect+timefixedeffect(0.072)State2and3的P值分别为0.891和0.657偏大,其个体效应不显著。而时间效应的各年的P值都很小,时间效应显著。六、结论:总结比较表格如下:说明:模型(1):Y=-2174.967+0.41*XR^2=0.82SER=2016.2(424.13)(0.026)模型(2):Y=-2333.114+0.39X1-0.17X2-0.08X3+2.18X4R^2=0.843SER=1950.4(444.04)(0.089)(10.90)(0.56)(0.95)模型(3):Y=-2379.72+0.38X1+2.19X4R^2=0.844SER=1916.7F值为192.88(406.1)(0.022)(0.94)模型(4):Yit=-3038.146+0.58XitR^2=0.92SER=1515.9(752.44)(0.031)模型(5):Yit=2332.34+0.34XitR^2=0.92SER=1419.5(710.80)(0.021)模型(6):Yit=0.72Xit+provincefixedeffect+timefixedeffect(0.072)(1)(2)(3)(4)(5)(6)Income0.41*(0.026)0.39*(0.089)0.38*(0.022)0.58*(0.031)0.34*(0.021)0.72*(0.072)Savings-0.17(10.90)0.595(0.044)Fee(土地购置)-0.08(0.56)3.89(0.46)Investment(投资额)2.18*(0.95)2.19*(0.94)7.64(1.28)Years2002--20132002—20132002--20132002-20132002-20132002-2013StateeffectsNoNONoNoYesYesTimeeffectsNoNoNoYesNoYesR^20.820.8430.8440.920.920.90ß1的P值0.0000.0000.0000.0000.0000.000模型选取√
本文标题:研究房价的影响因素
链接地址:https://www.777doc.com/doc-6353415 .html