您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2013年重庆地区房价相关指标及走势的分析
应用概率统计课程论文题目:2013年重庆地区房价相关指标及走势的分析学号姓名贡献房价与数据关系分析,建立一元线性回归模型,相关系数的计算,回归方程的显著检验,房价的区间预测。数据需求分析,所需数据采集,理论资料查找。课程论文撰写,论文排版,流程图绘制,matlab绘图及其代码.成绩指导教师日期2013.6.201题目:2013年重庆地区房价相关指标及走势的分析摘要:数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位,对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;但实际问题中常常碰到分正态总体,而且是小样本的情况,因此对他的区间估计和假设检验是一个值得研究的问题。我们利用概率论与数理统计基本原理对小样本常用参数置信区间和假设检验问题,进行深入研究,提出了小样本常用参数置信区间与假设检验的解决方法。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程。此次课程设计,我们根据网上查到的相关资料,利用matlab绘制房价及其影响因素的关系图,对影响房价的指标进行分析,建立一元线性回归模型,利用最小二乘来估计回归系数,并进行显著性检验。用给定的人均消费水平或者城镇人口,用回归方程对房价进行区间预测。关键词:房价指标分析显著性检验区间预测2设计目的:利用概率论与数理统计的某些原理和相关的数据对房价的相关指标进行简单的分析与预测。问题背景:房地产既是我国国民经济的支柱产业,也是关系重大的民生问题。本文以重庆市经济适用房销售价格、重庆市人均消费等相关数据因素的关系模型对重庆市房价进行预测。数据来源:本文所需数据来自于互联网新闻及国家统计局网站。(2013年重庆地区房价相关指标及走势的分析流程图)初步分析理论准备所需数据查找相关的含义一元线性回归模型回归系数的最小二乘估计回归方程的显著检验相关指标分析Matlab绘图分析一元线性回归模型建立进行回归方程的显著检验房价区间预测总结31.理论准备:(1)相关的含义:相关是研究因变量(响应变量)之间相互关系的统计分析方法,它研究因变量(响应变量)之间相互关系的密切程度。我们以横轴代表自变量X,纵轴代表依变量Y,可以将一群观察事物的两种关系在坐标图上以P(X,Y)的方法定位,作出一群点图,便可在体上看出两者的关系,例如图1-1图(A)表示房价(依变量)随自变量增长而增高,其图像性质称正相关(positivecorrelation);图(B)的依变量随自变量的增加而减少,称为负相关(negativecorrelation);而图(C)二者呈现很乱的图形没有任何的规律没有,则称无相关。ABC(2)一元线性回归模型:一般地,当因变量(响应变量)Y与自变量x之间有线性关系时,可设:xY10(1)4),,0(~2N其中10,为待定系数。1为直线的斜率,它表示x每增加一个单位E(y)的增量。设),(,),,(),,(2211nnYxYxYx是取自总体),(Yx的一组样本,而),(,),,(),,(2211nnyxyxyx是该样本的观察值,在样本和它的观察值中的nxxx,,,21是取定的不完全相同的数值,而样本中的nYYY,,,21在试验前为因变量(响应变量),在试验或观测后是具体的数值,一次抽样(抽样的区间尽量大一点,要求观察独立进行)的结果可以取得n对数据),(,),,(),,(2211nnyxyxyx,则有:iiixy10,ni,,2,1(2)其中n,,,21相互独立。在线性模型中,由假设误差服从正态分布知:),(~210,xNYxYE10)((3)回归分析就是根据样本观察值寻求10,的估计10ˆ,ˆ.对于给定x值,取:xY10ˆˆˆ(4)作为xYE10)(的估计,方程(4)称为Y关于x的线性回归方程或经验回归函数,其图像称为回归直线,1ˆ称为回归系数。(3)回归系数的最小二乘估计:对样本的一组观察值),,(11yx),,(22yx…,),,(nnyx对每个ix,由线性回归方程(4)可以确定一回归值iixy10ˆˆˆ,这个回归值iyˆ与实际观察值iy之差iiiixyyy10ˆˆˆ刻画了iy与回归直线xy10ˆˆˆ的偏离度(残差)。一个自然的想法就是:对所有ix,若iy与iyˆ的偏离越小,则认为直线与所有试验点拟和得越好.令:5201011(,)()niiiQyx(5)上式表示所有观察值iy与回归直线iyˆ的偏离平方和,刻划了所有观察值与回归直线的偏离度。所谓最小二乘法就是寻求10与的估计10ˆˆ,,使).,(min)ˆ,ˆ(1010QQ利用微分的方法,求Q关于10,的偏导数,并令其为零,得正规方程组:niiiiniiixxyQxyQ110111000)(20)(2(6)整理得:iniiniiniiniiniiyxxxyxn1112011110(7)称此为正规方程组,解正规方程组得:niiniiixnxxynyxxy1221110ˆˆˆ(8)其中niixnx11,niiyny11,若记:yxnyxyyxxLniiiiniidefxy11)()(,niiniidefxxxnxxxL12212)(,则:xxxyLLxy110ˆˆˆˆ(9)因此(5)或(6)叫做10,的最小二乘估计,记为:LSE.6(4)回归方程的显著检验从回归系数的LSE可以看出,对任意给出的n对数据(,)iixy,都可以求出10,,从而给出回归方程xY10ˆˆˆ,但是这样给出的回归方程不一定有意义。我们知道建立回归方程的目的是寻找y的均值随x变化的规律,即找出回归方程xYE10)(。如果10,那么不管x如何变化,E(y)不随x的变化做线性变化,那么这是求得的一元线性回归方程就没有意义,称回归方程不显著。如果10。那么当x变化时,E(y)随x的变化做线性变化,那么这是求得的回归方程就有意义,称回归方程是显著的。综上,对回归方程是否有意义作判断就是要作如下的显著性检验:0111:0:0HvsH拒绝0H表示回归方程是显著的。在一元线性回归中有三种等价的检验方法,即:F检验,t检验和相关系数检验。这里简单介绍一下t检验,后面将具体做F检验和相关系数检验。由于:22112ˆ(,),(2)exxSNXnl,且与1相互独立,因此0H为真时有:1ˆ(2)ˆ/xxttnl因此,若11/2ˆ(2)ˆ/xxttnl,则称在显著性水平a下回归方程是显著的,反之不显著。72.数据准备:表1、2013年相关数据3.2013年重庆房价相关指标分析2013年全年成交均价7257元/㎡,同比2012年的6750元/㎡小幅上涨7.5%。总体来说价格在稳定上涨。从全年来看,均价在12月份突破8字头达到历史峰值,全年有4个月低于均价。接下来讨论房价与一些指标间的关系。月份(月)市场供应面积(万平方米)人均消费(元)城镇人口(万人)房价(元)2013.018612181868.1563952013.023212351795.1566532013.0310612561736.2469602013.0412212731786.4572702013.058612851758.3473302013.068913271786.4874702013.077112551714.6569602013.088712981758.6473502013.0914213351798.2974602013.1012313141795.1472102013.119913891868.0277482013.129314411895.1580058图1、房价与市场供应的关系(代码见附录)由房价与市场供应的关系图来看,很明显能够看出折线呈现近乎螺旋状的曲线,所以两者没有特殊的什么关系,房地产商品的供给需求分析。虽然和其他商品一样,随着房地产价格的上涨,房地产商品的供给会增加,但房地产商品和房地产行业的特点决定了房地产建设(房地产供给)需要大量的资金,建设周期长,使得房地产供给相对于房地产需求具有一定的时滞。同时,由于可供房地产建设的土地供给十分有限,房地产建设不可能无限增加;而且建设房地产商品需要大量资金和有严格的资格要求,厂商的市场进入障碍很高,这些因素使得房地产供给曲线比较陡峭。所以不能以市场供应来衡量房价。同理绘出房价与人均消费的关系图,得到如下的图形:9图2、房价与人均消费的关系(代码见附录)由房价与人均消费的关系图来看,可以得到:从散点图发现这12个点基本上位于一条直线附近,即是说房价与人均消费呈现近似的线性关系,随着人均消费水平的提高房价随之进行一定程度的上涨,设y轴方向上的误差为,因此这个相关关系可以表示为一元线性回归的数据结构式:xY10(10)通过前面的理论准备,可直接通过最小二乘估计回归系数01,。121=15626iiX121y86811ii122120393420iiX1ˆ/6.4833xyxxll121113339092iiixy1302.2ix7234.3iy01ˆˆ1208.1yx296700xyl457640xxl表2、回归系数计算表10由此可以得到回归方程:ˆ6.48331208.1yx(11)虽然我们得到了回归方程,但是这样的回归方程不一定有意义,所以要通过显著性检验找出回归方程:01yEx()=,如果10,那么不管x如何变化,E(y)都不会随着x的变化而线性变化,那么求得的一元线性回归方程就没有意义,则称回归方程不显著,反之回归方程显著。对回归方程是否有意义作判断就是要作如下的显著性检验:0111:0:0HvsH由表2可得数据总的波动用总偏差平方和来表示:2()TiyySyyl(12)每一个x的观测值处的回归值不同,其波动用回归平方和来表示:2ˆ()RiSyy(13)y的观测值与回归值之间的还有差距,这可用残差平方和表示:2ˆ()eiiSyy(14)因此可以采用F作为统计量:/(2)ReSFSn(15)其中2181600TyySl,21ˆ1923606.4RxxSl,257993.6eTRSSS,所以:F=74.5602.若取0.01,所以对于显著性水平0.01,的拒绝域为;1(1,2)FFN,0.99(1,10)10.0F.由于74.560210.0,即11在显著性水平0.01下回归方程是显著的。同理绘出房价与城镇人口数量的关系图,得到如下的图形,具体源程序见附录(3).图3、房价与城镇人口变化数量(代码见附录)分析从表中可以看出:城镇人口数量的增长与房地产市场发展更契合,从重庆城镇化进程的实际变化来看,自2002年以来,常住人口总量并未发生明显变化,而主要是城镇人口数量的增长推动了城镇化率的提高。2002年,全市常住人口2814.83万人,其中城镇人口1059.16万人,城镇化率为37.6%,到2012年,全市常住人口2945.00万人,仅较2002年增长4.6%,年均增长0.5%,而城镇人口数量达到1678.12万人,较2002年增长58.4%,年均增长4.7%。从城镇化进程与房地产市场的关系来看,城镇化率和城镇人口数量均与房地产业增加值存在明显的正
本文标题:2013年重庆地区房价相关指标及走势的分析
链接地址:https://www.777doc.com/doc-2988488 .html