您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 苏州市客运量回归分析报告
苏州市客运量回归分析报告运输1101陈强3110405027一、苏州城市简介:苏州,中国华东地区的特大城市之一,全国首批历史文化名城,。地处长江三角洲,位于江苏省东南部,古称吴郡。苏州古城始建于公元前514年的吴王阖闾时期,于隋开皇九年(589年)更名为苏州。苏州历史悠久,人文荟萃,以“上有天堂,下有苏杭”而驰声海内。苏州是长江三角洲经济圈北翼重要的副中心城市之一,苏州作为一座现代化程度较高的城市,是江苏省重要的经济、对外贸易、工商业中心和重要的文化、艺术、教育和交通枢纽。二、Stata简介:Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件,采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。Stata具有强大的统计功能,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。Stata的作图模块,主要提供如下八种基本图形的制作:直方图(histogram),条形图(bar),百分条图(oneway),百分圆图(pie),散点图(twoway),散点图矩阵(matrix),星形图(star),分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。Stata是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。除此之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过StataJournal获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。软件logo三、数据分析(一)变量选取和数据列表:图3-1:苏州市2001-2011年统计数据客运量(万人次)生产总值(亿元)工业生产总值(亿元)消费品零售总额(亿元)进出口总额(亿美元)总人口(户籍人口/万人)人均可支配收入(市民/元)2001195081760.283980.75391.54236.62580.53105152002210002080.375142.01451.62363.9583.86106172003229002801.566855.15526.05656.63590.971236120042530034509560.13625.11032.01598.85144512005307074138.2112291.48917.651425.4607.31162762006351864900.6315528.671070.111766.86616.08185322007402005850.1119060.131250.052117.96624.43212602008454007078.09221031551.452285.26629.75238672009393387740.223704.562026.842014.46633.29263202010452649228.9128483.692402.022740.76637.662921920116406310716.9933347.372829.583008.63642.3333243变量年份(二)建立模型1:软件输出结果:图3.2:stata多元线性回归分析结果1.模型1:多元线性回归模型公式(三)模型参数解释:1.总体平方和:TSS为总体平方和(TotalSumofSquares),反映样本观测值总体离差的大小;公式:2.残差平方和:RSS为残差平方和(ResidualSumofSquares),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。公式:3.解释平方和:ESS为回归平方和(ExplainedSumofSquares),反映由模型中解释变量所解释的那部分离差的大小;公式:4.F检验值:5.F检验p值:判定系数(可决系数):回归平方和(ESS)在总变差(TSS)中所占的比重称为可决系数判定系数不仅反映了模型拟合程度的优劣,而且有直观的经济含义:它定量地描述了y的变化中可以用回归模型来说明的部分,即在被解释变量的变动中,由模型中解释变量所引起的比例。用可决系数进行拟合优度检验;公式222ˆyyyyRii6.调整判定系数:7.均方根误差:标准差是方差的算术平方根,标准差能反映一个数据集的离散程度;8.变量系数(回归系数):回归系数regressioncoefficient在回归方程中表示自变量x对因变量y影响大小的参数9.变量系数标准误(回归系数标准误):用来比较各自变量对因变量的影响;10.t检验值:11.t检验p值:p值是根据既定的样本数据所计算的统计量,拒绝原假设的最小显著性水平。统计软件中(EViews,SPSS,SAS)通常都给出了检验的p值。方法:将给定的的显著性水平ɑ与p值比较:若pɑ,则在显著性水平ɑ下拒绝原假设H0,即认为X对Y有显著影响。若p=ɑ,则在显著性水平ɑ下接受原假设H0,即认为X对Y没有显著影响。规则:当pɑ时,p值越小,越能拒绝原假设H0。置信区间:置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。(四)建立模型2:图4.1:stata简单线性回归模型数据图4.2:散点图图4.3:拟合曲线四、结论:由模型1可知,多元线性回归模型的拟合度R-squared为0.9726,说明模型1与实际情况的混合程度非常高。运用t检验法,比较各自变量的t绝对值,前三位的分别是总人口1.82,工业生产总值1.29,消费品零售总额1.29,由此可知这三个自变量对因变量客运量的影响都很大,其中总人口对客运量的影响最大,其余的3个自变量t绝对值均小于0.5,可见生产总值,进出口总额,人均可支配收入这三个自变量对客运量的影响不是很大。有模型2可知,简单线性回归模型的拟合度R-squared为0.8649,说明模型2与现实情况的吻合程度也很高。进行F检验,由F(1,9)=57.62,ProbF=0.0000可知,回归方程显著,总人口对客运量有显著影响。
本文标题:苏州市客运量回归分析报告
链接地址:https://www.777doc.com/doc-1928017 .html