您好,欢迎访问三七文档
计量经济学课程实验实验2一元回归模型【实验目的】掌握一元线性、非线性回归模型的建模方法【实验内容】建立我国税收预测模型【实验步骤】【例1】建立我国税收预测模型。表1列出了我国1985-1998年间税收收入Y和国内生产总值(GDP)x的时间序列数据,请利用统计软件Eviews建立一元线性回归模型。表1我国税收与GDP统计资料年份税收GDP年份税收GDP1985204189641992329726638198620911020219934255346341987214011963199451274675919882391149281995603858478198927271690919966910678851990282218548199782347446319912990216181998926379396一、建立工作文件⒈菜单方式在录入和分析数据之前,应先创建一个工作文件(Workfile)。启动Eviews软件之后,在主菜单上依次点击File\New\Workfile(菜单选择方式如图1所示),将弹出一个对话框(如图2所示)。用户可以选择数据的时间频率(Frequency)、起始期和终止期。图1Eviews菜单方式创建工作文件示意图图2工作文件定义对话框本例中选择时间频率为Annual(年度数据),在起始栏和终止栏分别输入相应的日期85和98。然后点击OK,在Eviews软件的主显示窗口将显示相应的工作文件窗口(如图3所示)。图3Eviews工作文件窗口一个新建的工作文件窗口内只有2个对象(Object),分别为c(系数向量)和resid(残差)。它们当前的取值分别是0和NA(空值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。⒉命令方式还可以用输入命令的方式建立工作文件。在Eviews软件的命令窗口中直接键入CREATE命令,其格式为:CREATE时间频率类型起始期终止期本例应为:CREATEA8598二、输入数据在Eviews软件的命令窗口中键入数据输入/编辑命令:DATAYX此时将显示一个数组窗口(如图4所示),即可以输入每个变量的数值图4Eviews数组窗口三、图形分析借助图形分析可以直观地观察经济变量的变动规律和相关关系,以便合理地确定模型的数学形式。⒈趋势图分析命令格式:PLOT变量1变量2……变量K作用:⑴分析经济变量的发展变化趋势⑵观察是否存在异常值本例为:PLOTYX⒉相关图分析命令格式:SCAT变量1变量2作用:⑴观察变量之间的相关程度⑵观察变量之间的相关类型,即为线性相关还是曲线相关,曲线相关时大致是哪种类型的曲线说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵轴变量,一般取为被解释变量⑵SCAT命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变量,可以逐个进行分析⑶通过改变图形的类型,可以将趋势图转变为相关图本例为:SCATYX图5税收与GDP趋势图图5、图6分别是我国税收与GDP时间序列趋势图和相关图分析结果。两变量趋势图分析结果显示,我国税收收入与GDP二者存在差距逐渐增大的增长趋势。相关图分析显示,我国税收收入增长与GDP密切相关,二者为非线性的曲线相关关系。图6税收与GDP相关图三、估计线性回归模型在数组窗口中点击Proc\MakeEquation,如果不需要重新确定方程中的变量或调整样本区间,可以直接点击OK进行估计。也可以在Eviews主窗口中点击Quick\EstimateEquation,在弹出的方程设定框(图7)内输入模型:YCX或XCCY)2()1(图7方程设定对话框还可以通过在Eviews命令窗口中键入LS命令来估计模型,其命令格式为:LS被解释变量C解释变量系统将弹出一个窗口来显示有关估计结果(如图8所示)。因此,我国税收模型的估计式为:xy0946.054.987ˆ这个估计结果表明,GDP每增长1亿元,我国税收收入将增加0.09646亿元。图8我国税收预测模型的输出结果dependentvariable:y被解释变量ymethod:leastsquaresdatetimesampleincludedobservationvariable变量coefficient参数系数代表模型中自变量及因变量的关系:yi=-26312+38.62xi,回归系数的正负要符合理论和实际。截距项的回归系数无论是否通过t检验都没有实际的经济意义。std.error回归系数的标准误差值越大,回归系数的估计值越不可靠,这可以通过t值的计算公式可知t-statistict检验值-该值越接近零,系数在统计意义上越接近零。T值等于回归系数/回归系数的标准误差,t值的正负与回归系数的正负一致,回归系数的标准误差越大,t值越小,回归系数的估计值越不可靠,越接近于0.prob.p值为理论t值超越样本t值的概率,应该联系显著性水平a相比,a表示原假设成立的前提下,理论t值超过样本t值的概率,当p值a值,说明这种结果实际出现的概率的概率比在原假设成立的前提下这种结果出现的可能性还小但是它偏偏出现了,因此拒绝接受原假设。r-squared决定系数代表模型对数据的解释度,实质就是(y冒-y均)与(y-y均)的一致程度。范围由(0至1),基本来说,越接近1模型的解释度越强.(AdjustedRsquare)调整后的决定系数在多元线性回归模型时有用,由于在多元模型的时候,决定系数会随变量增大而增大,AdjustedRsquare就是为了对模型的解释度进行调整(不一定会随变量增大而增大).adjustedr-squared经自由度修正后的可决系数,从计算公式可知调整后的可决系数小于可决系数,并且可决系数可能为负,此时说明模型极不可靠。s.e.ofregression回归残差的标准误差。残差的经自由度修正后的标准差,ols的实质就是使得均方差最小化,而均方差与此的区别就是没有经过自由度修正。sumsquaredresid残差平方和loglikelihood对数似然估计函数值。首先,理解极大似然估计法。极大似然估计法虽然没有ols运用广泛,但它是一个具有更强理论性质的点估计法。极大似然估计的出发点是已知被观察现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率(离散分布以概率聚集函数表示,连续分布以概率密度函数标志。因为要是的样本点中所有样本点都出现,假定抽样是随机的则各个样本点的是独立同分布的,所以最后总的概率表现为概率聚集函数或者概率密度函数的连乘形式,称之为似然函数。要取最大概率,即将似然函数的处理过程都会对似然函数进行对数化处理,这样最后得到的极大似然函数就称之为对数似然函数)的那些参数的值来估计该分布的参数,从而提供一种用于估计刻画一个分布的一组参数的方法。其次,理解对数似然估计函数值。对数似然估计函数值一般取负值,实际值(不是绝对值)越大越好。第一,基本推理。对于似然函数,如果是离散分布,最后得到的数值直接就是概率,取值区间为0-1,对数化之后的值就是负值;如果是连续变量,因为概率密度函数的取值区间并不局限于0-1,所以最后得到的似然函数值不是概率而只是概率密度函数值,这样对树化之后的正负就不确定了。durbin-watsonstatdw检验值:dw统计量用于检验序列的自相关,公式就是测度残差序列与残差的滞后一期序列之间的差异大小,经过推导可以得出dw值与两者相关系数的等式关系,因而很容易判断。Dw值的取值区间为0-4,当dw值很小时(小于1)表明序列可能存在正自相关;当dw值很大时(大于3)表明序列可能存在负自相关;当值在2附近时(1.5-2.5之间)表明序列无自相关;其余的取值区间表明无法确定是否存在自相关。meandependentvar被解释变量的样本均值s.d.dependentvar被解释变量的样本标准误差akaikeinfocriterion赤池信息准则aic和sc在时间序列分析过程中的滞后阶数确定过程中非常重要,一般是越小越好。Aic较小意味着滞后阶数较为合适。schwarzcriterion施瓦茨信息准则,与aic没有任何本质区别,只是加入样本容量的对数值以修正损失自由度的代价。f-statistict检定统计量的推广,主要计算同时多个系数等于0的机率,H0:所有βi=0(i不包含截距系数);f统计量考量的是所有解释变量整体的显著性,所以f检验通过并不代表每个解释变量的t值都通过检验。当然,对于一元线性回归,t检验与f检验是等价的。prob(f-statistic)五、估计非线性回归模型由相关图分析可知,变量之间是非线性的曲线相关关系。因此,可初步将模型设定为指数函数模型、对数模型和二次函数模型并分别进行估计。在Eviews命令窗口中分别键入以下命令命令来估计模型:双对数函数模型:LSlog(Y)Clog(X)对数函数模型:LSYClog(X)指数函数模型:LSlog(Y)CX二次函数模型:LSYCXX^2还可以采取菜单方式,在上述已经估计过的线性方程窗口中点击Estimate项,然后在弹出的方程定义窗口中依次输入上述模型(方法通线性方程的估计),其估计结果显示如图9、图10、图11图、12所示。双对数模型:xyln6823.02704.1ˆln(3.8305)(21.0487)9736.02R9714.02R05.443F对数模型:xyln92.298532.26163ˆ(-8.3066)(9.6999)8869.02R8775.02R0875.94F指数模型:xy51007.25086.7ˆln(231.7463)(27.2685)9841.02R9828.02R57.743F二次函数模型:271058.50468.07.1645ˆxxy(7.4918)(3.3422)(3.4806)9918.02R9903.02R78.661F图9双对数模型回归结果图10对数模型回归结果图11指数模型回归结果图12二次函数模型回归结果六、模型比较四个模型的经济意义都比较合理,解释变量也都通过了T检验。但是从模型的拟合优度来看,二次函数模型的2R值最大,其次为指数函数模型。因此,对这两个模型再做进一步比较。在回归方程(以二次函数模型为例)窗口中点击View\Actual,Fitted,Residual\Actual,Fitted,ResidualTable(如图13),可以得到相应的残差分布表。图13回归方程残差分析菜单上述两个回归模型的残差分别表分别如下(图14、图15)。比较两表可以发现,虽然二次函数模型总拟合误差较小,但其近期误差却比指数函数模型大。所以,如果所建立的模型是用于经济预测,则指数函数模型更加适合。图14二次函数回归模型残差分别表图15指数函数模型残差分布表
本文标题:一元线性回归模型
链接地址:https://www.777doc.com/doc-2109761 .html