您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 财政收入多元化线性回归分析
案例08财政收入多元化线性回归分析一、案例简析本案例来自作者主持,参与的财政部“九五”科研课题《我国财政收支决定因素的统计分析》(该课题现已通过接题鉴定),作者从中选取了财政收入线性回归分析问题进行提炼,归纳,形成了本案例。我们试图通过对财政收入及其影响因素问题的研究,从教学上来说明如何利用多元回归分析这一常用的统计方法,解决现实问题的实证分析过程。财政收入是指一个国家政府凭借政府的特殊权力,按照有关的法律和法规在一定时期内(一般为一年)取得的各种形式收入的总和,包括税收,企事业收入,国家能源交通重点建设基金收入,债务收入,规费收入,罚没收入等。财政收入水平高低是反映一国经济实力的重要标志。在一定时期内,财政收入规模大小受许多因素的影响,如国民生产总值大小,社会从业人数多少,税收规模大小,税率高低等。在本案例中,我们认为,一个国家税收水平高低,国民生产总值规模的大小,社会从业人数多少,其他收入的多少,是决定一个国家一定时期内财政收入规模的主要影响因素。二案例数据的描述本案例的样本数据来自中国统计出版社出版的有关年份的《中国统计年鉴》和《改革开放十七年的中国地区经济》,数据时限为1978-1995年。案例数据如表8-1。表8-1的数据已经制成数据文件存入磁盘。该文件数据在磁盘中的位置是:人数多少a:\case08\data1.txt数据的排列格式及其变量名与表8-1相同。本案例的数据可以使用TSP软件,SPSS软件和SAS软件进行分析。我门建议使用SPSS软件进行分析。用SPSSforWIN.7.5软件读取本案例数据的基本步骤是:第一,用OPEN命令打开软件中的数据文件a:\case08\data1.txt,杂SPSS句法编辑器(SPSSSynaxEditor)中观察文件中的数据结构,包括变量名,变量数,变量顺序和样本数;表8-1财政收入等五项指标观测数据T年份Y财政收入(亿元)X国民生产总值(亿元)X税收(亿元)X其他收入(亿元)X社会从业人数(万人)19781132.623624.10519.2840.994015219791146.384038.20537.82113.534058119801159.934517.80571.70152.994236119811175.794860.30629.89192.224328019821212.335301.80700.02215.844470619831866.955957.10755.59257.844600419841642.867206.70947.35296.294759719852004.828989.102040.79280.517987319862122.0110201.402090.73156.955128219872199.3511954.502140.36212.385278319882357.2414922.302390.47176.865433419892664.9016917.802727.40179.415532919902937.1018598.402821.86299.535674019913149.4821662.502990.17240.108836019923483.8726651.903296.91295.155948219934348.9534650.504255.30191.046022019945218.1046532.905126.88280.186147019956242.2057277.306038.04369.1962388第二,用READASCIIDATA(读文本数据)命令以自由格式读取本案例的数据文件,并对每一变量进行定义,否则,读入后的数据结构会发生混乱,无法进行分析.还需注意的是:说句文件中包含了六个变量名,即T,Y,X,X,X,X,而变量名本身是字符不是数值,因而不能直接进行运算.处理方法是:读入文件后,把第一个样本继第一行的变量删去,即可进行分析.第三,用其它软件读取本案例数据的程序和思路参照以上程序进行.三案例所涉及的统计理论和统计方法本案例主要涉及的理论和方法包括:多元线性回归分析建模方法,多元线性回归方程的统计检验,回归方程的评价与预测方法,非线性统计方法及其他统计建模方法.具体方法的原理与说明倾向间隔终于回归分析相关的统计学教材.四组织本案例教学的一些建议1.在进行本案例教学前,应先将本案例所涉及的统计理论和方法作义介绍,尤其是对回归方程的显著性检验(F检验),回归系数显著性检验和D.W检验要给以详细讲述.2.结合样本数据的时间序列土,启发学生就建立经济模型的形式进行分析.如旧本案例的资料而言,是建立线性回归模型还是建立非线性回归模型?为什莫要建立线性模型?最好通过图形来接解释说明.3.本案例已在机房讲授,可以一边上机,以便演示整个回归分析和汴梁筛选的过程,教学效果会更好.五本案例的解析过程及参照结果1.收集有关数据.可根据表8-1数据直接录入,也可以从数据文件中读取原始数据文件a:/case08/data1txt.2.对样本数据进行初步的描述统计分析.具体可使用SPSS软件中STATISTICS功能中SUMMARIZE菜单下的DESCRIPTIVES选项进行分析.其运算结果如下(见表8-2):描述统计量表(DiscriptiveStatistics)标8-2NMiximumMaximumMeanStd.DeviationX183624.1057277.3016881.3715469.46X18519.286038.042254.481656.49X1840.99369.19217.8077.68X1840152.0079873.0053163.4410007.39Y181132.626242.202559.131473.26ValidN(listwise)18从描述统计量中并不能清楚地看到变两间的关系,需进行进一步的分析.但是统计量表明,五个变量的取值范围差别较大,因此在下面的分析过程中要考虑对变量进行标准化处理。3.对原始数据中的变量进行趋势分析。鉴于变量自身水平和计量单位等差异,要先对数据进行标准化处理,本案例中取变量的自然对数进行标准化。以X轴表示时间、Y轴表示财政收入等标准化后的变量,在SPSS软件运行中可知,其趋向基本是一致的,只是其他收入(X3)曲线波动较大,但因其值相对较小,权且保留,见图8—1。图形显示变量之间的关系基本上是线性关系,于是可据此建立多元线性回归方程。4.求解回归方程。SPSS软件中的线性回归分析功能中提供了四种回归分析方法,分别为:ENTER(一次进入法)、STEPWISE(逐步回归法)、FORWARD(向前进入法)及BACKWARD(向后剔除法)。四种方法虽然原理不尽相同,但殊途同归,得出的结论一般都会一致。我们首先用最简单的全部变量一次进入法(ENTER)对样本数据进行回归分析,得出的分析结果如下(见表8—3):表8—3回归方程变量基本信息(未标准化)(DescriptiveStatistics)MeanStd.DeviationNY2559.131473.2618X116881.3715469.4618X22254.481656.4918X3217.8077.6818X453163.4410007.3918表8—3是五个变量的三个描述统计信息,包括均值、标准离差和样本数。表8—4是五个变量之间的皮尔逊相关系数、单尾显著性水平和样本数。表8—4相关分析表(Correlations)YX1X2X3X4PearsonYCorrelationX1X2X3X41.0000.9920.9850.6120.6050.9921.0000.9730.5790.5530.9850.9731.0000.5760.6770.6120.5790.5761.0000.602.06050.5530.6770.6021.000Sig.Y(1-tailed)X1X2X3X40.0000.0000.0030.0040.0000.0000.0060.0090.0000.0000.0060.0010.0030.0060.0060.0040.0040.0090.0010.004NYX1X2X3X418181818181818181818181818181818181818181818181818用一次进入法各变量的进入次序如表8—5所示,即X4、X1、X3和X2。表8—5一次进入法变量进入次序(VariablesEntered/Removed)ModelVariablesEnteredVariablesRemovedMethod1X4,X1,X3,XEnter说明:a.AllRequestedVariablesEnteredb.DependentVariable:Y表8—6是回归模型的决定系数、估计值的标准误差和Durbin-Watson检验值。表8—6模型拟和效果分析表(ModelSummary)ModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson10.9970.9930.991138.86242.313说明:a.Predictors:(Constant),X4,X1,X3,X2b.DependentVariable:Y表8—7方差分析表(ANOVAb)ModelSumofSquaresdfMeanSquareFSig1Regression3.7E+0749161986475.1390.000Residual250675.91319282.76Total3.7E+0717说明:a.Predictors/Constant),X4X1X3X2b.DependentVariable:Y表8—7时回归模型的方差分析表、F检验值和显著性水平。回归方程的参数(非标准化方程和标准化方程的参数)、t检验值和显著性水平见表8—8。表8—8回归方程参数及检验表(Coefficients)UnstandardizedCoefficientsStandardizedcoefficientsModelBStd.ErrorBetatSig(Constant)767.775241.3683.1810.007X15.43E-020.0130.5704.1090.001X20.3680.1350.1412.7180.018X31.1010.6280.0581.7550.103X4-3.7E-030.007-0.025-0.5340.602说明:a.DependentVariable:Y表8-9是回归模型预测值及其残差的统计数据。表8-9残差分析表(ResidualsStatisticsa)MinimumMaximumMeanStd.deviationNPredictedValue1054.0316276.4572559.1321468.25118Residual-175.1748381.92456.32E-14121.431618Std.PerdictedValue-1.0252.5320.0001.00018Std.Residual-1.2612.7500.0000.87418说明:a.DependentVariable:Y运行结果显示:软件将四个自变量一次性地、不加选择地加入到回归方程中,然后再进行检验。检验结果表明,虽然回归方程的F检验值和决定系数等统计量达到了回归检验的标准,但是X3、X4两个变量并未通过t检验,因此炎对回归方程进行整理。应该说明的是,我们这里使用的是95%置信度标准进行检验的。即:如果对于一个变量,其回归系数的零假设可能性水平达到了5%以上,则对此变量从方程中剔除。在本例中的回归方程中,X3、X4的回归系数零假设可能性水平分别为0.103和0.602,均大于0.05。因此不能保留在方程中,依次将X3和X4剔除,其分析结果分别如下:(1)因为X4的零假设检验值较大,首先将X4剔除,得到回归分析计算结果如下(见表8-10、表
本文标题:财政收入多元化线性回归分析
链接地址:https://www.777doc.com/doc-1182682 .html