您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 我国各地区教育经费的统计分析
多元统计分析课程设计题目:我国各地区教育经费的统计分析学院:理学院专业:统计学学号:姓名:指导老师:摘要:我国幅员辽阔,不同地区的教育经费也不尽相同,甚至差异性很大,文中,从七个教育经费方面运用SPSS软件对我国内地31个省、自治区、直辖市的教育经费进行因子分析及系统聚类分析。关键词:教育经费;SPSS软件;因子分析;系统聚类分析1引言:人才成了在这个社会高速发展的关键,而教育是培养人才的基本。因此,国家、社会、个人在教育方面的投资越来越多。在文中对我国各地区教育经费的研究分析,有利于各个地区清晰地了解当地教育的现状,也有利于政府制定相关的政策措施促进各个地区教育的均衡性发展,从而促进教育公平。2因子分析与聚类分析2.11因子分析的思想与原理因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,少数几个随机变量是不可观测的通常称为因子。然后根据相关性的大小把变量分组,使得组内的变量之间相关性较高,使不同组的变量相关性较低。每组变量代表一个基本结构,即公共因子。从而将众多变量转换为少数几个公共因子。计算样本在各个公共因子上的得分,可以挖掘出样本的问题所在。通过计算样本的加权公共因子得分,可以对样本进行综合评价。因子分析的一般模型如下:pmpmppPmmmmFaFaFaXFaFaFaXFaFaFaX22112222212121121211112.12K-均值聚类法基本原理K-均值法是一种非谱系统聚类法,它是把样品聚集成k个类的集合。类的个数k可以预先给定或者在聚类过程中确定。该方法可应用于比系统聚类法大得多的数据组。由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。2.2因子分析的实施与分析2.21原始数据下表1资料为我国31个省、自治区、直辖市的教育经费数据表1中国各地区教育经费情况(单位:万)地区国家财政教育经费预算内财政经费民办学校办学经费社会捐赠经费事业收入学杂费其他教育经费北京513658046931826529.248389807999.7578990.9134950.4天津227077421038471163.46218.4553129364134.489684.9河北56474975178041145988284.71422726121114599629.2山西3529544319306026046.19294.7854277.1699278.989033.3内蒙古358476533447584754.92016.7487251.2395818.264943.3辽宁4834720436751140605.21677.112616381019217103974.6吉林274707726053737689.54102.8652270.6537994.434472黑龙江3183150290174217050.72738.8823011.8735479.822614上海440737639350457583.19541.1901393.1736561.7256843.1江苏9234608814286614590.916954831178102312625609676.3浙江7336561588417733771.8147052.724869771919052621325.2安徽4488332417204663061.421938.21305908995547.4111627.4福建39133503603658100519.936972.71189237903344.9101038.2江西3175331298435065599.720595.21070547878067.3162523.9山东8029725718059629560.533419.821616741677026141520.5河南6800265648160199621.38250.119805331581738222495.1湖北38381753584633310951625416981491282738285491.1湖南4585048422705233199.516086.816559541288148207319.4广东104402309808383216727.510677642340653310218329548.6广西399078637398292375510619.8847218.4673104.569036.7海南1133239104595615426.213628.4234577.318504325802.1重庆2893208268712761406.142149.9841897.9587058.7229775.1四川6816497635585570443.3111230.718500141127335103595.6贵州3139157295422015860.56826.9452054327349.155651.7云南4480463422624717630.623498.6671820.6533736.2142904.1西藏641638.4625958.5677.71154.518641.615583.3180.4陕西3766663351678414463.88756.61241636989372.8112115.5甘肃264861625324667953.318744.7401238.833181630183.3青海985919.2949171.51484.72595.659363.245325.712843.3宁夏843802.4789384.69119.24946.8115952.890675.420849.6新疆325662630456552265.614595.7313832.5226675.368677.52.22用spss软件对数据进行因子分析步骤在进行因子分析前,要先了解变量之间的相关性来判断进行因子分析是否合适,打开数据,依次点选Analyze→dimensionReduction→Factor...命令项,弹出FactorAnalysis对话框。在对话框左侧的变量列表中选变量X2至X8,使之进入Variables框。点击Descriptives...钮,弹出FactorAnalysis:Descriptives对话框,在Statistics中选Univariatedescriptives项要求输出各变量的均数与标准差,在CorrelationMatrix栏内选Coefficients项要求计算相关系数矩阵,并选KMOandBartlett’stestofsphericity项,和Significancelevels,点击Continue钮返回FactorAnalysis对话框,点击ok,可以得到输出结果表2和表3:表2CorrelationMatrixx2x3x4x5x6x7x8Correlationx21.000.996.572.723.931.922.701x3.9961.000.607.689.928.919.658x4.572.6071.000.370.697.697.290x5.723.689.3701.000.735.690.809x6.931.928.697.7351.000.995.753x7.922.919.697.690.9951.000.743x8.701.658.290.809.753.7431.000Sig.(1-tailed)x2.000.000.000.000.000.000x3.000.000.000.000.000.000x4.000.000.020.000.000.056x5.000.000.020.000.000.000x6.000.000.000.000.000.000x7.000.000.000.000.000.000x8.000.000.056.000.000.000表3KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..704BBartlett'sTestofSphericityApprox.Chi-Square443.280df21Sig..000由表2可以看出,原始变量之间具有较强的相关性,而且经Bartlett检验表明:Bartlett值=443.280,P0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。Kaiser-Meyer-OlkinMeasureofSamplingAdequacy是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。表3中KMO值=0.704,偏小,说明因子分析的结果比较好,接下来就可以用因子分析模型数据进行分析。点击Extraction...钮,弹出FactorAnalysis:Extraction对话框,选用Principalcomponents方法,根据特征根大于1的的原则,选人2个公共因子,之后点击Continue钮返回FactorAnalysis。其累计方差贡献率为90.594%,特征根及累计贡献率、碎石图如表4、图1:表4TotalVarianceExplainedComponentExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%dimension015.48678.36778.3673.39948.56448.5642.85612.22890.5942.94242.03190.594图1碎石图此时得到的未旋转的公共因子的实际意义不好解释,因此,对公共因子进行方差最大化正交旋转。在FactorAnalysis对话框中,点击Rotation...钮,弹出FactorAnalysis:Rotation对话框,选中varimax,之后点击Continue钮返回FactorAnalysis对话框,得到表5旋转因子载荷矩阵:表5RotatedComponetMatrixComponent12x2.696.657x3.645.701x4.066.930x5.881.236x6.671.724x7.644.736x8.924.179由表四可以得出因子分析模型:218217216215214213212179.0924.0736.0644.0724.0671.0236.0881.0930.0666.0701.0645.0657.0696.0FFxFFxFFxFFxFFxFFxFFx最后计算因子得分以各因子的方差贡献率占两个因子总方差贡献率的比重作为权重进行加权汇总,得出各个地区的综合得分F。F=594.90228.12361.7821FF在FactorAnalysis主对话框中点击Scores...钮,弹出弹出FactorAnalysis:Scores对话框,Regression(回归因子得分),之后点击Continue钮返回FactorAnalysis对话框,再点击OK,得到因子得分系数矩阵表6:表6ComponentScoreCoefficientMatrixComponent12x2.114.134x3.060.191x4-.415.641x5.437-.262x6.065.195x7.042.217x8.491-.324接下来计算综合得分,见表7:表7两个因子得分及综合得分地区F1F2F北京0.43061-0.532260.3天津-0.33489-0.77625-0.39河北-0.046220.298420山西-0.40936-0.0923
本文标题:我国各地区教育经费的统计分析
链接地址:https://www.777doc.com/doc-7284499 .html