您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 全国30省市自治区经济发展水平综合评价基于因子分析和聚类分析
全国30省市自治区经济发展水平综合评价——基于因子分析和聚类分析王喆[摘要]衡量一个地区的经济发展程度,要从其生产、消费等各个方面进行综合评价。本文基于全国30省市自治区的GDP、CPI等8个经济指标的数据,应用因子分析的方法对其经济发展水平进行了排名和聚类分析的方法将其分为一线、二线、三线地区。根据排名及分类结果,本文对各类地区的经济发展状况进行了全面评价,并提出了相关建议。[关键词]因子分析;聚类分析;经济发展;综合评价一、数据背景1.变量选取本文选取了国民生产总值、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品价格指数、工业总产值等8个指标进行量化评价我国30个省、市、自治区(不包括重庆、香港、澳门、台湾)的经济发展水平状况。2.符号说明序号符号符号说明1X1国民生产总值2X2居民消费水平3X3固定资产投资4X4职工平均工资5X5货物周转量6X6居民消费价格指数7X7商品价格指数8X8工业总产值9F1经济总量因子10F2生活水平因子11F3物价水平因子12Z综合得分二、数据描述1.描述统计本文计算了各变量的极大值、极小值、均值、标准差等指标(表1),计算结果表明,各变量均不存在缺失值,数据的完整性较好。各地区的的居民消费价格指数、商品价格指数这两个指标差异不大,但是其他指标的差异很明显,这也符合我国经济发展不平衡、地区差异显著的特点。表1各变量的一般统计量描述表变量样本数极小值极大值均值标准差国民生产总值3055.985381.721921.09271474.80603居民消费水平30942.005343.001745.9333861.64193固定资产投资3017.871639.83511.5083402.88548职工平均工资304134.009279.005447.63331317.44330货物周转量304.202033.30666.1200459.93526居民消费价格指数30113.50121.40117.28672.02531商品价格指数30110.60118.10114.90671.89808工业总产值305.572207.69862.9980584.587262.相关性分析根据各变量的经济含义,许多变量之间应该存在高度相关,为了更好的看出各变量的相关关系,本文计算了各变量之间的Pearson相关系数及相关的显著性检验(表2)。结果表明,许多变量之间存在较强的相关关系,比如国民生产总值与固定资产投资之间的相关系数高达0.951,居民消费价格指数与商品价格指数之间的相关系数高达0.763。表2各变量相关系数计算表国民生产总值居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值国民生产总值0.2670.951**0.1870.617**-0.273-0.2640.874**居民消费水平0.2670.426*0.716**-0.151-0.235-0.593**0.363*固定资产投资0.951**0.426*0.396*0.431*-0.280-0.3590.792**职工平均工资0.1870.716**0.396*-0.357-0.145-0.543**0.099货物周转量0.617**-0.1510.431*-0.357-0.2530.0220.659**居民消费价格指数-0.273-0.235-0.280-0.145-0.2530.763**-0.125商品价格指数-0.264-0.593**-0.359-0.543**0.0220.763**-0.192工业总产值0.874**0.363*0.792**0.0990.659**-0.125-0.192**表示在0.01水平(双侧)上显著相关。*表示在0.05水平(双侧)上显著相关。三、因子分析1.KMO和Bartlett的检验做因子分析之前,首先要进行KMO检验或Bartlett检验,只有当检验通过之后才能进行因子分析,一般认为KMO检验的结果大于0.5或Bartlett检验通过即适合进行因子分析。检验结果表明(表3),KMO检验值为0.62,大于0.5,而且Bartlett检验的伴随概率也为0.000,即认为,数据适合进行因子分析。表3KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量0.620Bartlett的球形度检验近似卡方231.285自由度28伴随概率p值0.0002.公共因子的提取通过SPPS软件,利用主成分法提取因子,并用最大方差法进行旋转,以更加明确各因子的经济意义。在SPSS操作中,本文保留了特征值大于1的公共因子,通过SPSS结果中的方差贡献率表(表4)可以看出利用主成分法提取并进行最大方差旋转之后的特征值大于1的3个公共因子累计的方差贡献率已经达到89.551%,即3个公共因子可以表示原数据中89.551%的信息,已经有比较好的解释结果。通过因子分析结果的碎石图(图1)也可以看出,从第4个公共因子之后变得比较平坦,因此保留前3个公共因子是比较合适的。表4方差贡献率表成份初始特征值旋转平方和载入合计方差贡献率(%)累计贡献率(%)合计方差贡献率(%)累计贡献率(%)13.75446.92446.9243.20740.09240.09222.20327.53274.4562.21727.70867.831.20815.09689.5511.7421.75289.55140.4035.04294.59350.2142.67397.26660.1381.72298.98870.0660.82999.81780.0150.183100图1碎石图方差解释表显示了3个公共因子总体水平上包含了多少信息,公因子方差表则显示了单独包含各个变量的多少信息。数值越大,表示包含越多该变量的原始信息。结果显示(表5),原始的8个变量中每个变量基本上都有80%以上的信息被包含在新提取出的3个公共因子中。表5公因子方差表国民生产总值居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值初始信息100%100%100%100%100%100%100%100%提取信息94.5%79.9%90.2%87.3%85.7%95.7%92.8%90.4%3.公共因子的经济意义通过旋转成份矩阵(表6)即旋转后的因子载荷矩阵可以看出,国民生产总值、工业总产值、国定资产投资、货物周转量在第一个公共因子上的载荷比较大,因此可以将第一个公共因子命名为经济总量因子;职工平均工资、居民消费水平在第二个公共因子上的载荷比较大,因此可以将第二个公共因子命名为生活水平因子;居民消费价格指数、商品价格指数在第三个公共因子上的载荷比较大,因此可以将第三个公共因子命名为物价水平因子。表6成分旋转矩阵表变量经济总量因子生活水平因子物价水平因子国民生产总值0.9550.124-0.131工业总产值0.9440.109-0.014固定资产投资0.8720.351-0.137货物周转量0.751-0.507-0.192职工平均工资0.0480.925-0.121居民消费水平0.2190.841-0.209居民消费价格指数-0.135-0.0130.969商品价格指数-0.104-0.4960.819通过对旋转后的因子载荷图(图2)的分析也可以发现,八个变量在三个公共因子组成的三维空间中基本分为三组,与因子载荷矩阵的分析结果一致。图2旋转后因子载荷散点图图4.公共因子的得分计算根据成份得分系数矩阵(表7)可以计算各个因子的得分。表7成分得分系数矩阵表变量经济总量因子生活水平因子物价水平因子国民生产总值0.3060.0110.047居民消费水平0.0250.3870.04固定资产投资0.270.1290.075职工平均工资-0.0250.4510.096货物周转量0.248-0.319-0.139居民消费价格指数0.070.180.653商品价格指数0.077-0.0980.462工业总产值0.3170.0260.123计算公式如下:F1X1X2X3X4X5X6X7X8F2X1X2X3X4X5X6X7X8F3X1X2X3X4X5X6X7X8根据成份得分协方差矩阵(表8)可以看出各个因子协方差为0,说明各公共因子正交,完全独立。表8成分得分协方差矩阵表成份经济总量因子生活水平因子物价水平因子经济总量因子1.0000.0000.000生活水平因子0.0001.0000.000物价水平因子0.0000.0001.0005.经济发展水平的综合分析因为各个因子都是标准化之后的变量,所以可以根据各个公共因子的贡献率作为权重计算出各个省市的综合得分。计算公式如下:Z(F1F2F3)物价水平越高对经济越不利,因此计算综合得分时要减去物价水平因子。计算结果见表9。表9各地区得分计算表排名地区经济总量因子生活水平因子物价水平因子综合得分排名地区经济总量因子生活水平因子物价水平因子综合得分1广东1.481.68-1.181.4716吉林-0.52-0.40-0.94-0.122上海0.623.660.851.217湖北0.61-0.401.25-0.153江苏2.030.27-0.171.0418湖南0.26-0.520.52-0.174山东2.12-0.190.250.8319山西-0.37-0.66-0.15-0.335浙江0.650.75-0.330.620广西-0.28-0.270.61-0.366辽宁0.96-0.43-0.610.4521江西-0.56-0.68-0.05-0.457北京-0.401.58-0.260.3822新疆-0.580.121.14-0.58天津-0.880.99-1.620.323西藏-1.590.63-0.02-0.529河北1.22-1.52-0.790.2724内蒙-0.48-0.880.21-0.5410河南1.07-1.32-0.470.1925陕西-0.41-0.530.89-0.5611福建-0.270.27-0.800.1626云南-0.280.052.05-0.6112黑龙江0.23-0.37-0.580.1327宁夏-1.36-0.15-0.14-0.6213四川1.11-0.520.980.128甘肃-0.72-0.221.02-0.6414安徽-0.07-0.80-1.510.0929青海-1.340.190.46-0.6615海南-1.470.00-2.25-0.1130贵州-0.77-0.341.67-0.85根据因子分析模型计算出的综合得分可以看出广东、上海、江苏、山东、浙江等东部沿海地区得分较高,贵州、青海、甘肃、宁夏、云南等西部地区综合得分较低,总的来看,从东部到西部,综合得分呈递减的趋势,这也符合我国经济发展在地理上呈阶梯状的特征。四、聚类分析为了能够更好的对各地区的经济发展水平进行综合评价,本文根据三个公共因子的得分对30个地区进行了系统聚类。在经过组间连接法、最远邻法、Ward法之后,发现Ward法得到的聚类效果更好,更加符合实际。因此将Ward法的聚类结果展示如下。1.聚类结果分析根据Ward法的树状图(图3)结果显示,30个地区大致可以分为三类到四类,为了更加简洁,同时也方便将分类结果进行图形展示,本文在这里将聚类的结果设定为三类。并按照分析我国经济状况的传统,将三类分别命名为一线地区、二线地区、三线地区。图3Ward法聚类树状图具体的分类结果如下:一线地区:广东、上海、江苏、山东、浙江、北京、四川、湖北二线地区:辽宁、天津、河北、河南、福建、黑龙江、安徽、海南、吉林三线地区:湖南、山西、广西、江西、新疆、西藏、内蒙、陕西、云南、宁夏、甘肃、青海、贵州将各个地区的三个因子得分水平画在三维空间坐标轴上(图4),划分的结果也比较清晰,看出分类结果较好。图4聚类结果散点图2.三类地区经济发展水平综合分析为了更好的描述各类地区的经济发展水平,现在分别计算各类地区三方面得分的均值。计算结果见表10。表10各地区因子平均得
本文标题:全国30省市自治区经济发展水平综合评价基于因子分析和聚类分析
链接地址:https://www.777doc.com/doc-2652117 .html