您好,欢迎访问三七文档
1基于主成分分析的我国地区经济指标研究09统计班徐晓旺【摘要】地区经济的发展对我国现代化进程形成巨大的推动作用,而经济指标是评判地区发展水平的重要标志。根据搜集的相应数据建立数据库,基于主成分分析、同时运用聚类分析以及判别分析的多元统计方法,对全国各地区的经济状况进行综合指标分析。研究各省经济发展在全国的分布特征、筛选出具备可对比性的指标,进而探究造成差异的原因,同时具有针对性地提出相关建议。【关键词】主成分分析;聚类分析;判别分析;地区经济指标一、引言随着社会的不断进步,经济发展的车轮将会继续滚动。在整体水平提升的同时不难发现:我国各地区间发展势必存留着一定的差距,了解其具体的分布特征注定会是一个非常值得深入挖掘的信息。结合对进出口总额、居民消费水平等9个经济指标的研究,致力于分析各地区硬件发展水平、人民生活状况的异同与经济发展的相关性。本文将对中国31个省份地区的经济指标进行分析。首先,应用主成分分析的方法对众多指标做降维处理并赋予各主成分以实际意义以获取综合性指标;进而,基于主成分分析结果通过聚类分析法把我国的31个地区分类;最后,根据聚类的结果建立判别函数同时运用判别分析将新疆、广东两个省份归类。二、主成分分析搜集到的经济指标为:进出口总额、地区生产总值、固定资产投资、邮电业务量、客运量、货运量、公交车运营数、居民平均工资和居民消费水平这九项指标。在运用SPSS软件对以上数据开始分析前首先进行标准化处理,接着通过SPSS的操作,得到了如下的总方差分解结果(见表一):TotalVarianceExplainedInitialEigenvaluesExtractionSumsofSquaredLoadingsComponentTotal%ofVarianceCumulative%Total%ofVarianceCumulative%1234567895.8572.098.564.178.127.099.041.021.01465.08323.3096.2671.9741.4161.103.460.232.15565.08388.39294.66096.63398.05099.15299.61399.845100.0005.8572.09865.08323.30965.08388.392ExtractionMethod:PrincipalComponentAnalysis.表一2由表一中结果可以看到保留2个主成分为宜,这2个主成分集中了原始9个变量信息的88.392%,可见效果比较好,这样原来的9个指标就可以通过这2个综合指标来反映。此时,这2个主成分就起到了降维的作用。通过SPSS进一步的操作还可以得到如下的主成分系数矩阵(见表二):ComponentMatrixaComponent12进出口总额地区生产总值固定资产投资邮电业务量客运量货运量公交车运营数平均工资消费水平.852.979.821.957.885.742.967.226.513.393-.113-.419-.032-.233-.483.109.915.786a.2componentsextracted.表二由表二可以得出前2个主成分的线性组合为:Y1=0.852X1+0.979X2+0.821X3+0.957X4+0.885X5+0.742X6+0.967X7+0.226X8+0.513X9Y2=0.393X1-0.113X2-0.419X3-0.032X4-0.233X5-0.483X6+0.109X7+0.915X8+0.786X9通过对上述线性组合的观察,我们可以得出:在主成分1中进出口总额、地区生产总值、固定资产投资、邮电业务量、客运量、货运量和公交车运营数这几项指标的系数明显比主成分2的系数大,可以将Y1归类为地区经济发展中的硬件基础指标;在主成分2中平均工资和消费水平指标的系数最大,可以将Y2归类为地区经济发展中的居民生活指标。这样就将繁冗的9个指标归结为上述2个,这两项指标相互作用,共同反映地区经济发展情况。主成分得分如下(见表三):地区主成分1主成分2地区主成分1主成分2北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南1.40-1.010.75-1.18-0.891.20-1.22-1.021.574.702.940.37-0.22-1.044.421.474.102.17-1.22-0.44-0.24-0.52-0.32-0.414.80-0.240.47-1.340.18-0.84-1.91-1.80湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆0.020.217.81-0.98-2.58-0.981.06-2.04-1.61-2.97-0.71-2.21-2.81-2.58-1.88-0.57-1.080.54-0.700.06-0.15-1.17-0.34-0.451.22-0.49-0.330.500.61-0.06表三3三、聚类分析在SPSS软件上根据主成分得分应用聚类分析中的类平均法得到如下树状图(见表四):表四表四反映了全部31个省份地区聚类的情况,从中可以看到当取15左右范围的值时可以得到分类数为3的分类结果。四、判别分析将上述通过系统聚类的结果和两组待判别的数据导入SPSS,依次点击分析—分类—判别进行判别分析得到如下图表(见表五):CasewiseStatisticsHighestGroupP(Dd|G=g)CaseNumberActualGroupPredictedGrouppdfOriginaldimension11234567891011121314151617181920212223242526272829303111222333333333333333333333333ungroupedungrouped1122233333333333333333333333323.847.847.570.490.215.407.905.994.145.938.969.471.451.679.134.753.622.818.334.980.296.472.671.157.982.378.293.373.002.000.6912222222222222222222222222222222表五从表五结果我们可以看出第30组(广东)归为第2类,第31组(新疆)归为第3类,其他原属分类保持不变。4五、结果分析与问题探讨全国各地区经济发展指标分类分布特征:以基于主成分分析法得到的两类综合指标对31个地区进行分类,从结果上看体现为:第一类(经济最发达):北京、上海;第二类(经济较发达):江苏、浙江、山东、广东;第三类(经济欠发达):江西、天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、福建、河南、湖北、湖南、广西、海南、重庆、四川、贵州、云南、西藏、陕西、青海、宁夏、新疆、甘肃。由此可以看出我国经济发展在地域上呈现东强西弱、沿海优于内陆的渐变特征;其次层次感比较强、包含极端现象(如:北京、上海)。全国各地区经济发展水平差异性分析:根据以上三类分析得知,“硬件基础”指标在衡量地区经济发展水平中处于首要决定条件,其次“居民生活”指标也在其中扮演着重要角色。对各层次地区进行交互性比较分析可以发现:发达地区相较于较发达地区在居民平均工资、消费水平这两项经济指标上的优势很明显,分别有70.3%和87.9%的赶超额;而较发达地区与欠发达地区无论在硬件基础还是居民生活方面都存在着较大差距。对此提出以下两点建议:①通过上述分析,地区经济发展的硬件基础反映了该地65.083%的信息,所以把这个要素放在发展首位是最有效的推动力,它也是有力提升地区竞争力的重要保障。所以要大力发展地区经济建设的硬件水平。相应的可以采取增加进出口,加大固定资产投资,重视邮电、交通建设等措施。②地区的经济发展同样离不开当地居民的贡献,他们是地方的建设者。因此要努力改善当地居民的经济生活,提高他们的工资水平、刺激居民消费依此形成经济增长的良性循环。参考文献:【1】中国国家统计局中国统计年鉴2010。【2】何晓群编著多元统计分析(第三版)中国人民大学出版社。5附表:标准化的九项经济指标数据地区进出口总额地区生产总值固定资产投资邮电业务量客运量货运量公交车运营数平均工资消费水平北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆1.18-0.08-0.31-0.48-0.50-0.09-0.45-0.401.572.130.91-0.410.07-0.430.54-0.45-0.40-0.473.96-0.45-0.50-0.48-0.36-0.53-0.47-0.55-0.48-0.51-0.55-0.54-0.450.04-0.440.56-0.45-0.210.35-0.46-0.330.342.331.15-0.180.05-0.422.270.790.120.132.85-0.41-1.04-0.540.24-0.81-0.58-1.17-0.37-0.86-1.10-1.07-0.77-0.57-0.421.07-0.450.031.23-0.15-0.33-0.612.430.610.47-0.090.002.451.320.250.151.16-0.29-1.25-0.350.74-0.95-0.54-1.40-0.13-0.94-1.31-1.23-0.900.23-0.700.37-0.34-0.500.16-0.49-0.330.281.511.24-0.170.21-0.391.080.510.010.034.10-0.24-0.94-0.520.49-0.60-0.30-1.12-0.20-0.71-1.07-1.04-0.550.31-0.83-0.14-0.68-0.83-0.03-0.41-0.60-0.971.251.260.57-0.30-0.291.490.65-0.010.533.63-0.30-0.620.221.42-0.35-0.67-1.00-0.12-0.52-0.97-0.94-0.75-1.11-0.860.740.300.480.77-0.85-0.60-0.211.050.941.73-0.50-0.032.741.38-0.130.651.240.18-1.11-0.290.44-0.87-0.70-1.400.02-1.00-1.26-0.97-0.751.26-0.540.25-0.62-0.710.80-0.210.130.861.651.00-0.30-0.22-0.661.670.400.450.003.20-0.60-1.13-0.510.32-0.84-0.57-1.24-0.26-0.86-1.10-1.08-0.543.011.59-0.48-0.32-0.09-0.17-0.74-0.873.110.380.47-0.29-0.39-0.80-0.29-0.65-0.44-0.670.45-0.56-0.55-0.14-0.37-0.59-0.721.43-0.28-0.730.000.11-0.422.401.17-0.48-0.460.030.35-0.29-0.333.630.541.22-0.450.34-0.490.12-0.52-0.32-0.331.08-0.53-0.56-0.20-0.46-0.85-0.70-1.08-0.44-0.82-0.62-0.32-0.61
本文标题:多元统计分析论文
链接地址:https://www.777doc.com/doc-5677722 .html