您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 基于主成分分析的我国城镇居民生活消费支出的研究模板
基于主成分分析的我国城镇居民生活消费支出的研究陈忠磊,吴川东,杨礼锚,邓雍,黄廷朗(20122211012011,62,49,47,12)摘要:我国城镇居民的消费性支出在逐步提高的同时,不同地区之间的消费水平和支出结构仍存在较大差异。全国各地的城镇居民生活消费的分布规律可以反映近年来在城镇化进行中各地居民的生活水平情况,通过选取相关的消费性支出指标,利用SPSS软件,对2012年我国31个省、市、自治区城镇居民家庭平均每人全年消费性支出的分布规律进行聚类分析和主成分分析,并进行了主成分得分综合排序,找出各地区城镇居民在消费性支出方面存在的差异,并提出相应缩小差异的建议。关键词:消费性支出;聚类分析;主成分分析;综合评价近年来,随着我国经济的快速发展,城镇居民的收入不断增加,并且在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,我国各地区城镇居民的消费支出也强劲增长,消费结构发生了巨大的变化,结构不合理现象也得到了一定程度的调整。但是,由于各地区的经济发展不平衡及原有经济基础的差异,人民收入水平不同,各地区城镇间的消费性支出结构仍存在着明显差别。为了进一步改善消费结构,正确引导消费,缩小消费性支出的地区差异,提高我国城市居民的消费水平和生活质量,有必要考察我国各地区城镇居民的消费性支出结构之间的异同并进行考察及系统分析研究,以期发现特点和规律,从宏观上把握各地区城镇居民的消费现状和不同地区消费水平的差异,为提高我国各地区消费水平和谐增长提供决策依据。因此客观、准确、有效地分析这些地区差异具有重要的理论和实践指导意义。为了研究全国各地区城镇居民人均年消费性支出的差异性和相似性,本文选取了全国31个省市自治区的相关数据,基于聚类分析、主成分分析等多元统计分析方法,运用SPSS软件进行研究。1主成分分析模型主成分分析是将多指标化为少数几个综合指标的一种统计方法,是由Pearson提出,后来被Hotelling发展起来的。主成分分析是将数据通过降维技术把多个变量化为少数几个主成分的方法,同时这些变量要尽可能多的表征原变量的数据结构特征而不丢失信息,它们通常表示为原始变量的线性组合。通过主成分分析,可以从事物错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到一些对事物特征及发展规律的深层次的启发,把研究工作引向深入。其基本思想是:设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标,并代替原来的指标。利用它们可进行简洁、有效的分析研究,甚至还可借助于图形作直观的分析。主成分分析的基本步骤如下:设有n个地区,p个消费性支出指标,则数据矩阵为X=(Xij):n×p,其中Xij为第i个地区的第j个消费性支出指标。(1)各指标数值的大小相差较大(X1值较大,而X4,X5,X7和X8值较小),如果直接使用主成分分析方法,则主成分会过于照顾数值较大的指标(如X1),而对数值较小的指标却照顾不够。为使主成分分析能够均等地对待每一个指标,消除由于数值大小的差异而可能带来的一些不利影响,需对各指标作标准化处理。即令:ij*jijjXXXS其中jX为第j个消费性支出指标的样本均值,jS为第j个消费性支出指标的样本标准差,j=1,…,p;i=1,…,n。指标X1,…,Xp经标准化后,记为*1X,…,*pX。(2)求出*1X,…,*pX的协方差矩阵,也就是X1,…,*pX的相关矩阵R。(3)求R的特征值及相应的一组正交单位特征向量。(4)计算累计贡献率,确定主成分个数,使累计贡献率达到一个较高的百分比。给出所使用主成分的符合实际意义的解释。(5)计算n个地区的主成分得分,然后根据得分对各地区的消费性支出情况作比较分析[1]。2指标的选取本文以2012年我国各地区城镇居民家庭平均每人全年消费性支出为例,2012年的31个省市的城镇居民家庭人均消费性支出统计中具有代表性的八大指标:食品支出(X1)、衣着支出(X2)、家庭设备用品及服务支出(X3)、医疗保健支出(X4)、交通和通讯支出(X5)、娱乐教育文化服务支出(X6)、居住支出(X7)、杂项商品和服务支出(X8),对我国31个省、直辖市、自治区(除台湾、港澳外)的城镇居民消费结构进行分析,以综合反映和评价各地区城镇居民家庭人均消费性支出。消费结构指居民在生活消费过程中,不同类型消费的比例及其相互之间的配合、替代、制约的关系。就其数量关系来看,消费结构是指在消费过程中不同商品或劳务消费支出占居民总消费支出的比重,反映了一定社会经济条件下人们对各类商品及劳务的需求结构,体现一国或各地区的经济发展水平和居民生活状况。3实证分析3.1数据来源按照上述的分析,以省为单位,每个省作为一个地区,根据实际情况,选取全国31个省份,运用主成分分析法进行地区消费性支出的实证分析,选取的指标和原始数据均来自统计局资料。根据2013年中国统计年鉴,得到2012年我国各地区城镇居民人均消费性支出的原始数据资料如附表所示[2]。3.2对数据标准化,求相关系数矩阵的特征值以及贡献率按照主成分分析的步骤,在计算机上运用SPSS16软件,对原始数据进行标准化处理,以消除量纲的影响,再对标准化后的数据进行降维处理。利用标准化后的数据,作主成分分析。程序运行结果得到KMO抽样适度测度值:Over—allMSA=0.796,大于0.5,一般认为此值越大,做主成分分析的效果越好[3]。经分析得到指标间的相关系数矩阵的特征值和特征值的方差贡献率及其累计方差贡献率如表1所示。从表1可知,根据特征值大于1的提取方法,变量相关系数矩阵有两个特征值:5.752、1.060,这两个特征值一起解释了变量X标准方差的85.162%(累计贡献率)。这样,对于此项研究的绝大部分要求,前两个因子(不妨设为f1和f2)提供了原始数据所能表达出的足够的信息。因此,主成分分析过程相应提取两个主成分:f1、f2。表1累计方差贡献率TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%Total%ofVarianceCumulative%15.75271.90671.9065.75271.90671.9064.83560.44260.44221.06013.25585.1611.06013.25585.1611.97824.71985.1613.5947.41992.5804.2192.73995.3195.1762.19697.5166.1201.50199.0167.061.76099.7778.018.223100.000ExtractionMethod:PrincipalComponentAnalysis.3.3因子载荷阵以及特征向量矩阵对提取的两个公共因子f1、f2,建立原始因子载荷矩阵,同时,为便于对各因子载荷作合理解释,对其进行旋转使其结构简单化。表2即为旋转后的因子载荷阵。表2旋转后的因子载荷阵RotatedComponentMatrixaComponent12X1.940.303X2.261.858X3.772.305X4.883.247X5.945.146X6.904.286X7.242.883X8.858.336ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.a.Rotationconvergedin3iterations.由表2可以看出,第一主成分f1在指标X1,X3,X4,X5,X6,X8上载荷值都很大,分别为食品、居住、家庭设备用品及服务、交通和通信、教育文化娱乐服务、居住、杂项商品及服务,因此可定义为基本生活消费因子;f2在指标X2,X7上载荷值大,可定义为质量型消费因子。综合可以看出,消费支出的多少主要取决于第一个公因子。设T1为变量名第二特征向量,T2为变量名第二特征向量。通过SPSS软件,求得特征向量矩阵如表3所示表3特征向量矩阵特征向量T1T2X10.39190.2943X20.10880.8334X30.32190.2962X40.36820.2399X50.39400.1418X60.37690.2778X70.10090.8576X80.35770.32643.4得分函数模型及各地区因子得分值根据上述矩阵,则所提取的两个主成分可表示为:f1=0.3919*ZX1+0.1088*ZX2+0.3219*ZX3+0.3682*ZX4+0.3940*ZX5+0.3769*ZX6+0.1009*ZX7+0.3577*ZX8f2=0.2943*ZX1+0.8334*ZX2+0.2962*ZX3+0.2399*ZX4+0.1418*ZX5+0.2778*ZX6+0.8576*ZX7+0.3264*ZX8将各个地区具体的经过标准化后的原始指标值代入得分函数模型,可以计算得到各地区的主成分得分值。主成分得分值的大小显示了各地区城镇居民在该因子所代表的各项指标上的消费水平高低,小于零表明其处于平均水平之下。以各主成分的贡献率占两个主成分的累计贡献率的比重作为权重进行加权汇总,计算各地区的综合测评得分,计算公式如下:Fi=0.68f1i+0.32f2i,(i=1,2,...,31),其中,Fi(i=1,2,...,31)为各地区消费支出情况总得分;fji的系数为各主成分的信息贡献率,它是各主成分的方差贡献率与两个主成分的累计贡献率的比值,通过计算得出综合得分F。然后通过比较各地区综合得分的高低,可排出2012年各地区城镇居民消费性支出水平的高低如表4。表4各地区综合得分排名地区f1f2F综合排名北京5.157.285.482天津2.313.472.495河北-1.41-1.44-1.4123山西-1.43-1.90-1.5024内蒙古1.503.891.886辽宁0.551.740.739吉林-0.281.660.0211黑龙江-1.52-0.54-1.3722上海6.034.815.841江苏1.641.421.607浙江2.803.002.834安徽-0.69-0.61-0.6814福建1.51-0.051.268江西-1.76-3.02-1.9529山东0.370.950.4610河南-0.80-0.26-0.7216湖北-1.13-0.82-1.0820湖南-0.74-1.29-0.8218广东3.762.103.503广西-0.81-2.38-1.0519海南-1.34-2.90-1.5826重庆-0.200.87-0.0312四川-0.57-1.50-0.7115贵州-2.07-3.55-2.3030云南-1.82-1.83-1.8227西藏-3.35-5.01-3.6131陕西-0.290.36-0.1913甘肃-1.54-1.35-1.5125青海-1.82-2.26-1.8928宁夏-0.81-0.39-0.7517新疆-1.24-0.46-1.12213.5聚类分析根据原始数据,应用软件SPSS16,采用欧氏距离平方和离差平方和法,对我国31个地区的城镇居民消费结构进行聚类分析,谱系图输出结果如图1所示。图12012年我国城镇居民消费结构聚类分析树形图从图1可以看出,可选择分类数为3,则得到以下分类结果,如表5所示。表52012年我国城镇居民消费结构分类类别地区第一类北京、上海、浙江、广东第二类江苏、福建、天津、内蒙古、辽宁、山东、重庆第三类黑龙江、甘肃、河北、青海、山西、江西、贵州、西藏、河南、新疆、云南、宁夏、广西、海南、吉林、湖北、安徽、陕西、湖南、四川4结果分析由表4的得分及排序结果来进行分析,
本文标题:基于主成分分析的我国城镇居民生活消费支出的研究模板
链接地址:https://www.777doc.com/doc-7237993 .html