您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 四川省农村居民消费结构变动的统计分析
1四川省农民消费结构变动的统计分析信息与计算科学2008级蒋旭指导教师丁体明教授摘要:本文在四川省实施统筹城乡改革的背景下,基于1998年—20009年12年来四川省农村居民的人均纯收入与消费支出等相关数据,采用因子分析方法,并结合聚类分析方法,实证研究了该省农村居民的消费结构变动情况。结论表明,四川省农村居民的食品支出占总消费支出的比重逐年下降,而交通和通讯、医疗保健、文化教育等支出的比重逐年增加,以饮食为主的消费结构正逐渐转向多元化的消费结构和得以不断优化。文中还提出了优化成都市农村居民消费结构的对策建议。关键词:因子分析,聚类分析,农村居民,消费结构,spssTheConsumptionStructureChangeintheStatisticalAnalysisofFarmersinSichuanPronviceInformationandComputationalScience,JiagnXu,Grade2008DirectedbyDingTimingAbstract:AccordingtotherevolutionofcitiesandcountriesinSiChuanprovinceandbasedonthedataof1998to2009perincomeandexpenditure,thispapertakestheFactorAnalysismethodandClustermethodtogethertoproveandstudythechangedstructureoftheruralresidents’consumptioninthisprovince.Theresultshowsthattheruralresidents’foodexpendituredeclinesintotalconsumptionexpenditure,however,theexpenditureoftransportation,communication,healthcare,andeducationisincreasingyearbyyear.Andtheconsumptionstructurethatisbasedonfoodisimprovedandturningtodiversification.Besides,thispaperputsforwardsomesuggestionsabouthowtoimproveruralresidents’consumptioninSichuan.KeyWords:FactorAnalysis,Clustermethod,ruralresident,consumptionstructure,spss.1前言众所周知,我国的农村人口众多,一直以来农村居民的生活状况都在我国人们生活中占有突出重要的地位。由于农业的特殊属性,[1]农村居民往往既是消费者,2又是直接的生产经营者和投资者,其生产消费和生活消费往往交织在一起,因此,中国农村居民收入来源复杂,支出去向多样。居民消费结构不但能反映居民消费的具体内容,更能反映居民消费需求的满足情况,近年来随着经济的发展,社会生产力水平迅速提高,人民的生活水平也显著得到提高,消费质量和结构不断优化,相对于过去而言,居民对衣、食、住的消费需求已从追求数量转到追求质量,居民食品支出比重不断下降,而医疗保健、交通通讯、文教娱乐及服务支出比重不断增加。消费结构变化反映了需求的变动,因此分析消费结构的变动及其成因对合理引导消费、促进经济的发展都有重要的意义。2模型方法概述2.1因子分析2.1.1因子分析的概念和意义[2,8]在研究实际问题时往往希望尽可能多地收集相关变量,以期能对问题比较全面、完整的把握和认识。但收集这些数据需投入许多精力,虽然它们能够较为全面、精确地描述事务,但是在实际数据模型中,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来许多问题,可以表现在:①计算量的问题。②变量之间相关性问题。变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。为解决上述问题,最简单和最直接的解决方案是在削减变量个数的同时不会造成信息的大量丢失。而因子分析正是这样一种能够有效降低变量维数,研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性,并已得到广泛应用的多元统计分析方法[1,2]。2.1.2因子分析的的数学模型[3]因子分析的核心是用较少的相互独立的因子反映原有变量的绝大部分信息。可以将这一思想用数学模型来表示。设有p个原有变量123,,,...,pxxxx,且每个变量(或经标准化处理后)的均值均为0,标准差均为1。现将每个原有变量用()kkp个因子123,,,...,pffff的线性组合来表示,则有3111121311123221222322123123123...............kkkkpppppkpkffffxaaaaffffxaaaaffffxaaaa(2.1)式(2.1)便是因子分析的数学模型,也可以用矩阵的形式表示为:XAF式中,F称为因子,由于它们均出现在每个原有变量的线性表达式中,因此又称为公共因子。因子可理解为高维空间中互相垂直的k个坐标轴;A称为因子载荷矩阵,aij(1,2,3,...,ip;1,2,3,...,jk)称为因子载荷,是第i个原有变量在第j个因子上的负荷。如果把变量xi看成k维因子空间中的一个向量,则aij表示xi在坐标轴fj上的投影,相当于多元线性回归模型中的标准化回归系数;称为特殊因子,表示原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。由式(2.1)可知因子是可见的[4,7,8]。2.1.3因子分析的基本步骤[5]1.因子分析的前提条件因子分析的目的是从众多的原有变量中综合出少数具有代表性的因子,这必定有一个潜在的前提要求,即原有变量之间应具有较强的相关关系。常用的方法有计算相关系数矩阵,计算反映像相关矩阵,巴黎特球度检验,KMO检验。本文采用KMO检验,KMO统计量适用于比较变量间简单相关系数和偏相关系数的指标,数学定义为:222ijijijijijijrKMOpr(2.2)式中,rij是变量xi和其他变量xj间的简单相关系数;pij是变量xi和其他变量xi间控制了剩余变量下的偏相关系数。由式(2.2)可知:KMO统计量的取值在0~1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1。KMO值越接近1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0。KMO4值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。Kaiser给出了常用的KMO度量标准:0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。2.因子提取和因子载荷矩阵的求解因子分析的关键是根据样本数据求解因子载荷矩阵。在此我们介绍最为广泛的主成分分析法。主成份分析法通过坐标变换的手段,将原有的p个相关变量xi标准化后进行线性组合,转换成另一组不相关的变量yi,于是有1211121311321221222323121233y...y.........y...pppppppppppxxxxxxxxxxxx(2.3)式(2.3)是主成分分析的数学模型。其中,2222123....1iiiip(1,2,3,...,ip).对式(2.3)中的系数按照以下原则来求解:(1)yi与yj(ij;,1,2,3,...,ijp)相互独立。(2)1y与123,,,...,pxxxx的一切线性组合(系数满足上述方程组)中方差最大的;2y是与1y不相关的123,,,...,pxxxx的一切线性组合中方差最大的;yp是与1y,2y,…,1yp都不相关的123,,,...,pxxxx一切线性组合中方差最大的。根据上述原则确定的1y,2y,3y,…,1yp依次称为原有变量1x,2x,3x,…,px的第1,2,3,….,p个主成分。其中,yi在总方差中所占比例最大,它综合原有变量1x,2x,3x,….,px的能力最强,其余主成分2y,3y,….,1yp在总方差中所占比例依次递减,即其余主成分综合原有变量的能力依次减弱。可见,主成分分析法的核心是通过原有变量的线性组合以及各个主成分的求解来实现变量降维的。基于上述原理,主成分数学模型的系数求解步骤归纳如下:(1)将原有变量数据进行标准化处理;(2)计算变量的简单相关系数矩阵R;5(3)求相关系数矩阵R的特征根123....0p及对应的单位特征向量123,,,...,p.通过上述步骤,计算'yxii便得到各个主成分。其中的p个特征值和对应的特征向量便是因子分析的初始解。现在重新回到因子分析中来,因子分析利用上述p个特征值和对应的特征值向量,并在此基础之上计算因子载荷矩阵:121112111121212221212222121212....................................pppppppppppppppaaaaaaAaaa(2.4)由于因子分析的目的是减少变量个数,因此在因子分析的数学模型中,因子数目k小于原有变量个数p。3.因子的命名因子的命名通过因子旋转实现,就是将因子载荷矩阵A右乘一个正交矩阵后得到一个新的矩阵B。它并不影响变量ix的共同度2ih,却会改变因子的方差贡献2jS。因子旋转通过改变坐标轴,能够重新分配各个因子解释原始变量方差的比例,使因子易于解释。4.计算因子得分计算因子得分途径是用原有变量来描述因子,因子得分函数是原有变量线性组合的结果,因子得分可看作各变量值的加权123(,,,...,)jjjjp总和,权数大小表示了变量对因子的重视程度,于是第j个因子在第i个样本上的值可表示为:112233,...,jjjjjppxxxxF(2.5)(j=1,2,3,…,k)2.2聚类分析“人以群分,物以类聚”,聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物的相似性。这就需要聚6类分析法。聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征具有相似性,不同类间个体特征的差异性较大[2]个体间的亲疏程度可以用个体间的差异程度来测度,为测度定义个体间的距离将每个样本数据看成k维空间上的一个点,通过某种距离来测度个体间的差异。通常,点与点之间的距离越小,意味着它们越“亲密”,越有可能聚成一类;点与点之间的距离越大,意味着它们越“疏远”,越有可能分别属于不同的类。根据所定义的距离,把那些相似程度较大的样本点划归一类,一步步将样本点划归各类。关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个较大的分类单位,直到将所有样本点聚类完毕为止,形成一个由小到大的分类系统。并聚类结果图表,把样本点之间的亲疏关系简明直观地展示出来。聚类分析不仅可以对样品进行分类.也可以对变量进行分类。为了提高执行效率,本文采用的是_KMeans聚类法。2.2.1K_Means聚类法的核心步骤[2,10]_KMeans聚类法也称快速聚类,它将数据看成k维空间上的点,仍以距离作为测度个体“亲疏程度”的指标,并通过牺牲多个解为代价换得高的执行效率。1.指定聚类数目K。在_KMeans聚类中,应首先要求用户自行给出需要聚成多少类,最终也只输出关于它的唯一解。2.
本文标题:四川省农村居民消费结构变动的统计分析
链接地址:https://www.777doc.com/doc-2588638 .html