您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 全国各地区农民家庭收支的聚类与判别分析
全国各地区农民家庭收支的聚类与判别分析【摘要】本文引用某年全国各地区农民家庭收支的抽样调查资料,运用SPSS统计软件中的聚类分析和判别分析对这些原始数据进行分类处理,旨在研究全国各地区农民家庭收支的分布规律对此进行简要讨论。【关键词】农民家庭收支聚类分析判别分析一、引言随着中国经济的发展和社会的进步,人民的生活水平日益提高,特别是在我国广大农村,农民的生活水平更是上了一个大台阶,这主要有以下三个原因:第一是中国城镇化水平的提高和农村剩余劳动力的大量转移,许多农民也像城镇人口一样取得了固定性的工资收入;第二是农民不再单纯地依靠种植收入,而是进行家庭经营取得经营收入;第三也是最重要的是政府意识到“三农”问题的重要性,加大了对农业、农村、农民的投入力度。正因为如此,近年来各地农民家庭收入逐年递增,正朝着小康水平迈进。农民家庭的收入增加,必然会导致家庭消费支出总额的增加和家庭消费支出结构的变化。从最近几年的统计数据可以看出:农村地区对吃穿等基本生活资料的消费呈下降趋势,而对于文化教育及医疗保健的支出消费逐年递增。从农村家庭收支的变化情况可以看出整个国家的经济增长状况,以小见大,为政府决策提供一定的依据。二、数据选取及数据分析(一)数据选取为了研究我国各地的农民家庭收支情况,现抽取了2012年31个省、市、治区八个指标变量,依次为X1(农村人均消费食品支出)、X2(农村人均衣着支出)、X3(农村人均居住支出)、X4(农村人均家庭设备及服务支出)、X5(农村人均交通及通信支出)、X6(农村居民文教娱乐支出)、X7(农村人均医疗保健支出)、X8农村人均其他商品及服务服务支出)(单位:元)。以上数据均来源于中国统计局2012年数据,以下运用SPSS20.0进行因子分析。其原始数据如表1:表1全国各地区农民家庭收支情况XHDQX1X2X3X4X5X6X7X81北京3944.89482199.8773.51398.81152.71125.2336.22天津3019.9780.71263.5451.31066.3766.1760.4228.43河北1817396.61137.3349.9604.3358.5543.7156.84山西1860501.81142.1298.3626498490.2149.75内蒙古2379.8481.81079269912.2514588.9157.4(二)数据分析对数据进行描述性统计分析如表2,我们可以看到各地区农民各项消费支出相对全国农民平均消费支出的情况,在农村居民消费支出中食品、住宅、交通通讯占了大部分比重说明随着农村居民收入的增加,人们更加注重人们的饮食、居住环境。也就是说人们更加注重享受消费,对于医疗卫生,文教娱乐等发展消费方面其所占比例相对减少。对于吉林省的农村居民的消费支出我们可以看到在食品支出、住宅支出、家庭设备和生活用品、交通通讯等方面吉林省低于各省的平均水平,吉林省的农村居民对于享受消费方面发展较弱。这有可能是人们的思想观念问题,对于享受消费方面观念保守,还有一种可能是由于吉林省是农业大省,在饮食上存在地缘优势,导致食品价格偏低,而且由于我省的经济发展水平的限制,人们对于住房、家庭设备、交通通信等的需求小于经济发达的省市,而且其物价水平也显著低于经济发达城市,再收入差距日渐缩小的今天,吉林省的农村居民可以花更少的钱享受更好的生活。而吉林省农村居民在衣着支出、文教娱乐、医疗保健方面的支出显著高于各省的平均水平,可以看到吉林省农村居民对6辽宁2300517.9979.8250.5668.7556.6548.8176.27吉林2268.8478.7836.8251.9699606.3840.5204.18黑龙江2164.9544.6754.7229.7611.3518727167.79上海4847.6704.41834.1646.11704.8952.11029253.410江苏3049.1610.71493.2532.91311.11184.2724.2232.711浙江3947.3751.61950.1604.41499.9902.2746.1251.112安徽2180.8331.91139.8346.9516.6385.9510.114413福建3403.5471.41165.8426.7795565.8380.6193.114江西2232.82651030.2278.3494.5342.7380.4105.615山东2321.5454.71399.9405.7937.6501635.3120.216河南1701.7424.11060.7361.6525.1343.8468.8146.217湖北2154316.41206.2397.9496.1394.6591.9169.718湖南2574.83181088.2373.5481.6400.2497.2136.619广东3658.7319.51196.1378.5760.1466.6446.5232.720广西2085.6156.51200.8274.6453270.2383.9108.821海南2410.1178.9828.6207.5435.6254306.5155.222重庆2216.1380.2557413.5489.3394.2482.28623四川2514.2338.5787.4333.2463.9329.3498.3101.924贵州1740.6226.8758.4211.4371.3226.4282.584.325云南2080.6241.1804.4247470.2289.2362.666.226西藏1592372.6251.6173.336440.982.790.527陕西1520.1332.71258.1298.7503.3445.5619.9136.428甘肃1648.6303.1682.3250.4436327.3398100.429青海1858.6404.51209.7257.4683.7283.3520.1121.630宁夏1891.4463.41033.2305620.8373.4492.1172.231新疆1891.1429.91298.5219.1646.4261.7444.2110.2于生活品质、教育、医疗保健的重视还是高于全国平均水平的,这有利于我们我省培养人才,提高居民的身体素质,促进吉林省更好更快的发展。但是对于衣着支出高于全国平均水平,我认为主要是由于我省的制造业比较落后,主要靠从外省的批发运输,导致其成本增加从而居民的衣着支出增加,而且随着居民收入的增加,物价水平不断上涨,人们更加重视衣着等外在也是导致其支出上升的原因。表2中全国各省市的各项指标的偏度与峰度均大于0,各项指标呈现右偏尖峰分布,以均值作为集中趋势,各省市的各项指标均存在一定的高估或低估,这是不准确的特别是吉林省在X1、X3、X4、X5指标存在一定的低估,X2、X6、X7、X8存在一定的高估。总的来说吉林省在发展消费能力方面即衣着支出、文教娱乐支出、医疗保险支出、其他方面的支出显著高于其他省市,这有利于我省农村居民的在文化、医疗、制造业、服务业等相关产业的发展,表明了吉林省农村居民对文化医疗方面的重视,是十分有利于我省的文化事业的发展以及居民身体素质的提升。而吉林省农村居民在食品支出,居住环境支出、家庭生活用品支出以及交通通信方面的支出等享受消费方面的支出却显著低于全国各省市的平均水平,表现出了我省的农村居民消费结构存在问题,是不利于我省农村居民整体消费水平的提升,不利于吉林省整体经济模式的发展转变。表2描述性统计极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量标准误X11520.14847.62428.258795.9023633460.5331.471.4211.845.821.821X2157948433.74179.59432253.9171.039.4211.236X3251.62199.81117.010392.7930154286.355.700.4211.658.821X4173.3773.5348.958137.625218940.6881.460.4212.195.821X5364.01704.8711.177346.2881119915.4151.578.4211.773.821X640.91184.2480.797263.293369323.3541.350.4211.677.821X782.71125.2545.413211.688944812.190.781.4211.525.821X866.2336.2157.91960.92863712.290.941.421.969.821三、聚类分析经济研究过去常常采用定性分析,根据经验进行经济决策,这种方法有很多的弊端,因而人们越来越多地采用定性与定量分析相结合,以事实说话,更客观地反映经济变化的规律。这里我们利用已有的统计数据,运用SPSS统计软件对其进行分析,主要进行的是聚类和判别分析。表3案例处理汇总案例有效缺失总计N百分比N百分比N百分比31100.000.031100.0Ward联结上表为个案处理综述表。表中显示有效个案为31个;缺失个案为0个,即没有缺失个案;个案总数为31个,说明所选随机样本100%有效。脚注显示聚类时采用的是ward方法,具体聚类方法为默认设置的欧氏距离平方值法。图1树状图上面的图1清晰地表示了聚类的全过程。它将实际的距离按比例调整到0至25的范围内,用逐级连线的方式连接性质相近的个案和新类,直至并为一类。如图所示,将所选指标进行粗分,分为五类:第一类:北京、浙江和上海。第二类:福建、天津、广东、江苏。第三类:河北、山西、河南、陕西、青海、宁夏、新疆。第四类:内蒙、辽宁、吉林、黑龙江、安徽、江西、山东、湖北、湖南、广西、海南、重庆、四川、云南。第五类:贵州、甘肃。从原始数据中,我们可以清楚地看出北京和上海、浙江三地的消费支出在全国各地区中水平最高,特别是住房支出远远高于其它省市,此外生活用品和文化生活服务支出的数额也较别的地区偏高。仅次于北京和上海的地区就是福建、天津、广东、江苏,这个省份的消费水平在整个国家中居于前列。如表3:表4聚类分析结果群集成员案例5群集案例5群集1:北京117:湖北42:天津218:湖南43:河北319:广东24:山西320:广西45:内蒙421:海南46:辽宁422:重庆47:吉林423:四川48:黑龙江424:贵州59:上海125:云南410:江苏226:西藏511:浙江127:陕西312:安徽428:甘肃513:福建229:青海314:江西430:宁夏315:山东431:新疆316:河南3这个结果从一个侧面反映出了我国经济发展的水平和结构。经济水平有了较大的提高,但经济重心仍然集中在几个发达的主要省市,如北京、上海、浙江等。中国实行改革开放政策以来,经济有了突飞猛进的增长,特别是农村经济的迅速发展,但经济发展不平衡的问题也一直伴随着,并且还有越演越烈的趋势,东部发达地区和南方一些经济基础好的省市的发展已经达到中等发达国家的水平,但是广大中西部地区的经济水平特别是西部内陆地区的经济远远落后于经济发达地区。国家也意识到这个问题,因而提出西部大开发的伟大战略,东部帮助西部,共同走向繁荣。从原始数据和上面的分析结果,我们可以很明显地感觉到这一点,第一类地区的消费支出中食品的消费占了大部分,根据恩格尔定律知道这些地区的恩格尔系数比较高,经济发展程度不高。而第二类和第三类地区的消费支出中非生活必需品的消费比重较高,北京的住房支出达到最高,上海的交通通信服务支出最多,说明这些省市的恩格尔系数较低,经济发展较好。四、判别分析判别分析是在已知分类数目的情况下,根据一定的指标对不知类别的数据进行归类。我们常用的判别分析方法有距离判别法、费歇尔判别法和贝叶斯判别法等。这里采用的是费歇尔判别法,这种方法是以费歇尔准则为标准来评选判别函数的。所谓费歇尔准则,指的是较优的判别函数应该能
本文标题:全国各地区农民家庭收支的聚类与判别分析
链接地址:https://www.777doc.com/doc-5871213 .html