您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 全国各地区城镇居民消费性支出
全国各地区城镇居民消费性支出表2列出2010年全国31个省、直辖市和自治区的城镇居民家庭平均每人全年消费性支出的八个主要变量数据。这八个变量是x1食品x2衣着x3居住x4家庭设备用品及服务x5医疗保健x6交通和通信x7教育文化娱乐服务x8其它商品和服务表2消费性支出数据cityx1x2x3x4x5x6x7x8北京6392.902087.911577.351377.771327.223420.912901.93848.49天津5940.441567.581615.571119.931275.642454.381899.50688.73河北3335.231225.941344.47693.56923.831398.351001.01395.93山西3052.571205.891245.00612.59774.891340.901229.68331.14内蒙古4211.482203.591384.45948.871126.031768.651641.17710.37辽宁4658.001586.811314.79785.671079.811773.261495.90585.78吉林3767.851570.681344.41710.281171.251363.911244.56506.09黑龙江3784.721608.371128.14618.76948.441191.311001.48402.69上海7776.981794.062166.221800.191005.544076.463363.251217.70江苏5243.141465.541234.051026.32805.731935.072133.25514.41浙江6118.461802.291418.00916.161033.703437.152586.09546.36安徽4369.631225.561229.64678.75737.051356.571479.75435.62福建5790.721281.251606.27972.24617.362196.881786.00499.30江西4195.381138.841109.82854.60524.221270.281179.89345.66山东4205.881745.201408.64915.00885.792140.421401.77415.55河南3575.751444.631080.10866.72941.321374.761137.16418.04湖北4429.301415.681187.54867.33709.581205.481263.16372.90湖南4322.091277.471182.33903.81776.851541.401418.85402.52广东6746.621230.721925.211208.03929.503419.742375.96653.76广西4372.75926.421166.85853.59625.451973.041243.71328.27海南4895.96636.141103.76616.33579.891805.111004.62284.90重庆5012.561697.551275.961072.381021.481384.281408.02462.79四川4779.601259.491126.65876.34661.031674.141224.73503.11贵州4013.671102.41890.75673.33546.841270.491254.56306.24云南4593.491158.82835.45509.41637.892039.671014.40284.95西藏4847.581158.60726.59376.43385.631230.94477.95481.82陕西4381.401428.201126.92723.73935.381194.771595.80435.67甘肃3702.181255.69910.34597.72828.571076.631136.70387.53青海3784.811185.56923.52644.01718.781116.56908.07332.49宁夏3768.091417.471181.71716.22890.051574.571286.20500.12新疆3694.811513.42898.38669.87708.161255.871012.37444.20资料来源:2011年《中国统计年鉴》系统聚类分析相关机制列于表3。用相关系数来度量各对变量之间的相似性。相应于最长距离法,类与类之间的相似系数定义为两类变量间的最小相关系数,每次聚类时合并两个相似系数最大的类。表3各对变量之间的相关系数x1x2x3x4x5x6x7x8x11.......x20.2911......x30.7290.4491.....x40.7840.5250.861....x50.2790.770.5790.5191...x60.8850.3880.7980.7870.4221..x70.8330.5480.8330.8850.5580.8881.x80.7550.6510.7840.8340.590.7550.821用SAS编程生成聚类产生的树形图如图所示。图1八个消费性变量的最长距离法树形图结果显示可把这八个变量分为三类,分别为①:食品、交通和通信、教育文化娱乐服务;②:居住、家庭设备用品及服务、其它商品和服务;③:衣着、医疗保健。SASSASSASSAS程序datadatadatadataa(type=distance);arrayx(8888)x1-x8;inputv$x1-x8;doi=1111to8888;x(i)=1111-x(i);end;dropi;cards;x11.......x20.2911......x30.7290.4491.....x40.7840.5250.861....x50.2790.770.5790.5191...x60.8850.3880.7980.7870.4221..x70.8330.5480.8330.8850.5580.8881.x80.7550.6510.7840.8340.590.7550.821;procprocprocprocprintprintprintprintdata=a;runrunrunrun;procprocprocprocclusterclusterclusterclusterdata=amethod=com;varx1-x8;idv;procprocprocproctreetreetreetreehorizontal;idv;runrunrunrun;现分别使用最短距离法、重心法和Ward方法对各地区进行聚类分析。为同等地对待每一变量,在作聚类前,先对各变量作标准化变换。图2至图4是运用SAS软件编程生成的这三种聚类方法的树形图。图2最短距离法图3重心法图4离差平方和法从这三个树形图来看,只有离差平方和方法较好地符合了我们的实际聚类要求,它将31个地区分为以下三类:第一类:北京、天津、浙江、上海和广东。这些都是我国经济最发达、城镇居民消费水平最高的沿海地区。第二类:青海、宁夏、安微、贵州、河南、陕西、江西、云南、河北、新疆、、湖北、四川、湖南、、广西、黑龙江、海南和西藏。这些地区在我国基本上属于经济发展水平和城镇居民消费水平中等的地区。第三类:山西、甘肃、内蒙古、吉林、辽宁、重庆、山东、江苏、福建。这些地区在我国基本上属于经济落后地区,城镇居民消费水平也较低。SASSASSASSAS程序procprocprocprocclusterclusterclusterclusterdata=lilymethod=sinstdpseudoout=a;idcity;procprocprocproctreetreetreetreehorizontal;idcity;procprocprocprocclusterclusterclusterclusterdata=lilymethod=censtdpseudoout=b;idcity;procprocprocproctreetreetreetreehorizontal;idcity;procprocprocprocclusterclusterclusterclusterdata=lilymethod=warstdpseudoout=c;idcity;procprocprocproctreetreetreetreehorizontal;idcity;动态聚类法对全国各地区作动态聚类分析,用K均值法进行聚类,聚类前对各变量作标准化变换,用SAS编程生成聚类结果如下。SASSASSASSAS程序procprocprocprocstandardstandardstandardstandarddata=lilymean=0000std=1111out=stan;procprocprocprocfastclusfastclusfastclusfastclusdata=lilymaxc=5555driftstdlistout=outd;varx1-x8;idcity;procprocprocprocprintprintprintprintdata=outd;K均值聚类结果图第一类:上海。第二类:江西、安微、湖北、湖南、广西、海南、贵州、四川、陕西、云南、河北、山西、黑龙江、河南、甘肃、青海、宁夏和新疆。第三类:北京、天津、浙江、江苏、福建和广东。第四类:内蒙古、辽宁、山东、重庆和吉林。第五类:西藏。类均值之间的距离列于表4.表4类均值之间的距离聚类12345101650.2033074.3173907.4351948.34521650.20301521.4452416.1643414.3433074.3171521.4450946.6144903.81243907.4352416.164946.61405752.55851948.3453414.344903.8125752.5580文中的上海和西藏可以看作是异常点,主要反映在这两个地区城镇居民的消费结构与其他地区相比有一定的特殊性。主成分分析自变量间的相关系数矩阵R显示x1,x6,x7之间相关系数较大,可知八个个自变量之间存在较强的多重共线性,因此为了能够充分有效的利用数据,进一步得到影响我国居民家庭平均每人全年消费性支出的主要因素,采用主成分分析法提取主要因子。相关SAS程序结果如下:根据提取因子的依据是在方差积累值≥80%的情况下,前两个主成分的累计贡献率达到87.33%,其中,第一个主成分的方差百分比72.29%,含有原始8个变量近72.29%的信息量;第二个主成分的方差百分比为15.05%,含即前两个主成分含有原始9个变量近87%的信息量;提取两个主成分累积方差贡献率超过80%,说明8个显著性变量的信息几乎能够被提取的2个主成分全部解释。表5主成分结果根据表5,第一主成分高载荷指标包括x1,x3,x4,x6,x7,x8,可以命名为综合消费性因子;第二个主成分高载荷指标为x2和x5,在x1上有中等的负载荷,而在其余变量上有负载荷或很小的正载荷,可以认为这个主成分度量了受地区气候影响的消费性支出成分,可称之为消费倾向成分。把31个地区分别按第一和第二主成分得分从小到大重新排序后的结果如下。表6第一主成分排序表7第二主成分排序从表6可以看出,东部地区的第一主成分得分大多较高,而中、西部地区则大多较低。从表7可见,北方地区的第二主成分得分普遍较高,而南方地区则普遍较低,这是由于北方地区气候寒冷,用于衣着、医疗保健等消费的比重相对较高,而南方地区则相反。图5为关于第一和第二主成分得分的散点图,该图等价于各变量经标准化后的八维数据点群在具有最大投影点群分散程度的二维平面上的投影,它对各地区的综合消费性支出和受地区气候影响的消费性支出占的比重有较直观的描述。图5前两个主成分的散点图从图5可以看出
本文标题:全国各地区城镇居民消费性支出
链接地址:https://www.777doc.com/doc-7317505 .html