您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 《计量地理学》作业论文
《计量地理学》期末作业课题:《主成份分析法在甘肃省各城市综合实力评价中的应用》姓名:贾斌学号:2012141234专业:地理科学班级:1202课程名称:计量地理学学期:2013至2014学年第一学期主成份分析法在甘肃省各城市综合实力评价中的应用贾斌(地理科学12022012141234)摘要:本文采用客观赋值法中的主成分分析方法,通过建立一套包括4个方面26个指标的城市综合实力指标体系,对甘肃省14个中心城市和地区的综合发展水平进行研究。通过SPSS12.0统计软件对相关原始数据进行标准化处理,并求出无量纲后数据的相关系数矩阵R及R的特征值、特征向量和贡献率。在此基础上,确定作为初始因子的主成分变量,并计算出各主成分分值及综合分值。最后根据综合分值对甘肃省14个中心城市的综合发展水平做出了评价。关键词:主成分分析中心城市综合发展水平1.引言甘肃地处我国的西北地区。历史悠久,地域辽阔是中华文化的发祥地之一,甘肃作为我国东南部通向西北的交通要道、汉唐丝绸之路的必经之地,在地理位置上具有十分重要的地位。由于甘肃省的自然条件差,经济发展落后,贫困面大,甘肃省又是少数民族广泛聚居的地区。甘肃各中心城市的发展不仅直接关系到整个甘肃省的经济发展水平和西部大开发战略的成功实施,而且也关系到地区稳定与建立和谐社会等问题。因此研究甘肃省中心城市的综合实力发展水平具有对于促进甘肃省和谐社会的发展有着深远的现实意义和历史意义。所谓“中心城市”是指所处区域内经济比较发达、功能相对完善,对区域外的资本、技术、人力等资源具有吸纳力,对区域内其他城市及农村具有经济、政治、文化等方面的辐射力的城市[i]。中心城市以其地理位置、规模大小、辐射范围、影响程度及吸纳能力等的不同,区分为世界级中心城市、国家级中心城市、省级中心城市等等[ii]。中心城市是区域经济的核心和区域开发的重要依托,是带动周边城市和地区经济发展的重要动力。随着我国工业化进程的加快,中心城市经济发挥着越来越重要的作用。中心城市的综合实力直接影响着它的区域带动力。评价中心城市综合发展水平对于规划城市布局、确定城市等级、制定城市发展战略、构建城市产业链等具有基础意义。目前对中心城市的评价方法主要有两类,一类是主观赋值法,如层次分析法、德尔非法、模糊综合评价法等:另一类是客观赋值法,如主成分分析、因子分析等主观赋值法是由相关专家根据主观经验评判给分或给出相关指标的权系数,然后加权计算总分的评价方法。主观赋值法的特点是简单明了,易于操作,缺点是人为干扰因素多,尤其是在指标较多时,很难确定指标权重客观赋值法是根据客观对象构成要素的因果关系设计指标体系,根据指标体系采集原始数据,根据原始数据计算指标权重,然后加权计算总分的评价方法。客观赋值法的优点是克服了主观赋值法人为因素的干扰,同时也可以在不损失有价值信息的情况下进行数据简化或结构简化。近年来,国内学者在城市问题的研究中,更倾向于使用客观赋值法,本文采用客观赋值法中的主成分分析方法,通过对相关原始数据进行标准化处理,求出无量纲后数据的相关系数矩阵R及R的特征值、特征向量和贡献率;在此基础上,确定作为初始因子的主成分变量;并计算出各主成分分值及综合分值;根据综合分值对甘肃省中心城市的综合发展水平做出客观的评价。以便客观而准确地衡量一个地区社会经济系统的发展水平。2.主成分分析原理和模型2.1主成分分析原理主成分分析(PrincipalComponentsAnalysis,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。例如在评价企业的经营业绩时,要考虑许多指标,如利润、产值、产品数量、产品质量、固定资产、流动资产等等。若要全部列出,也许可以有几十个变量。因此用少量的几个综合变量代替原来的许多变量是有实际意义的。由这几个综合变量出发还有可能得到一个总的指标,按此总指标来排序、分类,问题就可能简单多了。通常数学上的处理就是将原来N个指标作线性组合,作为新的综合指标。最经典的做法就是用F1的方差来表达,即VarF1越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分如果第一主成分不足以代表原来N个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第N个主成分[iii]。2..2主成分分析数学模型F1=A11ZX1+A21ZX2+……+An1ZXnF2=A12ZX1+A22ZX2+……+An2ZXn……Fn=A1mZX1+A2mZX2+……+AnmZXn其中A1i,A2i,Ani(i=1,2,3……m)为X的协方差阵∑的特征值多对应的特征向量,ZX1,ZX2,……ZXn,是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响。[注:本文指的数据标准化是指Z标准化]。A=(aij)n*m=(a1,a2,am),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λn≥0。进行主成分分析主要步骤如下:1.根据研究问题选取指标与数据;2.进行指标数据标准化处理,以消除量纲不同的影响;3.求无量纲后的相关系数矩阵R,进行指标之间的相关性判定;4.求R的特征值、特征向量和贡献率;5.确定主成分的个数,本文按照特征值大于1以及和累积贡献率(即主成分解释的方差占总体方差的比例)大于85%的原则提取主成分因子;6.对主成分因子的经济意义作解释,一般由权重较大的几个指标的综合意义来确定;7.确定主成分Fi表达式;8.计算各主成分和综合主成分值并进行评价与研究。3.指标体系的建立和选取地区综合实力反映了一个地区整体的经济实力和社会经济发展状况。因此,应该全方位地从一个地区社会经济系统的各个领域去选择指标。现也是多方而的。本文在指标体系的建立上遵循了完备性、功能性、可比性和层次性原则。选取了4个层次9个方面共26个指标以较为全而地反映各城市发展的实际情况。(本文所用数据均来自2005年甘肃省统计年鉴)由于篇幅的原因原始数据在此未列出。本文所选取的指标体系如表1所示:表1:指标体系iv层次二级指标具体变量经济实力经济总量GDP(x1);地方则政收入x2;固定资产投资总额x11;社会消费品零售总额x6;财政支出x12经济结构第三产业产值x3;农林牧副渔总产值x4;工业总产值x2建筑业总产值x26经济效益工业增加值率x8社会实力人口素质中等职业技术学校在校人数x18;各类专业技术人员x16;生活质量农村居民人均纯收入x20;城镇人均可支配收入x7;每千人口执业医师和执业助理医师x17;人均居住面积x19;城乡居民存款额x9;城镇低保人数x25;开放程度进出口总量各地区进出口商品总值x10对外辐射公路客运量x21;公路货运量x15;邮电业务总量x14设施环境基础设施每万人公共汽车数x22;城市人口用自来水普及率x23环境保护市区绿化覆盖率x244.指标的主成分分析过程及结果本文运用著名统计分析软件SPSS12.0对上述26个指标进行计算处理。首先对原始数据进行标准化处理,以消除观测量纲的差异及数量级的影响,使标准化后的变量均值为0方差为1然后运用SPSS12.0对标准化后的数据进行主成分分析,得到主成分的特征值和贡献率(表2)计算结果如下:表2:主成分的特征值和贡献率主成分特征值方差贡献率累计方差贡献率F115.31258.89458.894F24.33316.66775.561F32.0818.00283.563F41.2314.73488.297方差贡献率是衡量各因子相对重要程度的指标,方差贡献率的大小,表示各个主成分的相对重要程度。在统计学中,一般认为主成分的累积贡献率达到85%即可保留有效信息[]从表2可以看出,本文选取的4个主成分的累积贡献率是88.297%,主成分F1、F2、F3、F4可以解释原始信息的能力分别是:58.894%、16.667%、8.002%、4.734%。由表2可以看出4个主成分的累积贡献率为88.698%,即保留了原始指标88.297%的信息,具有显著代表性。主成分的载荷矩阵(正交旋转后的因子载荷矩阵)见表3,载荷系数代表各主成分解释指标变量方差的程度。在主成分分析中,一般认为大于0.3的载荷就是显著的,本文因为原始变量较多,所以选取大于0.4的负载,使其能更好地解释原始变量。由表2可知,第一主成分的方差贡献率最大,为58.894%,是最重要的影响因子。由表3可知,第一主成分在国内生产总值、工业总产值、第三产业产值、财政收入、社会消费品零售总额、城乡居民存款额、各地区进出口商品总值、全社会固定资产投资、财政支出、各地区金融机构存款、邮电业务总量、公路货运量、各类专业技术人员、高中在校学生人数、公路客运量、每万人拥有公共汽车数、城镇低保人数、建筑业总产值等指标上载荷较大,该主成分既反映了社会、经济发展的总体状况,又反映了城市与国内外沟通的能力。可以认为F1是社会、经济发展和对外开放因子。第二主成分为16.667%,是次重要的影响因子。该主成分在城镇人均可支配收入、农村居民人均纯收入、城市人口用自来水普及率、每千人口执业医师和执业助理医师指标上负载较大,可将F2定为社会实力因子,在分析时可针对具体指标逐个进行。第三主成分为8.002%,重要性与F2基本相当。该主成分在农林牧副渔总产值、人均居住面积、城市人口用自来水普及率、公路客运量指标上载荷较大。由于载荷最大的两项指标均代表居民的生活水平,可以认为是居民生活水平因子。第四主成分方差贡献率为4.734%,在工业增加值率等上载荷较大,可以认为F4是经济发展速度因子。表3:主成分负载矩阵ComponentMatrixa.993-.005.056.024.964.210-.089.030.989-.085.029.030.147-.583.700-.149.989.043-.032.098.990-.033-.012.042.268.787.157-.229-.301.031-.008.838.989-.009.009.001.707.476-.330.005.984.076.085.061.822-.530-.061.113.984.031-.060.012.983.044-.035.021.862.110.119-.010.972.126-.106.040.634-.617.252.067-.282.191.792.234.080.844.349-.290.738-.335.405-.315.603-.217-.209.142-.080.617.515.373.558.434.263.112.827-.443.109-.013.972.068-.073.076.434.845-.178-.018国内生产总值工业总产值第三产业产值农林牧副渔总产值财政收入社会消费品零售总额城镇人均可支配收入工业增加值率城乡居民存款额各地区进出口商品总值全社会固定资产投资财政支出各地区金融机构存款邮电业务总量公路货运量各类专业技术人员高中在校学生人数人均居住面积农村居民人均纯收入公路客运量每万人拥有公共汽车数城市人口用自来水普及率市区绿化覆盖率城镇低保人数建筑业总产值每千人口执业医师和执业助理医师1234ComponentExtractionMethod:PrincipalComponentAnalysis.4componentsextracted.a.SPSS已经计算出4个主成分的分值保存在FAC1_1~FAC4_1种4个主成分的分值从不同的角度反映了中心城市综合发展水平其综合分值反映中心城市发展的
本文标题:《计量地理学》作业论文
链接地址:https://www.777doc.com/doc-5871214 .html