您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 应用多元统计分析课程论文
《应用多元统计分析》课程论文2015年11月30日安徽科技学院教务处论文题目:《江苏省各地区物流产业发展的综合评价》姓名:熊海帆学院:信息与网络工程学院专业:信息与计算科学班级:2013级1班学号:1884130124指导教师:张家昕安徽科技学院《应用多元统计分析》课程设计论文摘要现代意义上的物流管理出现在20世纪80年代,人们发现利用跨职能的流程管理的方式去观察,分析和解决企业经营中的问题非常有效,通过分析物料从原材料运到工厂,流经生产线上每个工作站,企业可以消除很多看似高效率却实际上降低了效率的局部优化行为。物流产业的实质体现为技术密集和劳动密集相结合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。物流产业对经济增长,特别是区域经济增长和区域产业协作的推动,都有着不可替代的重大意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障作用。本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,因子分析作为比较,判断本问题哪种方法更为适合,对江苏省沿江地区20个地市的物流发展现状进行了综合评价,为江苏省各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿江地区整体物流发展水平。【关键词】主成分分析;因子分析;物流产业;综合评价一、引言随着经济全球化持续发展、科学技术水平不断提高以及专业化分工进一步深化,经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。二、模型的建立2.1主成分分析主成分分析也称分量分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,由于多个变量之间往往存在着一定程度的相关性,因此从数学角度来看,这是一种降维处理技术。以各个主成分为分量就得到一个更低维的随机向量。因此通过主成分分析既可以降低维数又保留了原数据的大部分信息。假定安徽科技学院《应用多元统计分析》课程设计论文有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵xxxxxxxxxnpnnppx............................212222111211(1)可是如此多的变量,我们如何从这么多变量的数据中抓住主要的变量作为指标呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为z1,z1,…,zm(m≤p)。则xlxlxlzxlxlxlzxlxlxlzpmpmmmpppp.........................................................22112222121212121111(2)在(2)式中,系数lij由下列原则来决定:(1)zi与zj(i≠j;i,j=1,2,…,m相互无关);(2)量。z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,安徽科技学院《应用多元统计分析》课程设计论文xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。基本步骤为:确定分析变量,收集数据;原始数据的标准化处理;由标准数据求协方差矩阵;求R的特征值、特征向量和主成分的方差贡献率;提取主成分;求主成分分值,计算综合分值。2.1.1数据选取以及指标来源根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素。具体选择的指标为:x1:地区生产总值,单位:亿元;x2:第一产业产值,单位:亿元;x3:第二产业产值单位:亿元;x4:第三产业产值单位:亿元;x5:公路里程,单位:公里;x6:以及车辆拥有量,单位:万辆;其中,三大产业不仅考虑了区域经济总量,还考虑了江苏省经济结构对物流需求规模影响。(具体的原始数据见表1所示)安徽科技学院《应用多元统计分析》课程设计论文表12013年江苏省各地区6项主要指标地区x1x2x3x4x5x6江苏省区3825.7698.721694.962032.08758163.85江阴市1713.1932.211028.40652.58234714.47常州市区1919.4244.111098.67776.64385929.56常熟市1230.7026.93691.77512.00304213.51张家港市1402.0019.98870.32511.70145211.52太仓市612.0124.66355.35232.0011686.41南通市区1144.9041.32652.70450.88305115.91启东市359.5049.29188.48121.7326394.30如皋市355.1536.97198.28119.9029974.31海门市415.0033.43247.97133.6022564.03扬州市区830.8719.77483.79327.3118989.59仪征市227.2913.05137.2776.9714571.90江都市402.0832.63228.04141.4121163.64镇江市区741.2616.51442.62282.1314767.73丹阳市502.2129.38285.37187.4619914.55扬中市213.487.56125.8480.089581.82句容市215.1221.60119.2574.2723071.56泰州市区458.5311.79291.89154.8510454.77靖江市364.4315.41214.69134.3311823.38泰兴市337.0727.01193.23116.8319673.26安徽科技学院《应用多元统计分析》课程设计论文数据来源:江苏省统计年鉴20132.1.2先用因子分析对数据处理我们要考虑的是:如何根据这些经济指标,对各个地区进行综合评价与排序?因子分析也是一种降维,简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观察数据中的基本结构,在研究江苏省沿江地区物流发展示所涉及的指标很多,过多的指标容易导致分析过程复杂化。一个合适的做法就是从这些关系错综复杂的经济指标中提取少数几个主要因子,每个主要因子都能反映相互依赖的社会经济指标见共同作用,因此选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素,抓住这些主要因素就可以帮我们对复杂的物流发展问题进行深入分析,合理解释和正确评价。2.1.3因子载荷aij的统计对于因子模型:imimjijiiifafafafax......2211,pi,...2,1我们可以得到xi与fi的协方差为afffaffafxijjimkjkikmkjikikii,cov,cov,cov),cov(11设因子载荷矩阵为A,称第j列元素的平方和,即piijjag122,mj,...2,1为公因子fj对x的贡献,即gj2表示同一公共因子fj对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。三、模型求解安徽科技学院《应用多元统计分析》课程设计论文3.1以因子分析的结果进行主成分分析(一)主要运算结果分析变量共同反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子载荷阵中每行的因子载荷的平方和,提取的因子个数不同,变量共同程度也不同。从标准化数据出发,我们先计算这些指标的主成分,然后通过主成分的大小进行排序,对原始数据进行标准化处理。计算特征值、方差贡献率以及各指标的相关系数矩阵。利用SAS9.1.3软件对标准处理的数据进行处理。特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合得分如表4所示,表2方差分析表主成分初始特征值提取的主成分载荷的平方和特征值方差贡献率%累计方差贡献率%特征值方差贡献率%累计方差贡献率%15.429890.5090.505.429890.5090.5020.46587.7698.260.46587.7698.2630.05870.9899.2440.03610.6099.8450.00960.16100.00600100.00提取方法:主成分法提取主成分。如表2所示,利用因子分析的结果进行主成分分析,提取前2个特征值的主成分,这两个主成分的累计方差贡献率达到98.26%,表明提取的前2个主成分可以基本反映全部6个指标所具有的信息,能在一定程度上说明区域物流产业发展的综合因素,从特征向量我们可以写出6个主成分的具体形式如下:Prin1=0.419061x1+0.381547x2+0.399822x3+0.423129x4+0.400101x5+0.424067x6安徽科技学院《应用多元统计分析》课程设计论文Prin2=-0.312072x1+0.631509x2-0.489653x3-0.176339x4+0.477188x5-0.072414x6...利用SAS9.1.3统计软件进行数据的处理,得出相关系数矩阵的特征值(见表3),进而得到主成分的表达式可以表述为:表3各指标相关系数矩阵的特征量Prin1Prin2Prin3Prin4Prin5Prin6X10.419061-.3120720.104114-.007028-.219835-.817180X20.3815470.6315090.571777-.3555460.0439540.018578X30.399822-.4896530.4914940.3970040.2160010.393125X40.423129-.176339-.282026-.368583-.6301980.421100X50.4001010.477188-.35
本文标题:应用多元统计分析课程论文
链接地址:https://www.777doc.com/doc-2420257 .html