您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 人文地理学中的数学方法
-1-人文地理学中的数学方法蒋晓攀(河南大学环境与规划学院08地理科学学号:080260043)摘要:现在地理学的发展已经进入了现代地理学阶段。人文地理学的内部也先后出现了计量革命、理论革命、行为革命等思潮。现代科学技术的发展为人文地理学的研究提供了新的研究方法和手段,特别是计量方法和数学模型在人文地理学中的应用,使人文地理学的研究由定性分析走向定量分析。因此对人文地理学中所应用的数学方法的学习显得尤为重要。通过查阅资料浏览文献,学习一些简单的数学方法在研究中应用的实例,初步学习了数学方法在人文地理学中应用的基础。文章通过人文地理学论文中数学方法应用举例,简单介绍回归分析方法、系统聚类分析方法、主成分分析方法、灰色系统方法、模糊层次分析方法、空间自相关方法等数学方法在人文地理学研究中的运用。⒈回归分析方法回归分析方法是研究要素之间具体数量关系的一种强有力的工具。回归分析方法主要用于相互关系分析,主要是对地理要素地理事物之间的相互关系进行定量分析,可以找出地理要素之间的定量表达式,建立反映地理要素之间关系的具体数学模型,即回归模型。因地理要素之间的关系有线性的也有非线性的所以回归模型有线性模型和非线性模型。回归分析方法还可用于趋势面的分析。用回归分析方法计算出所要分析的地理要素的趋势面方程,去拟合地理要素分布的空间形态,进而进行研究。回归分析还可用于过程模拟与预测研究。通过回归分析方法对地理过程进行模拟和拟合,揭示地理要素、地理现象随时间的变化规律从而对其未来发展趋势做出预测。下面列举的是回归分析方法用于找出地理要素之间的数量关系。《地理科学》第29卷第5期《城市紧凑度的总和测度及驱动力分析——以江苏省为例》一文运用回归分析的方法对城市紧凑度及主要驱动力进行了分析,得出制度调控力、市场拉动力、人口推动力对江苏城市紧凑度影响显著,交通引导力还需要进一步加强的结论。其具体过程如下:通过城市紧凑度驱动力的定性分析得出紧凑城市其驱动力因子应包括:制度调控力、市场拉动力、人口推动力和交通引导力,并且他们不是相互独立的而是相互联系的。为了比较着四方面的驱动力因子对江苏省13城市紧凑度的作用大小,以城市紧凑度为因变量,选取如表2(《地理科学》29卷第五期P629中间表2)20个有形物质的“密度”和“形态”部分指标分别代表四个驱动力因子建立回归模型。考虑到影响因变量Y的因素有很多,所选20个指标之间可能存在共线性,因此用逐步回归的方法分析。分析结果发现:人均工业总产值、人均GDP、建成区与市区面积比重、万人拥有公交车辆和从业人口密度指数这五个指标回归效果最好,且各指标间膨胀系数极小。回归模型概述相关系数R决定系数R^2调整相关R^20.9990.9980.997-2-回归方差分析方差来源平方和df均方差F值P值回归0.415750.0831816.2060.0001剩余0.000770.0001总的0.416412决定系数高达0.998,F值高达816.206,表明用逐步回归对总方差的解释是有显著效果的,也反映了回归方程效果显著。据此可以建立城市紧凑度与分析得出的五项指标的回归方程:Y=0.0403+0.0289X1+0.000002X2+1.6849X3+0.00154X4+0.9958X5从回归系数看建成区展示区面积比重对城市紧凑度的贡献最为显著,其次为从业人口密度指数、人均工业总产值和人均GDP。⒉系统聚类分析方法聚类分析亦称群分析和点群分析,它是研究多要素事物分类问题的数量方法。其基本原理是:根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量的确定样本之间的亲疏关系,并按照这种亲疏关系程度对样本进行聚类。聚类分析方法是定量的研究地理事物分类问题和地理分区问题的重要方法。主要用于类型研究,对地理事物的类型和各种地理区域进行定量化分如:土地类型地带及自然区和经济区的划分问题等等。在《人文地理》2009年第6期《济南高新技术开发区产业集群及其核心竞争力的分析》一文中作者对济南高新技术产业不同产权形式和不同行业类型企业的地位和贡献进行分析,运用聚类分析方法开展了不同企业的绩效评价。其过程如下:依据济南市高新技术开发区《规模以上工业企业价值总量综合指标》,企业工业总产值、资产总计、所有者权益合计、利润总额、亏损企业亏损总额、应交所得税等主要指标按不同产权形式和不同行业类型计算出企业工业总产值均值、资产总计均值、利润总额均值,然后将这些均值数据进行聚类系统分析。分析结果如下表:不同行业聚类结果类别特征企业第一类工业总产值均值较低,资产总计均值高,利润总额均值较高通用设备制造业、电气机械及器材制造、交通运输设备制造业、专用设备制造业第二类工业总产值均值高,资产总计均值高,利润总额均值高非金属矿物制品业、通信计算机及其他电子设备制造业第三类工业总产值均值高,资产总计均值低,利润总额均值高服装、鞋、帽制造业第四类工业总产值均值低,资产总计均值低,利润总额均值低采矿业、食品制造业、家具制造业、纸制品制造及印刷业、化学原料及化学-3-制品、医药制造业、塑料制品业、金属制品业、通用仪器仪表制造不同产权聚类分析特征企业第一类工业总产值均值较高,资产总计均值较低,利润总额均值高港澳台商投资企业、外资企业第二类工业总产值均值低,资产总计均值低,利润总额均值低国有企业、集体企业、私营企业、股份合作企业第三类工业总产值均值最高,资产总计均值最高,利润总额均值最高中外合资经营企业⒊主成分分析主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,是数学上对数据做降维处理的一种重要方法,相对更为客观且变量维数降低便于描述理解和分析。《地理科学》2009年第4期《浙江省新型工业化地域差异及其机理研究》文章中用主成分分析法尽力新型工业化水平评价体系。文章选取了14项指标为新型工业化内涵评价的基本分析变量:反应工业化进程的变量有人均GDP(X1)工业劳动生产率(X2)反映工业化规模的变量有规模以上企业数量(X3)城市建设规模(X4)工业固定资产投资(X5)反映工业化结构的变量有第二产业产值比重(X6)第三产业从业人员比重(X7)反映科技文化程度的变量有地方财政科教支出(X8)信息产业从业人员数(x9)全社会专业人员数(X10)反映工业化集约水平的变量有万元工业产值耗水量(X11)万元工业产值耗电量(X12)反映工业化环境效应的变量有环境公共管理人员数(X13)城市绿化覆盖率(X14)以此构建浙江新型工业化空间差异分析的指标体系。以浙江省69个县市的指标为样本,以上述14个指标的标准化数据为变量构建矩阵,采用SPSS软件对数据进行处理,采用KOM样本测度进行检验,得出KOM系数为0.862,大于0.7说明很适合做因子分析。通过矩阵的特征根和相应的方差贡献率来选择主成分,并得到因子提取结果和因子回归系数。根据对新型工业化内涵的理解,按特征根大于1的原则选取主成分,根据SPSS软件计算结果可以选取三个特征根为主成分,其累计方差贡献率达到80%以上,但是鉴于得到的因子提取结果还不能明显的反应主成分所包含的指标信息,所以对其进行正交方差最大旋转,根据旋转之后的因子提取结果和因子回归系数,确定主成分如下:第一主成分对X1、X3、X4、X5、X8、X9、X10等指标具有绝对值较大的负荷系数,是表征工业化规模经济效益,人力资源状况和科技化程度的指标。第二主成分对-4-X2、X6、X7等指标具有绝对值较大的负荷系数,是表征工业化进程与结构的指标。第三主成分则主要对应X11、X12、X14等指标是表征工业化环境友好与资源集约利用的指标。以所选主成分的方差贡献率为权数,将各个因子得分进行综合,得出每个样本的综合指数iS,iSkikVY式中iS表示第i个县市的主成分综合指标,kV表示所选用的第k个主成分的方差贡献率,然后根据综合指数进行分类排序。⒋空间自相关空间自相关是衡量不同空间单元相互关联性的主要方法,是检验某一现象是否显著的与其相邻空间单元的现象相关联的重要指标。通过对空间现象分布格局的可视化描述,发现空间集聚和空间异常,揭示研究对象之间的空间作用机制,为进行区域差异的空间分析提供了有效方法,有利于克服传统的统计方法在进行研究区域经济差异方面的不足。根据空间研究目的的不同空间自相关可分为全局空间自相关和局部空间自相关,全局空间自相关是通过对属性值的空间特征的整体描述,揭示区域整体的空间关联和空间差异程度。《地理研究》第28卷第2期《省际边缘区域经济发展差异时空格局及驱动机制——以淮海经济区为例》一文就采用了全局自相关分析方法,对1996~2005年淮海经济区经济差异的时空特征、趋势及驱动机制进行了初步探索。文中采用Moran′sI方法,其计算公式为:I=s21ninijijninijjiwxxxxwij11))((式中n为研究单元的数目,Xi为观测值,x为Xi的平均值,ijw为研究范围内空间单元i与j的空间连接矩阵,若i与j之间存在公共边界属于邻居关系则ijw=1否则ijw=0。依据上述方法计算出Moran′sI值介于-1与1之间,Moran′sI值越接近于1,表示经济发展水平较高(或较低)的区域在空间上的集聚性越显著,趋同效应越明显,反之Moran′sI值越接近于-1,区域与其周边区域经济发展水平的趋异性越显著,而趋近于0时,则表明区域各个单元相互独立,空间上呈随机分布。淮海经济区经济发展综合水平Moran′sI与变量系数1996~2005年份1996199719981999200020012002200320042005变异系数0.25810.30340.23340.26010.30220.21080.35770.37790.32240.3454Moran’sI0.09840.15550.28540.28410.16460.37420.08920.23970.17570.2330上表显示1996~2005年淮海经济区经济差异整体上呈波动性扩大态势,同期Moran′sI值全部为正且整体上呈增大趋势,表明1996年以来淮海经济区经济发展水平相似的县域在地理空间上集中分布,及经济发展水平较高的城市区域相邻,而较低的县域则趋于与较低的县域与相邻而且随时间的推移这一趋势还在加-5-强。⒌模糊层析分析法层次分析法(AnalysisHierarchyProcess简称AHP)是一种对非定量事件处理的多目标决策方法,该方法的关键步骤是构造判断矩阵,其量化通常采用1-9标度,有时由于决策者对事物认识的多样性以及客观事物的复杂性,从而使不同决策者对决策对象有不同的偏好,给出的判断矩阵不能很好地反映实际,这样就出现了“不确定性”。模糊层次分析法对客观存在的“不确定性”采用了[0,1]区间进行定性描述,基于模糊集合理论的模糊一致关系和模糊一致矩阵,在评价含有多指标、带有模糊性的方案优选中能得到更加满意的优选结果。《人文地理》2009年第1期《乡村人居环境的居民满意度评价及其优化策略研究——以以石首市久合埦乡为例》一文运用了模糊综合评价法对乡村人居环境满意度进行评价。文章从四个领域构建了乡村人居环境满意度评价的支持层(乡村自然生态环境满意度、乡村基础设施满意度、乡村建筑质量与设计满意度、乡村社会关系与服务满意度),各支持层由指标层构建,最后采用算术平均法将德尔菲法和模糊层次分析法计算所得权重进行组合,得到个指标的权重。设权重向量集为W,定义评价集矩阵V=(v1、v2、v3、v4、v5)其中v1、v2、v3、v4、v5依次为非常不满意、较不满意、一般、满意、非常满意。定义支持层评价矩阵kR=(ijr)m×n,k=1、2、3、4;m为个支持层评价指标的个数,n为评价等级个数。ijr是通过闭卷调查的数据统计整理所
本文标题:人文地理学中的数学方法
链接地址:https://www.777doc.com/doc-2737081 .html