您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 能源与动力工程 > 地理数学模型-第二讲
地理数学模型第二讲山东师范大学人资环学院张晓青2020/10/16第二讲基础知识1.地理学、经济学研究的数据来源2.变量分类3.最常用的统计概念4.数据标准化5.数据缺失及处理6.相关分析与回归分析2020/10/161.主要数据来源世界银行数据库世界银行提供的统计数据中国统计信息网--国际统计年鉴贸易和环境数据库搜集了几百个贸易与环境的案例,按28种不同标准分类能源技术数据交换(ETDE)与能源数据库收集与交换能源研究与技术的信息,能源文献收藏量为世界第一中国国家统计局:《中国统计年鉴》《进度统计数据》(宏观经济数据)中国经济信息网数据库(付费)中国经济统计、行业、地区经济、企业等数据库中国自然数据库中国资源、环境、人口、社会经济等相关数据的集合国家基础地理信息系统变量分类第一种系统将变量归结为分类变量(categoricalvariable)、顺序变量(rankvariable)和数量变量(metricvariable)。G.R.Iversen等在《统计学:基本概念和方法》一书中,首先将回归分析的变量分为两大类:(1)自变量(independentvariable,独立变量),又叫解释变量(explanatoryvariable)。(2)因变量(dependentvariable,依存变量),又叫被解释变量explainedvariable,或响应变量(responsevariable)。第二个系统将变量归结为名义变量、次序变量和间隔变量。D.G.Kleinbaum等在《应用回归分析和其他多变量方法》一书中根据测度的水平给出了如下变量分类:名义(nominal)变量、次序(ordinal)变量和间隔(interval)变量。2020/10/16控制变量(controlvariable)内生变量(endogenousvariables)与外生变量在统计学和计量经计学的模型中,若一个变量或母体参数与误差项有相关性,这个变量或参数被称为“内生变量”。一个模型的自变项与因变项之间互为因果,就会导致内生性。虚拟变量(dummyvariables)性别季节地区2020/10/162020/10/163.最常用的统计概念均值(mean,average)方差(variance,var)和标准离差(standarddeviation,stdev)Excel函数:总体方差varp,抽样方差var,总体标准差stdevp,抽样标准差stdev协方差(covariance,cov或covar)SPSS软件处理数据的时候,采用的都是抽样方差和抽样协方差。计算协方差的Excel函数:covar。2020/10/16极差(range)计算极差Excel函数需要如下组合:max(x)-min(x)。标准误差(standarderror,ste)需要用到的Excel函数:标准误差所用的函数为steyx,检验系数用如下组合形式:steyx/abs(average(y))。变异系数(coefficientofvariation,C.V.)计算变异系数Excel函数需要如下组合形式:stdev/abs(average(x))。2020/10/16自由度(degreeoffreedom,df)统计学家对自由度的定义:为了得出所有观测值所需要的最小观测值的数目。总自由度:样品数目或者说样本容量减1,即n-1回归自由度:自变量数目,亦即解释变量数目,通常用字母k或者m表示。剩余自由度:样品数目减去变量数目再减1,或者总自由度减去回归自由度,即n-k-1或者n-m-1。总自由度=回归自由度+剩余自由度2020/10/164.数据标准化2020/10/164.数据标准化2020/10/165.数据缺失及处理数学方法的运用是以数据分析为基础的,但现实中我们很难取得完整无缺的数据。不仅社会经济现象的数据经常缺失,即便是自然科学的观测或者实验数据,有时也会因为种种原因而导致数据不全。在这种情况下,就需要我们根据相应的统计学方法对缺失的数据进行估计。大型统计分析软件SPSS可以采用多种不同的思路对数据拾遗补缺。2020/10/16无交互作用双因素方差分析(two-factorsanalysisofvariance)的误差平方和最小原理估计缺失数据2020/10/162020/10/162020/10/162020/10/162020/10/166.相关分析与回归分析科学研究的主要功能是借助因果关系进行解释和预测,回归分析和相关分析是我们利用建立数学模型的过程和结果进行解释和预测的重要途径。在地理研究中,回归分析和相关分析是最常用也最重要的两种统计分析技术,它们主要被用于回答一些定义明确的数值变量之间的关系问题。所谓回归分析(regressionanalysis),描述的是一个或多个自变量的变化如何引起因变量变化的一种统计分析方法;相关分析(correlationanalysis)则是描述两个数值变量间的关系强度问题。回归分析和相关分析在处理数值变量关系时可以互为补充、相辅相成。2020/10/16相关系数计算相关系数或者相似系数的Excel函数为correl或者pearson,语法为correl(数组1,数组2),或者pearson(数组1,数组2)。2020/10/162020/10/16回归分析线性回归是最基本的统计分析方法,一元线性回归又是基础的基础。所谓一元线性回归,就是基于一个自变量的线性方程式展开的回归分析过程,这个回归过程是所有回归分析中最简单的,因此又叫简单线性回归(simplelinearregression)。首先说明什么是线性(linearity),认识线性有助于我们理解后面的非线性(nonlinearity)。2020/10/162020/10/16最小二乘法(OLS)求解参数a、b2020/10/162020/10/16回归结果的检验2020/10/16最常用的检验方法有如下五种:相关系数检验(检验拟合优度)标准误差检验(检验预测精度)F检验(检验线性关系)t检验(检验相关强度)DW检验(判断模型预测误差是否来自随机干扰)。相关系数检验、F检验和DW检验属于整体性检验,用于评估整个模型;t检验属于局部性检验,用于评估模型参数。标准误差检验则分为回归标准误差检验和参数标准误差检验,前者属于整体性检验,后者属于局部性检验。有效回归与伪回归2020/10/16一次差分法SPSS回归模型—预测课堂练习年份最大积雪深度x(米)灌溉面积y(千亩)197115.228.6197210.419.3197321.240.5197418.635.6197526.448.9197623.445.0197713.529.2197816.734.1197924.046.7198019.137.42020/10/162020/10/16n15,不能借助DW检验准确判断2020/10/16序列自相关检验结论:不存在序列自相关2020/10/16
本文标题:地理数学模型-第二讲
链接地址:https://www.777doc.com/doc-7121951 .html