您好,欢迎访问三七文档
相关分析一、相关关系的概念在自然界和社会中存在的许多事物或现象,彼此之间都是有机的相互联系着,相互依赖着,相互制约着。在地理系统中,各要素之间也具有一定的联系,所有要素之间的相互关系都可以通过数量关系反映出来。现象或要素之间的相互联系可以分为两种不同的类型。即函数关系和相关关系。(一)函数关系它反映着各要素或现象之间存在着严格的依存关系,也就是具有确定性的对应关系,在这种关系中,对于某一变量的每一个数值都有另一个变量的确定值与之相对应,并且这种关系可用一个数学表达式反映出来。这种关系在地理各要素间较少见,因为许多地理要素的变化具有随机性的缘故若两个现象x、y有严格的直线依存关系,则其函数关系还可用右图表示。xy函数关系的例子–某种商品的销售额(y)与销售量(x)之间的关系可表示为–圆的面积(S)与半径之间的关系可表示为–企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为)(为单价pxpy2rs321xxxy(二)相关关系它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,不能由一个(或几个)要素(或变量)的值精确地求出另一个要素(或变量)的值。这种关系有二个明显特点:1.要素之间确实存在数量上的依存关系,即两个要素之间,一个要素发生数量上的变化,另一个要素也会相应地发生数量上的变化。例如,身体高的人一般讲体重也要重一点;劳动生产率提高相应地会使成本降低,利润增加等等。在具有相互依存关系的两个变量中,作为根据的变量叫做自变量,发生对应变化的变量叫做因变量。自变量一般用X代表,因变量用Y代表。2.要素之间的这种依存关系是不严格的,即无法用数学公式准确表示。在相关关系中,对于某项标志的每一数值,可以有另外标志的若干个数值与之相适应,在这些数值之间表现出一定的波动性,但又总是围绕着它们的平均数并遵循一定的规律而变化。例如,每亩耕地的施肥量与亩产量之间存在着一定的依存关系。一般条件下,施肥量适当增加,亩产量便相应地提高,但因亩产量增长与施肥量增长的数值之间,并不存在严格的依存关系;因为对每亩耕地的产量来说,除了施肥量多少这一因素外,还受到种子、土壤、降雨量等其他因素的影响,这就造成即使在施肥量相同的条件下,其亩产量也并不完全相等。但即使如此,它们之间仍然存在着一定的规律性,即在一定范围内,随施肥量的增加,亩产量便相应地有所提高。相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系xy若要素间的这种不严格的依存关系近似于一种直线关系,则其相关关系的图示如右。相关关系与函数关系有区别,但是它们也有联系。由于观察或测量误差等原因,函数关系在实际中往往通过相关关系表现出来。在研究相关关系时,又常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现形式。商品消费量与居民收入之间,当居民收入发生变动,商品消费量也会随之发生变动。所以,居民收入为自变量X,而商品消费量为因变量Y。在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。如一般地1.按相关关系涉及的因素多少来分,可分为:单相关和复相关。在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。二、相关关系的种类2.按相关关系的表现形式来分,可分为:直线相关和曲线相关直线相关是指两个相关要素之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。曲线相关是指两个相关要素之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。曲线相关直线相关3.从直线相关变化的方向来划分,分为正相关和负相关正相关是指两相关现象变化的方向是一致的。自变量x的数值增加,因变量y的数值也相应的增加。例如,施肥量增加,亩产量也增加。正相关负相关是指两相关现象变化的方向是相反的。自变量x数值增加,因变量y数值相应减少;或者自变量数值减少,因变量数值相应增加。例如,产品生产越多,生产成本越低;商品价格降低,商品销售量增多。负相关4.按相关程度分,可分为:完全相关、不完全相关和不相关完全相关就是相关要素之间的关系是完全确定的关系,两种要素中一个要素的数量变化,随另一个要素的数量变化而确定,这两种现象间的依存关系,就称为完全相关,如,在这种情况下,相关关系就是函数关系。不相关是指两现象之间在数量上的变化上各自独立,互不影响。如企业生产成本与工人年龄之间,一般是无相关的。不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。2rs负线性相关正线性相关完全负线性相关完全正线性相关曲线相关不相关三、相关分析的主要内容1、相关分析:是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。2、地理相关:应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标。3、所谓相关程度,就是要研究它们之间的相互关系是否密切;所谓相关方向,又可分为两种,即正相关和负相关。概念主要内容相关分析的目的就是从现象的复杂关系中消除非本质的偶然影响,从而找出现象间相互依存的形式和密切程度以及依存关系变动的规律性。1、确定现象之间有无关系,以及相关关系的表现形式这是相关分析的出发点。有相互依存关系才能用相关方法进行分析,没有关系而当作有关系就会使认识发生错误。关系表现为什么样的形式就需要使用什么样的分析方法,把曲线相关当作直线相关来进行分析,也会使认识发生偏差。2、确定相关关系的密切程度即从不严格的关系中判断其关系的密切程度。判断的主要方法,就是把自变量和因变量的数据资料编制成散布图或相关表,帮助我们做一般分析,判断相关的密切程度,进而计算出相关系数。3.测定两个变量之间的一般关系值;4.测定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;5.相关系数的显著性检验。简单线性相关分析定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。一、相关关系的判定(一)相关表将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。二、相关表和相关图某市1996年—2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。序号年份工资性现金支出(万元)x城镇储蓄存款余额(万元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510例1:简单相关表和相关图从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。(二)相关图50100150200250300350400450500550400500600700800900100011001200工资性现金支出(万元)城镇储蓄存款余额(万元)三、相关系数与应用相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用样本数据计算,记为r;若用总体全部数据计算,则称为总体相关系数,记为。(一)相关系数定义(二)相关系数r的测定方法:1、r的计算(积差法)22)()())((yyxxyyxxr2222yynxxnyxxynr简化后为:2、对r的解释如下:(即r的特点)(1)r取正值或负值决定于分子协方差;(2)r的分布范围,介于-1和1之间,即;(3)当r为正值时,表示两个要素或变数之间为正相关,当r为负值时,表示两个要素或变数之间为负相关;(4)r的绝对值大小,可说明现象之间相关关系的紧密程度.r的绝对值越大,表示两个要素间相关程度越密切-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加11rrrrr0.3时,没有关系;0.3≤0.5时,称低度相关;0.5≤0.8时,称显著相关(或中度相关);≥0.8时,称高度相关;一般标准如下:相关系数r的数值越接近于1(+1或-1),表示相关关系越强;越接近于0,表示相关关系越弱用例1的数据计算如下:序号年份x(万元)y(万元)x2y2xy119965001202500001440060000219975401402916001960075000319986201503844002250093000419997302005329004000014600052000900280810000784002520006200197035094090012250033950072002105045011025002025004725008200311705101368900260100596700合计648022005681200760000203530098.0111418592026400220076000086480568120082200648020353008222222yynxxnyxxynr(2)顺序(等级)相关系数(rs)16122nndris顺序相关不但适用于量的资料的相关分析,同时亦适用于质的资料。表示两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数或等级相关系数。数代表所使用资料的样本之间的顺序之差代表两个变量nd月份123456789101112气温-4.7-2.34.413.220.224.226.024.619.512.54.0-2.8地温-3.6-1.45.114.522.326.928.226.521.113.44.6-1.9北京市各月平均气温与5cm平均地温月份平均气温T平均气温顺序号Ts5cm平均地温Tds5cm平均地温序号Tdsd=(TS-Tds)d21-4.712-3.612002-2.310-1.4100034.485.1800413.2614.5600520.2422.3400624.2326.9211726.0128.2100824.6226.53-11919.5521.15001012.5713.4700114.094.690012-2.811-1.91100合计2993.011212261161222nndris序号产品产量(千吨x)生产费用(万元y)11.26222.08633.18043.811055.011566.113277.213588.0160合计36.4880产品产量和生产费用相关表序号产品产量(千吨x)生产费用(万元y)x2y2xy11.2621.44384474.422.0864739617233.1809.61640024843.811014
本文标题:相关分析(1)
链接地址:https://www.777doc.com/doc-3725904 .html