您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 第五章GIS中的数据
第五章GIS中的数据导读:对空间数据的处理是GIS的核心功能,GIS中的数据通常描述三部分信息:空间信息(位置,空间关系等等),非空间的属性信息,时间信息。数据按照其测量尺度,可以分为定名、定比、间隔、比率量四种类型。由于各方面的原因,GIS数据存在着质量问题,了解数据质量有利于数据的正确使用,避免出现“GarbageIn,GarbageOut”的情形。数据质量可以通过元数据进行描述,简单的说,元数据是对数据的描述,在GIS应用不断发展、空间数据不断增长的情况下,元数据有助于数据的共享和有效使用。本章讲述了上述的内容。1.数据涵义与数据类型1.1数据的涵义1.1.1数据数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具体形式多种多样,如文本、图像、声音等都可以归入数据的范畴。虽然数据是信息的载体,但并非就是信息,只有理解了数据的含义、对数据做出解释,才能得到数据中所包含的信息。在计算机化的信息系统中,数据的格式往往与具体的计算机系统有关,随着载荷它的物理设备的形式而改变。信息系统对数据进行处理(运算、排序、编码、分类、增强等)就是为了得到数据中所包含的信息。在地理信息系统中,由系统建立者输入、机器存储的各种专题地图和统计图表是数据;系统软件中所包含的代码是计算机系统中的二进制数据;用户对地理信息系统发出的各种指令也是数据,等等。因此,地理信息系统的建立和运行,就是信息或数据按一定的方式流动的过程。数据的处理和解释是非常重要的环节。所谓数据处理,是指对数据进行收集、筛选、排序、归并、转换、检索、计算以及分析、模拟和预测的操作,其目的就是把数据转换成便于观察、分析、传输或进一步处理的形式;把数据加工成对正确管理和决策有用的数据;把数据编辑后存储起来,以供不断使用。数据处理是为了解释,而数据解释需要人的智慧、学识和经验。1.1.2地理数据(空间数据)的基本特征地理数据一般具有三个基本特征:属性特征(非定位数据),表示实际现象或特征,例如变量、级别、数量特征和名称等等。空间特征(定位数据):表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔坐标等。时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的等等(图5-1)。图5-1:空间数据的基本特性[JackDangermond,1984]1.2空间数据的类型在地理信息系统中,按照其特征,数据可分为三种类型:空间特征数据(定位数据)、时间属性数据(尺度数据)和专题属性数据(非定位数据)。对于绝大部分地理信息系统的应用来说,时间和专题属性数据结合在一起共同作为属性特征数据,而空间特征数据和属性特征数据统称为空间数据(或地理数据)。1.2.1空间特征数据空间特征数据记录的是空间实体的位置、拓扑关系和几何特征,这是地理信息系统区别于其他数据库管理系统的标志。空间特征指空间物体的位置、形状和大小等几何特征,以及与相邻物体的拓扑关系。位置和拓扑特征是地理或空间信息系统所独有的,空间位置可以由不同的坐标系统来描述,如经纬度坐标、一些标准的地图投影坐标或是任意的直角坐标等。人类对空间目标的定位一般不是通过记忆其空间坐标,而是确定某一目标与其他更熟悉的目标间的空间位置关系,而这种关系往往也是拓扑关系。如一所学校位于哪个路口或哪条街道。1.2.2专题特征数据专题特征指的是地理实体所具有的各种性质,如地形的坡度、坡向、某地的年降雨量、土地酸缄类型、人口密度、交通流量、空气污染程度等。这类特征在其他类型的信息系统中均可存储和处理。专题属性特征通常以数字、符号、文本和图像等形式来表示。1.2.3时间特征数据时间属性是指地理实体的时间变化或数据采集的时间等。严格地讲,空间数据总是在某一特定时间或时段内采集得到或计算产生的。由于有些空间数据随时间变化相对较慢,因而有时被忽略;有些时候,时间可以被看成一个专题特征。1.3空间数据的表示方法一般地,表示地理现象的空间数据可以细分为:类型数据:例如考古地点、道路线和土壤类型的分布等;面域数据:例如随机多边形的中心点、行政区域界线和行政单元等;网络数据:例如道路交点、街道和街区等;样本数据:例如气象站、航线和野外样方的分布区等;曲面数据:例如高程点、等高线和等值区域;文本数据:例如地名、河流名称和区域名称;符号数据:例如点状符号、线状符号和面状符号(晕线)等(如图5-2所示)。图5-2:地理信息系统中各种数据以及其表现2.数据的测量尺度对特定现象的测量就是根据一定的标准对其赋值或打分。为了描述地理世界,对任何事物都要鉴别、分类和命名。这些都是量测的组成部分。它们所使用的参考标准或尺度是不同的。测量的尺度大致可以分成四个层次,由粗略至详细依次为:命名或类型、次序、间隔以及比例。2.1命名(Nominal)量定性而非定量,不能进行任何算术运算,如一个城市的名字。命名式的测量尺度也称为类型测量尺度,只对特定现象进行标识,赋予一定的数值或符号而不定量描述。例如,可以用不同数值表示不同的土地利用类型、植被类型或岩石类型,但是这些数值之间无数量关系,对命名数据的逻辑运算只有“等于”或“不等于”两种形式,而其近似均值只能使用众数。2.2次序(Ordinal)量线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大到小被标为1,2,3,…,级别的序号越低,其危险性越大,但危险性到底有多大并未给予定量的表达。序数值相互之间可以比较大小,但不能进行加、减、乘、除等算术运算。次序测量尺度是基于对现象进行排序来标识的,如可以把山峰按高度分级为极高山、高山、中山、低山和丘陵等,将坡度分为陡、中、缓等。不同次序之间的间隔大小可以不同。对次序数据的逻辑运算除了“等于”与“不等于”之外,还可以比较它们的大小,即“大于”或“小于”。2.3间隔(Interval)量不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较大小,并且它们之间的差值大小是有意义的。间隔测量尺度与比例测量尺度相似,但是间隔尺度的测量值无真的零值。例如,温度是间隔尺度的数据而不是比例数据,因为它的“0”测量值随着所使用的不同温度测量单位而不同。不能说150F的温度是75F的温度的两倍,因为这个比例在使用摄氏单位时就改变了。相反,降水量是比例数据,因为它有真的零值。比例数据和间隔数据可用于加、减、乘、除等运算,而且可以求算术平均。*2.4比率(Ratio)量比例测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺度与使用的测量单位无关。与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。有关该类型属性域的例子很多,如年降雨量、海拔高度、人口密度、发病率等。比例数据或间隔数据可以比较容易地被转变成次序或命名数据。而命名数据则很难被转化成次序、间隔数据或比例数据。由此可见,尽管命名数据或次序数据便于使用,易于理解,但有时不够精确,不能用于较高级的算术运算。而比例数据或间隔数据比较精确,便于计算机处理,但是在较复杂的GIS应用中,往往上述几种测量尺度的数据均需用到。*与比率量不同,间隔量中的零值往往是人为规定的,如摄氏温标中零摄氏度,时间中的零点等等。图5-3:各种数据测量尺度以及其制图表现3.地理信息系统的数据质量地理信息系统是一个基于计算机软件、硬件和数据的集成系统,该系统主要通过空间及非空间数据的操作,实现空间检索、编辑及分析功能。在GIS的几个主要因素中,数据是一个极为重要的因素。在计算机软件、硬件环境选定之后,GIS中数据质量的优劣,决定着系统分析质量以及整个应用的成败。GIS提供的空间数据的分析方法被广泛用于各种领域,用于决策领域的数据,其质量要求应该是可知的或可预测的。3.1数据质量的基本概念3.1.1准确性(Accuracy)即一个记录值(测量或观察值)与它的真实值之间的接近程度。这个概念是相当抽象的,似乎人们已经知道存在这样的事实。在实际中,测量的知识可能依赖于测量的类型和比例尺。一般而言,单个的观察或测量的准确性的估价仅仅是通过与可获得的最准确的测量或公认的分类进行比较。空间数据的准确性经常是根据所指的位置、拓扑或非空间属性来分类的。它可用误差(Error)来衡量。3.1.2精度(Precision)即对现象描述的详细程度。如对同样的两点,精度低的数据并不一定准确度也低。精度要求测量能以最好的准确性来记录,但是这可能误导提供了较大的精度,因为超出一个测量仪器的已知准确度的数字在效率上是冗于的。因此,如果手工操作的数字化板所返回的坐标不可能依赖于比0.1mm还要准确的一个“真正的”数值,那么就不存在任何的点,在十分之一的地方是以mm表示的。3.1.3空间分辨率(SpatialResolution)分辨率是两个可测量数值之间最小的可辩识的差异。那么空间分辨率可以看作记录变化的最小距离。在一张用肉眼可读的地图上,假设一条线用来记录一个边界,分辨率通常由最小线的宽度来确定。地图上的线很少以小于0.1mm的宽度来画。在一个图形扫描仪中最细的物理分辨率从理论上讲是由设施的像元之间的分离来确定的。在一个激光打印机上这是一英寸的300分之一,而且在高质量的激光扫描仪上,这会细化十倍。如果没有放大,最细的激光扫描仪的线是看不到的,尽管这依赖于背景颜色的对照。因此,在人的视觉分辨率和设备物理分辨率之间存在着一个差异。一个相似的区别可以存在于两个最小距离之间,即当人操作者操作数字化仪时所区别的最小距离和数字化仪硬件可以不断地报告的最小距离。3.1.4比例尺(Scale)比例尺是地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例。地图的比例尺将决定地图上一条线的宽度所表现的地面的距离。例如,在一个1:10000比例尺的地图上,一条0.5mm宽度的线对应着5m的地面距离。如果这是线的最小的宽度,那么就不可能表示小于5m的现象。3.1.5误差(Error)定义出一个所记录的测量和它的事实之间的准确性以后,很明显对于大多数目的而言,它的数值是不准确的。误差研究包括:位置误差,即点的位置的误差、线的位置的误差和多边形的位置的误差;属性误差;位置和属性误差之间的关系。3.1.6不确定性(Uncertainty)地理信息系统的不确定性包括空间位置的不确定性、属性不确定性、时域不确定性、逻辑上的不一致性及数据的不完整性。空间位置的不确定性指GIS中某一被描述物体与其地面上真实物体位置上的差别;属性不确定性是指某一物体在GIS中被描述的属性与其真实的属性之差别;时域不确定性是指在描述地理现象时,时间描述上的差错;逻辑上的不一致性指数据结构内部的不一致性,尤其是指拓扑逻辑上的不一致性;数据的不完整性指对于给定的目标,GIS没有尽可能完全地表达该物体。3.2空间数据质量问题的来源从空间数据的形式表达到空间数据的生成,从空间数据的处理变换到空间数据的应用,在这两个过程中都会有数据质量问题的发生。下面按照空间数据自身存在的规律性,从几个方面来阐述空间数据质量问题的来源。3.2.1空间现象自身存在的不稳定性空间数据质量问题首先来源于空间现象自身存在的不稳定性。空间现象自身存在的不稳
本文标题:第五章GIS中的数据
链接地址:https://www.777doc.com/doc-2083417 .html