您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第3章空间数据的采集与质量控制
第3章空间数据的采集与质量控制主要内容3.1概述3.2地理参照系和控制基础3.3空间数据的分类和编码3.4空间数据的采集3.5GIS的数据质量3.1概述现实世界文字报告、遥感图象等数字化仪扫描仪解析测图仪键盘等编辑、接边、分层、图形与属性连接、加注记等空间数据库数据源?如何采集?质量如何?3.1概述一、数据源地图数据,遥感数据,文本数据,统计数据实测数据,多媒体数据,已有系统的数据二、数据采集将现有的上述类型数据转换成GIS可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理。三、数据质量控制GIS的数据质量是指GIS中空间数据(几何数据和属性数据)的可靠性,通常用空间数据的误差来度量。误差是指数据与真值的偏离。研究GIS数据质量对于评定GIS的算法、减少GIS设计与开发的盲目性都具有重要意义。精度越高,代价越大。GIS数据质量对保证GIS产品的可靠性有重要意义。3.2地理参照系和控制基础一、地理空间的数学建构最自然的面包括海洋底部、高山、高原在内的固体地球表面,起伏不定,难以用一个简洁的数学式描述。相对抽象的面,即大地水准面假设一个当海水处于完全静止的平衡状态时从海平面延伸到所有大陆下部,而与地球重力方向处处正交的一个连续、闭合的水准面。可用水准仪完成地球自然表面上任一点的高程测量。但地球的重力方向处处不同,处处与重力方向垂直的大地水准面显然不可能是一个十分规则的表面,且不能用简单的数学公式来表达,因此,大地水准面不能作为测量成果的计算面。椭球体模型为了测量成果计算的需要,选用一个同大地体相近的、可以用数学方法来表达的旋转椭球来代替地球---三轴椭球体。abc3.2地理参照系和控制基础二、地理参照系经纬度坐标系(地理坐标)对空间定位有利,但难以进行距离、方向、面积量算。笛卡儿平面坐标系便于量算和进一步的空间数据处理和分析。高程系统描述空间点在垂直高度上的特性--高程——由高程基准面起算的地面点的高度。1956年黄海高程系,1985年国家高程基准地图投影椭球体模型3.2地理参照系和控制基础三、GIS的地理基础--控制基础各种GIS的数据源、服务目的和各自特征可以不同,但均有自身统一的地理基础。地理基础是地理信息数据表示格式与规范的重要组成部分统一的地图投影系统统一的地理格网坐标系统(地理参照系)统一的地理编码系统3.2地理参照系和控制基础四、GIS与地图投影的关系地理基础(地图投影)数据输出(具有相应投影的地图)数据获取(不同投影的地图)数据标准化预处理(按某一参照系数字化)数据存储(统一的坐标基础)数据处理(投影转换)数据应用(检索查询、覆盖分析等)3.2地理参照系和控制基础五、GIS中地图投影设计与配置的一般原则所配置的投影系统应与相应比例尺的国家基本图(基本比例尺地形图,基本省区图或国家大地图集)投影系统一致。系统一般只考虑至多采用两种投影系统,一种应用于大比例尺的数据处理与输出、输入,另一种服务于小比例尺。所用投影以等角投影为宜。所用投影应能与网格坐标系统相适应,即所采用的网格系统(特别是一级网格)在投影带中应保持完整。3.2地理参照系和控制基础六、我国GIS常用的地图投影配置我国基本比例尺地形图(1:100万、1:50万、1:25万、1:10万、1:5万、1:2.5、1:1万、1:5000),除1:100万外均采用高斯—克吕格投影为地理基础;我国1:100万地形图采用了Lambert投影,其分幅原则与国际地理学会规定的全球统一使用的国际百万分之一地图投影保持一致。我国大部分省区图以及大多数这一比例尺的地图也多采用Lambert投影和属于同一投影系统的Albers投影(正轴等面积割圆锥投影);Lambert投影中,地球表面上两点间的最短距离(即大圆航线)表现为近于直线,这有利于地理信息系统中空间分析量度的正确实施。3.3空间数据的分类和编码一、空间数据的组织分层区域分块空间数据库GIS应用大范围地理区域合理组织面向对象组织矩形分块经纬度分块3.3空间数据的分类和编码二、地理数据的分层空间数据可按某种属性特征形成一个数据层,通常称为图层(Coverage)。1、空间数据分层方法:专题分层每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层、居民地层等。时间序列分层即把不同时间或不同时期的数据作为一个数据层。地面垂直高度分层把不同时间或不同时期的数据作为一个数据层。Z时间序列专题分层3.3空间数据的分类和编码三、空间数据的分类与编码分类、编码点、线、面特征码、坐标信息世界三、空间数据的分类与编码1.属性数据编码在属性数据中,有一部分是与几何数据的表示密切有关的。例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。编码是指确定属性数据的代码的方法和过程。代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。三、空间数据的分类与编码2.分类编码分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事分类是人类思维所固有的一种活动,是认识事物的一种方法。分类的基本原则:科学性、系统性、可扩性、实用性、兼容性、稳定性、不受比例尺限制、灵活性三、空间数据的分类与编码3、分类码和标识码分类码示例标识码示例一、输入前准备1、资料准备,区域标定基础原始数据的确定数据分类项目的确定数据标准的准确性的确定2、进行三个统一:即确定投影、比例尺、分类分级编码3、所用软件的检查、试用菜单准备及其它辅助工作。4、硬件检查。5、精度试验。6、试验,样区、单项试验。3.4空间数据的采集3.4空间数据的采集二、几何图形数据的采集手工数字化数字化仪数字化扫描数字化解析测图法已有数据转入扫描转换拼接子图块裁剪地图屏幕跟踪矢量化矢量图合成、接边矢量图编辑纸质地图空间数据库扫描数字化流程屏幕跟踪矢量化流程准备扫描图像栅格图像配准新建数字化图层屏幕跟踪矢量化地图选择投影和单位输入控制点编辑控制点三、属性数据采集1、键盘,人机对话方式2、程序批量输入。a1a2001002001002程序空间数据库四、属性和几何数据的连接1、可手工输入2、由系统自动生成(如用顺序号代表标识符)标识码属性数据几何数据3.4空间数据的采集五、空间数据的编辑和检核1、空间数据输入的误差1)几何数据的不完整或重复。2)几何数据的位置不正确。3)比例尺不正确。4)变形。5)几何数据与属性数据的连接有误。6)属性数据错误、不完整。键盘输入错误,漏输数据或属性错误分类、编码等。2.空间数据的检查1)通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误;2)在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误;3)把数字化的结果绘图输出在透明材料上,4)对等高线,通过确定最低和最高等高线的高程及等高距,编制软件来检查高程的赋值是否5)对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边6)对于属性数据,通常是在屏幕上逐表、逐行检查,7)对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出了范围,等等8)对于图纸变形引起的误差,应使用几何纠正来进行处理。3.4空间数据的采集1、GIS数据质量1)位置(几何)精度:如数学基础、平面精度、高程精度等,用以描述几何数据的误差。2)属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性数据的质量。3)逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等,由几何或属性误差也会引起逻辑误差。4)完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性,数据层完整性,检验完整性等。5)现势性:如数据的采集时间、数据的更新时间等。一、GIS的数据质量的内容3.5GIS的数据质量逻辑误差资料来源于张超主编的《地理信息系统实习教程》所配光盘2、误差产生的主要原因具体分析原因一、GIS的数据质量的内容3、误差的具体来源阶段误差来源数据采集实测误差,地图制图误差(制作地图的每一过程都有误差),航测遥感数据分析误差(获取、判读、转换、人工判读(识别要素)误差)数据输入数字化过程中操作员和设备造成的误差,某些地理属性没有明显边界引起的误差(地类界)数据存贮数字存贮有效位不能满足(由计算机字长引起,单精度、双精度类型)空间精度不能满足数据操作类别间的不明确、边界误差(不规则数据分类方法引起)多层数据叠加误差多边形叠加产生的裂缝(无意义多边形)各种内插引起的误差数据输出比例尺误差、输出设备误差、媒质不稳定(如图纸伸缩)成果使用用户错误理解信息、不正确使用信息一、GIS的数据质量的内容4、误差传播误差传播可分为三类:1)代数(算术)关系如差、倍数、线性关系,有一套成熟的经典测量误差理论处理。2)逻辑关系a、布尔逻辑关系:GIS中存在大量的逻辑运算,如叠置分析。b、不精确推理关系:如专家系统中的不精确推理。逻辑关系下的误差传播正处于研究中,需要借用信息论,模糊数学、人工智能、专家系统等学科有望解决。一、GIS的数据质量的内容二、GIS数据质量的评价方法1、直接评价法1)用计算机程序自动检测某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或平均质量等级也可由计算机软件算出。此外,还可检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。2)随机抽样检测2、间接评价法-----(地理相关法和元数据法)指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。3、非定量描述法通过对数据质量的各组成部分的评价结果进行的综合分析来确定数据的总体质量的方法。三、数字化的误差评价和质量控制1)自动回归法由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。2)ε-Band法该方法适用于任何类型的GIS数据,关键是如何给出合理的ε值。1、评价数字化误差的方法3)对比法把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比法进行对照检查。ε-Band2、数字化过程中的质量控制1)数字化预处理工作:包括对原始地图、表格等的整理、清绘。2)数字化设备的选用:根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数的进行挑选,这些参数不应低于设计的数据精度要求。3)数字化对点精度(准确性):数字化时数据采集点与原始点的重合程度,一般要求对点误差小于0.1mm。4)数字化限差:包括:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)等。5)数据的精度检查:输出图与原始图之间的点位误差,一般要求对直线地物和独立地物,误差小于0.2mm,对曲线地物和水系,误差小于0.3mm,对边界模糊的要素应小于0.5mm。三、数字化的误差评价和质量控制四、数据处理中数据质量的评价主要受原始资料的精度(采样密度、测量误差、地形类别、控制点等)和内插的精度(内插方法、地形类型、原始数据的密度等)的影响。DEM的内插精度主要受原始采样点的采样密度的影响,与不同的插值方法的关系不很大。但在DEM精度评定的标准方面、地貌逼真度方面、DEM的粗差探测等方面仍没有得到圆满的解决。目前,对DEM精度的评价常采用原始等高线与再生等高线叠合评价的方法。1、数字高程模型(DEM)的精度原始等高线DEM重新生成等高线原始等高线与重新生成等高线叠加内插自动追踪2、矢量数据栅格化的误差属性误差:在矢量数据转换为栅格数据后,栅格数据中的每个象元只含有一个属性数据值,它是象元内多种属性的一种概括。象
本文标题:第3章空间数据的采集与质量控制
链接地址:https://www.777doc.com/doc-436475 .html