您好,欢迎访问三七文档
第四讲GIS空间数据分类与挖掘中山大学遥感与地理信息工程系一、GIS的数据众所周知:GIS的一个重要组成部分就是数据。数据类型:在开发一个特定的GIS时,要根据应用需求确定对各类数据的要求(交通,规划,国土等)。数据挖掘:随着GIS产业化的深入发展,越来越多的数据资料被不同数据生产部门数字化,因此需要根据用户需求进行选择,提取,加工和处理,以变成有效的信息和知识过程。数据质量:数据质量是指数据适用于不同应用能力的数据。一、数据类型空间数据的基本特征空间数据描述:现实世界各种现象的三大基本特征:空间、时间和专题属性。空间特征空间特征:指空间物体的位置、形状和大小等几何特征,以及与相邻物体的拓扑关系。人类对空间目标的定位一般不是通过记忆其空间坐标确定的,而是确定某一目标与其他更熟悉的目标间的空间位置关系进行定位的,而这种关系往往也就是拓扑关系。时间特征时间特征:是指空间数据总是在某一特定时间或时间段内采集得到或计算产生的,因此,GIS数据是动态的空间数据,必须进行动态更新和维护。专题特征专题特征(属性):指的是除了时间和空间特征以外的空间现象的其他特征。如地形的坡度、坡向、某地的年降雨量、土地酸碱度、土地覆盖类型、人口密度、交通流量、空气污染程度等数据的测量尺度对不确定现象的测量:就是根据一定的标准对其赋值或打分(模糊分析法)。命名式的测量尺度:也称作类型测量尺度,只对特定现象进行标识,赋予一定的数值或符号而不定量描述(定性分析法:如大中小企业定点分布)。次序测量尺度:是基于对现象进行排序来标识的(分级统计法:如人口分级统计)。比例测量尺度的测量值:指那些有真零值的数据(函数值法)。GIS数据种类1、基础制图数据基础制图数据包括地形数据和人文景观数据。1)图像结构(栅格)DOM,DRG2)拓扑图形结构(矢量)DLG2、自然资源数据3、调查统计数据4、数字高程(地面)模型数据(DEM,DTM)获取和存贮高程数据的方法有4种基本方法:规则格网法、离散等高线法、断面量测法和不规则三角网法。5、法律文档数据6、已有系统数据全球定位系统概念所谓全球定位系统(GPS,GlobalPositionSystem)是利用人造地球卫星来进行定位的。利用人造卫星不仅可以实现全球性的或区域性的高精度定位,而且还可以综合用于通信、交通管制、气象服务等,所以在军事和民用方面得到了广泛的应用。世界上第一个实用的卫星定位系统,是美国研制的子午仪(Transit)卫星导航系统,它于1964年正式投入使用,主要为美国海军服务,1967年对民用部门开放。全球定位系统概念GPS系统可在全球范围内/全天候为海上、陆上、空中、空间的用户连续地提供高精度的位置、速度和时间信息,并且有良好的抗干扰和保密性能。对导航定位、武器使用、交通管制、大地测量,以及精密测量等均具有重要意义。世界上一些科技发达国家都把发展GPS系统,作为促进整个无线电导航现代化的核心,把建成GPS系统作为无线电导航领域进入二十一世纪的重要标志之一。全球定位系统概念全球定位系统(GPS):卫星如何测距?GPS接收机如何与卫星同步产生伪码?GPS的误差与微分纠正GPS系统:美国NAVSTARGPSTRANSIT俄国GLONASS欧空局GEOSTAR全球定位系统概念GPS系统有21颗工作卫星,平均配置在6个轨道上。卫星发射用伪随机码(伪码)调制的二种频率(L1、L2)的信号,L1=1575.42MHz,L2=1227.6MHz。用户设备用测量到几颗卫星的距离的方法,来确定观察点的位置。它能连续提供三维位置(经度、纬度、高度)、三维速度和时间,实现近乎实时的导航定位。双频发射是为了供用户设备消除电离层对传播的影响。R-=c全球定位系统概念伪码有P码、Y码、C/A码三种。P码(或Y码)信号,定位精度高、保密性好,仅供美军和特许用户使用,实时定位精度约为10米。C/A码信号,供一般用户使用,定位精度将受到控制,计划限制在100米(2drms)范围。为了能获得更好的定位精度,已经相继采取了一些措施。例如,C/A码采用差分GPS技术,可以达到米级的定位精度;供测地用的采用无码技术的用户设备,可以达到厘米级的相对定位精度。全球定位系统概念陆地卫星在高约20183公里的近圆形轨道上运行,周期约12小时,每颗卫星绕地球运行二圈时,地球恰好绕其轴转一周。这样,每颗卫星每一个恒星日有1-2次通过同一地点的上空。这样的安排,使每一颗卫星每天至少能通过一个地面控制站的上空,因此地面控制站可全设在美国国内。由于恒星日(23小时56分03.6秒)与平阳日之差,卫星经过同一地点的时间,每天约要提前4分钟。R-=c航空遥感像片立体像对上测量高度并建立地面坐标系1)航空像片相对定向,建立航空像片坐标系;2)测量像点视差计算像点高度;3)建立地面坐标系。航空像片坐标向通用的地图投影坐标系的转换为正射影像。航测数字影像目前可以有两种方式获得:一是用高精度扫描仪对航空像片扫描得到数字影像;二是用数字摄影机直接得到数字影像。航天遥感数据航天遥感数据有下列优点:1)增大了观测范围。2)能够提供大范围的瞬间静态图像。3)能够进行大面积重复性观测,即使是人类难以到达的偏远地区也能够做到这一点。4)大大加宽了人眼所能观察的光谱范围。5)空间详细程度高(分辨率达0.2米)。遥感图像空间分辩率名义分辩率=图像某行对应于地面的实际距离/该行的象元素雷达是一种自身发射电磁能又回收这种能量的主动式系统,它又分为真实孔径雷达和合成孔径雷达。雷达图像有两种分辩率:一种是由其发送信号脉冲持续的时间和信号传播方向与地面的夹角决定的,称为距离分辩率。另一种分辩率是由雷达波束的宽度和地物离飞行底线的距离决定的,而波束宽度又与雷达波长成正比,与天线的长度成反比,这种分辩率被称为方位分辩率。数据特点扫描式传感器所获图像侧视雷达图像常见的卫星数据:目前世界上常用的卫星数据仍然是美国的陆地卫星(Landsat)专题制图仪(ThematicMapper,TM)、诺阿气象卫星的甚高分辩率辐射仪(NOAA-AVHRR)和法国SPOT卫星的较高分辩率传感器(HRV)数据及美国的SPACEIMAGING的IKNOS高分辨率卫星数据。地图概念地图一般分为普通地图和专题地图普通地图:是一般性的参考图,它主要用来表达七方面内容;居民地、道路、行政边界(境界)、地形、及地表覆盖(植被)、水系(江河湖海等)和典型目标物(独立地物)。地图概念专题地图:突出反映某一种或几种地图要素的地图。天气预测图——以天气类型、温度和降水空间分布为主的地图;旅游图——以介绍旅游景点位置和交通状况为主的地图;交通图——以介绍街区和公共交通状况为主的地图;地铁线路图——反映地铁站点位置、路径、中转位置等为主的地图;地图概念地势图——以反映地形起伏和山脉高程为主的地图;反映自然条件的专题地图有;地质图、土壤图、气候图、植被图、太阳能分布图、风能分布图、洋流图、潮汐图等;反映经济状况的专题图有:交通图、工业图、农业图、商业图、贸易图、水利图、电力图、渔业图、林业图、牧业图等。地图符号地图制作过程地图的制作大致可分下列步骤:1)调查分析地图用户的要求;2)确定制图目标,确定比例尺、投影、内容、设计符号、编制地图规范;3)收集数据、野外测量、像片判读、问卷调查;4)对数据进行鉴别、分析处理;5)转绘数据到基础底图上;6)进行地图综合,先选样区试验再对整个制图区域进行综合;7)进行地图编制;8)检查质量,检验精度等;9)修改后制版印刷。地图综合取舍实际上贯穿于整个制图过程中,它包括:分类:指的是将同样的或类似的制图对象划入一组。简化:实际上,取舍、分类和符号化都是为了简化细部.符号化:由于不可能将所有制图对象的实际形状按比例缩小到地图上,所以地图上要用符号。符号又分为两类:抽象符号或象形符号。地图综合分为两部分:1)图形综合对点状、线状、面状符号的综合需要不同的方法。2)内容综合内容综合有两个方面:取舍和分类。二、数据挖掘数据采集一、空间图形数据的采集二、非空间属性数据的采集三、空间数据和非空间数据的连接空间图形数据的采集1、手扶跟踪数字化输入1)数字化过程2)数字化方式数字化有两种基本方式:流方式和点方式。3、数字化仪的其它输入功能4、矢量到栅格数据的转换5、数字化的精度6、数据共享扫描数据处理过程二值化:将彩色或灰度扫描数据的像元用1位即用0和1表示。细化:将扫描图中的线划减细为分辨单元宽的线划。矢量化:将栅格数据转换为矢量数据。断线修复:由于扫描质量的影响或删除了某些符号造成一些矢量线不连续,连接断线即为断线修复。扫描数据处理过程(续)要素提取:选择需要的要素,剔除不需要的要素和噪声。符号识别:提取出符号的特征。属性赋值:对矢量化的要素赋予属性特征值。确定GIS数据需求寻找数据源,进行数据挖掘大地测量控制地籍测量航空测量遥感室外调查(土壤、植被、交通等)定点观察(地球物理、气象、水文、生态等)地形图人口普查工业/经济调查基础设施(通讯、电力、运输、医疗、教育等)有无所需的数据内容提取信息,模型和知识三、数据质量数据质量数据质量是指数据适用于不同应用的能力。数据质量的基本特点1)准确度(Accuracy)即测量值与真值之间的接近程度,可用误差来衡量。2)精度(Precision):即对现象描述的详细程度。3)不确定性(Uncertainty):指某现象不能精确测得,当真值不可测或无法知道时,我们就无法确定误差,因而用不确定性取代误差。4)相容性(Compatibility):指两个来源的数据在同一个应用中使用的难易程度。数据质量的基本特点5)一致性(Consistency):指对同一现象或同类现象的表达一致程度。6)完整性(Completeness):指具有同一准确度和精度的数据在类型上和特定空间范围内是否完整的程度。7)可得性(Accessibility):指获取或使用数据的容易程度。8)现势性(Timeliness):指数据反映客观现象目前状况的程度。1、空间数据质量的评价内容1、微观部分1)定位精度;2)属性精度;3)逻辑一致性;4)分解力。2、宏观部分1)完整性;2)时间性;3)数据档案;4)适用性数据的误差类型数据误差地形图的位置误差;地形图的属性误差;时域误差;逻辑不一致性误差;不完整性误差;数据的误差类型数据转换和处理的误差:数字化误差;格式转换误差;不同GIS系统间数据转换误差;数据的误差类型应用分析时的误差:数据层叠加时的冗余多边形;数据应用时,由应用模型引进的误差。这些误差分类对于了解误差分布特点、误差和处理方法、产生误差的特点有很多好处。常见的误差原因1)空间数据不完整主要因为数字化不完整。2)空间位置误差可能是较小的位移,也可能是较大的粗差。3)空间数据的比例尺错误和误差大多是在数字化时用了错误的比例因子引起的。常见的误差原因4)空间数据的变形误差来源有原数字化材料上的各种变形误差。5)空间与非空间数据的连接错误通常是在数字化时给空间实体输入了错误的识别符。6)在非空间数据本来完整无缺的情况下,数据库中发生数据不全的现象主要是键盘输入错误和漏输数据;数字化前的准备工作中编码不完全或编码错误等。2、数据的检核和存贮一、一般检查二、误差检核三、橡皮板变换和弯曲四、数据检核五、数据编辑1、修改各类差错2、数据更新六、数据存贮几何误差的检测和表达1)点误差2)线误差属性误差1)确定抽样方法系统抽样;等间距布点;随机抽样;对整个区域随机布点;分区抽样;按一定的样点个数在划分的每个区域随机布点;系统分区随机抽样:对整个区域内等面积分区,并在区内随机布点。2)确定抽样数1)使用其他方法确定每个样本的属性做为参考数据2)建立误差矩阵计算各种精确定度或误差的方法下面列出几个常用指标:总准确度:对角线样点数之和除以总样点数;生产者准确度;每个属性值的正确样点数除以该属性值总的验证样点数(列合计);使用者准确度:每个属性值的正确样点数除以该属性值的总数(行合计);错判误码差(Commiss
本文标题:4.GIS classifing and mining and spatial data(中山大学g
链接地址:https://www.777doc.com/doc-4097146 .html