您好,欢迎访问三七文档
2014.3.7空间数据在计算机中分层表示数据层栅格数据栅格数据表达中,栅格由一系列的栅格坐标或像元所处栅格矩阵的行列号(I,J)定义其位置,每个像元独立编码,并载有属性。栅格单元的大小代表空间分辨率,表示表达的精度。在影像中,栅格单元的值是栅格内的平均灰度。栅格数据遥感数据将经过分类解译的遥感影像数据直接或重采样后输入系统,作为栅格数据结构的专题地图。图片的扫描逐点扫描专题地图,将扫描数据重采样和再编码得到栅格数据文件。矢量数据转换而来数字化仪手扶或自动跟踪数字化地图,得到矢量结构数据后,再转换为栅格结构;或者运用矢量数据栅格化技术,利用GIS直接进行转换,为了有利于某些操作或者有利于输出。手工方法获取在专题图上均匀划分网格,逐个网格地决定其代码,最后形成栅格数字地图文件,也叫目读法。以规则的像元阵列来表示空间地物或现象的分布的数据结构,其阵列中的每个数据表示地物或现象的属性特征。换句话说,栅格数据结构就是像元阵列,用每个像元的行列号确定位置,用每个像元的值表示实体的类型、等级等的属性编码。1、点实体:表示为一个像元;2、线实体:表示为在一定方向上连接成串的相邻像元的集合;3、面实体:表示为聚集在一起的相邻像元的集合点线面在栅格结构中,地表被分成相互邻接、规则排列的矩形方块(特殊的情况下也可以是三角形或菱形、六边形等。每个地块与一个栅格单元相对应。栅格数据的比例尺就是栅格大小与地表相应单元大小之比。(a)三角形(b)菱形(c)六边形行西南角格网坐标(XWS,YWS)格网分辨率格网方向列单个格网代表点,一系列相邻格网单元代表线,邻接格网的集合代表面。格网中的每个格网单元有一个值,整型或浮点型。整型格网单元值通常代表类别数据。浮点型格网单元值常表示连续数据。格网中的每一单元值代表了由此行此列决定的该位置上的空间现象的特征。栅格数据模型不把空间数据与属性数据明确分开。如以像元边线计算则为7,以像元为单位则为4。三角形的面积为6个平方单位,而右图中则为7个平方单位,这种误差随像元的增大而增加。abc345abcac距离:7/4(5)面积:7(6)栅格数据的比例尺就是栅格的大小与地表相应单元的大小之比,当像元所表示的面积较大时,对长度、面积等的量测有较大影响。每个像元的属性是地表相应区域内地理数据的近似值,因而有可能产生偏差。在GIS数据库中,对于分层的栅格数据的存储结构有三种基本方式方法一:基于像元每一个网格单元都赋予一个数值。(简单,但无法有多重属性)需要表达多重属性就必须建立多个栅格图层。土地产权地形土地使用建筑物ZYX方法二:基于层以像元为记录序列,不同层上同一像元位置上的各属性值表示为一个列数组。N层中只记录一层的像元位置,节约大量存储空间,因为栅格个数很多。方法三:基于多边形以层为基础,每层内以多边形为序记录多边形的属性值和多边形内各像元的坐标。节约用于存储属性的空间。将同一属性的制图单元的n个像元的属性只记录一次,便于地图分析和制图处理。卫星影像Satelliteimageryfrommanysensors像元值:从地球表面反射或发射的光能数字高程模型DEM:由等间隔海拔数据的排列组成以点为基础的,可转换到栅格数字正射影像DOM:消除照相机镜头和地形起伏引起的位移二值扫描文件:地形图的黑白扫描图像数字栅格图:地形图的彩色扫描图像图形文件:照片等特定GIS软件的栅格数据:ESRIGridSatelliteImageryAirPhotosScannedMaps优点◦高精度◦文件大◦数据结构简单需要解决问题◦有效存储◦处理更快◦容易检索◦多个客户同时操作上述问题都与数据结构、数据压缩有关栅格坐标系的确定:表示具有空间分布特征的地理要素,不论采用什么编码系统,什么数据结构(矢、栅)都应在统一的坐标系统下,而坐标系的确定实质是坐标系原点和坐标轴的确定。栅格单元的尺寸:栅格单元的尺寸确定的原则是应能有效地逼近空间对象的分布特征,又减少数据的冗余度。格网太大,忽略较小图斑,信息丢失。一般讲实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大,按分辨率的平方指数增加,计算机成本就越高,处理速度越慢。1、中心归属法:每个栅格单元的值由该栅格的中心点所在的面域的属性来确定。2、长度占优法:每个栅格单元的值由该栅格中线段最长的实体的属性来确定。3、面积占优法:每个栅格单元的值由该栅格中单元面积最大的实体的属性来确定。4、重要性法:根据栅格内不同地物的重要性,选取最重要的地物的类型作为栅格单元的属性值。这种方法适用于具有特殊意义而面积较小的实体要素。CAB面积占优重要性A连续分布地理要素C具有特殊意义的较小地物A分类较细、地物斑块较小AB栅格数据单元值确定为了逼近原始数据精度,除了采用这几种取值方法外,还可以采用缩小单个栅格单元的面积,增加栅格单元总数的方法。数据压缩:从取得的数据集合S中抽取一个子集A,这个子集作为新的信息源,在规定的精度范围内最好地逼近原集合,取得尽可能大的压缩比。压缩的目的:除冗余数据,减少数据的存贮量,节省存贮空间,加快后继处理的速度。栅格数据的压缩技术有游程编码、四叉树编码等。矢量数据的压缩主要是对线性要素中心轴线和面状要素边界的压缩。图形显示输出数据存储数据压缩光滑在数据无压缩的情况下,栅格数据按直接编码顺序进行存储。所谓直接编码,是将栅格数据看成一个数字矩阵,数据存储按矩阵编码方式存储。如果为了特定的目的,也可按下图的特殊编码顺序记录。Raster数据是二维表面上地理数据的离散量化值,每一层的pixel值组成像元阵列(即二维数组),其中行、列号表示它的位置。例如影像:AAAAABBBAABBAAAB在计算机内是一个4*4阶的矩阵。但在外部设备上,通常是以左上角开始逐行逐列存贮。如上例存贮顺序为:AAAAABBBAABBAAAB当每个像元都有唯一一个属性值时,一层内的编码就需要m行×n列×3(x,y和属性编码值)个存储单元。数字地面模型就属此种情况。分辨率的提高和数据量之间呈平方指数关系分辨率与精度的问题。如果精度越大、分辨率大,数据量就越大。为了减少数据量,产生了多种压缩存储量的数据结构栅格数据的压缩目的:减少数据量。通过某种编码的方法,达到减少数据长度的目的。多种压缩编码栅格数据结构链式编码(chaincodes)又称为弗里曼链码(Freeman)或边界链码。基本方向可定义为:东=0,东南=l,南二2,西南=3,西=4,西北=5,北=6,东北=7等八个基本方向。如果再确定原点为像元(10,1),则该多边形边界按顺时针方向的链式编码为:10,l,7,0,1,0,7,1,7,0,0,2,3,2,2,1,0,7,0,0,0,0,2,4,3,4,4,3,4,4,5,4,5,4,5,4,5,4,6,6。6701234532233233246676021起始点起始点链式编码优缺点:优点:链式编码对线状和多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易,类似矢量数据结构,比较适于存储图形数据。尤其对于线状和多边形较大区域具有较高的压缩率。缺点:对叠置运算如组合、相交等则很难实施,对局部修改将改变整体结构,即修改和插入比较困难,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的边界则被重复存储而产生冗余。栅格数据结构的表示游程长度编码(runlengthcode)是按行帧序存储多边形内的各个像元的列号,即在某行上从左至右存储属该多边形的始末像元的列号。问:对右图的进行游程长度编码。游程编码(run-lengthcodes)逐行操作记录每一行中每一个数值的开始位置和长度AAAAAAAAAA纪录为A100(值、长度、行号)AAAAABBBBAA51B41A11BBBBBBBBBAB92A12压缩的效果与地图的复杂效果有关对于地图变化越大,效果就越不明显游程编码的优缺点优点:对于线状和较大区域具有较高的压缩率;数据检索和运算比较简单,容易完成检索、叠加、合并等操作;数据精度增加,数据量不会显著增加,对编码形式影响不大;适用于小型计算机,同时减少了栅格数据库的数据输入量。缺点:计算时的处理和制图输入工作量有所增加。块式编码是将游程长度编码扩大到二维的情况,把多边形范围划分成由像元组成的正方形,然后对各个正方形进行编码。如图:块式编码的数据结构(初始行,列,半径,属性)根据这一编码原则,上述多边形只需17个单位正方形。9个4单位的正方形和1个16单位的正方形就能完整表示,总共要57个数据,其中27对坐标,3个块的半径。特点:具有可变分辩率大块图斑记录单元大,分辩率低,压缩率高;小块图斑记录单元小,分辩率高,压缩率低。一个多边形所包含的正方形越大,多边形的边界越简单,块状编码的效率就越好。游程编码和块状编码均对大而简单的多边形更为有效,而对那些碎部较多的复杂多边形效果并不好。块状编码在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。然而对某些运算不适应,必须在转换成简单数据形式才能顺利进行。0700709999009009000NWNESWSE四叉树编码是最有效的栅格数据压缩编码方法之一,在GIS中有广泛的应用。四叉树编码又称为四分树、四元树编码。它是一种更有效地压编数据的方法。它将2n×2n像元阵列连续进行4等分,一直分到正方形的大小正好与象元的大小相等为止(如下图),而块状结构则用四叉树描述,习惯上称为四叉树编码。四分树编码(Quadtreecodes)可变分辨率的方法。通过变化分辨率来达到压缩的目的。栅格连续四分,直到每一个4分后的块都是同一数值为止。采用不同的分辨率存储4分后的每一个块。易于查询、适应于存储数据量大的地图K为树的高度,图中k=3。四叉树的存储可按常规叶结点的顺序存储,称为常规四叉树。按特定叶结点顺序存储的称为线性四叉树。常规四叉树:每个结点记录六个指针变量:父结点指针,四个子结点的指针,本结点的属性值。指针不仅增加了数据的存储量,还增加了操作的复杂性,所以常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。用地址码(定位码、Morton码)记录叶节点的位置、深度(几次分割)和属性。优点:存储量小,只对叶节点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数;线性四叉树可以直接寻址,通过其坐标值直接计算morton码,而不用建立四叉树;定位码容易存储和执行实现集合相加等组合操作。把一幅m×m的图像压缩成线性四叉树的过程(1)按morton码把图像读入一维数组。(2)相邻的四个象元比较,一致的合并,只记录第一个象元的morton码,循环比较所形成的大块,相同的再合并,直到不能合并为止。(3)进一步用游程长度编码压缩。压缩时只记录第一个象元的morton码。例子解码时,根据Morton码,就可知道象元在图像中的位置。从左上角,本Morton码和下一个Morton码之差即为象元个数。知道了象元的个数和象元的位置就可恢复出图像了。四叉树编码的优缺点;优点:①容易而有效地计算多边形的数量特征;②阵列各部分的分辨率是可变的,边界复杂部分四叉树较高,即分级多,分辨率也高;而不需表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存贮量;②栅格到四叉树及四叉树到简单栅格结构的转换比其它压缩方法容易;④多边形中嵌套异类小多边形的表示较方便。缺点:转换不具稳定性,用同一形状和大小的多边形可能得出多种不同的四叉树结构,故不利于形状分析和模式识别。允许在多边形中嵌套多边形即所谓“洞”这种结构存在。AAAAARAAARAAARAARAAAAAAAAAGGAAGGGGGGGAGGGAGGAAAAAARAAAARAAARRAAA1432587612345678起点行列号,单位矢量R:(1,5),3,2,2,3,3,2,3链式编码游程长度编码逐行编码数据结构:行号,属性
本文标题:第四章栅格数据模型
链接地址:https://www.777doc.com/doc-4439412 .html