您好,欢迎访问三七文档
数据库水印技术前言在当前的网络信息化时代,随着电子政务、电子商务等应用的普及,越来越多的数据库数据通过网络进行存储和发布,这些数据经过若干年的积累,往往蕴含有巨大的社会价值与经济价值,成为宝贵的数据资源。随着网络数据共享和数据交换需求的不断增多,如果不采取有效的安全控制和版权保护措施,常常会给攻击者以可乘之机。同时,如果缺乏数据库完整性验证的有效措施,一旦出现对数据库的恶意篡改,而又无法证明其真伪,后果也是无法想象的。此外,一些数据库应用需要将数据库产品出售给客户(如地理信息系统中一般就包含价格不菲的空间数据库),一些数据库业务(如数据挖掘等)需要向合作伙伴提供完整的数据,这些都需要严格的数据库版权保护措施。在目前新兴的外包数据库服务模式中,数据库服务器由非可信的第三方提供,数据库的物理文件可以轻易地被第三方拷贝,数据拥有者对数据库实施版权保护的需求也日益迫切。随着关系数据库的广泛使用,随之产生了在关系数据库中嵌入水印信息的需求。如对那些提供信息服务(包括气象信息、医疗信息、人才市场信息、股票交易信息、电子元器件参数信息等)的机构,其主要资产便是存储于数据库里的大量数据。Internet的快速发展促使这些数据供应商提供远程访问数据库的服务,用户在支付一定的使用费之后便可以远程登陆数据库,使用里面的数据。虽然远程登录服务能为终端用户提供极大的方便,但数据供应商也同时面临数据被窃取的危险。如果不法分子将他从数据库里获取的大量数据转卖给他人,这些信息机构将会蒙受很大的经济损失。此外,随着数据库技术的不断发展,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,利用数据挖掘技术可以从看似无规律的数据中挖掘出有用的商业信息。因而,也需对这种隐含有重要商业信息的大型数据库进行版权保护,以防止不法分子从中获利。通过在关系数据库中嵌入代表所有权的水印信息,可以将数据库与其拥有者联系起来,从而实现数据的版权保护。2000年,SKhanna等提出利用数字水印实现对数据库安全控制的新思路,使数据库水印技术引起研究者关注。美国国家科学基金会(NSF)于2002年开始资助有关数据库水印技术的研究。我国的国家自然科学基金也于2004年立项资助“水印关系数据库关键技术的研究”。。数字水印技术随着计算机技术和通信技术的飞速发展,数字信息可以以多种形式在网络上方便、快捷地传播。人们通过网络看电影、听音乐、看新闻、网上购物等,网络与数字信息已成为许多人生活、工作不可缺少的部分。然而,网络在以数字仓库、数字图书馆、网络视频和音频、电子商务等新的服务和运作方式为人们带来方便的同时,也出现了十分严重的问题:数字信息复制更加简单,内容篡改更加方便,作品侵权更加容易。随之而来的知识产权保护和认证等问题变得日益突出。如何在人们充分享受网络和数字产品便利的同时,能有效保护知识产权,是当前面临的严重问题。数字水印技术就是在这种背景下迅速发展起来的。作为传统加密方法的有效补充手段,数字水印是一种可以在开放的网络环境下保护版权和认证来源及完整性的新技术,是信息隐藏技术研究领域的一个重要分支。它通过在原始数据中嵌入秘密信息------水印(watermark)来证实该数据的所有权。这种被嵌入的水印可以是一段文字、标识、序列号等。水印通常是不可见的或不可察的,它与原始数据(如图像、音频、视频数据)紧密结合并隐藏其中,成为源数据不可分离的一部分,并可经历一些不破坏源数据使用价值或商用价值的操作而保存下来。数字水印传统的加密技术把有意义的明文转换成看上去没有意义的密文信息,但密文的随机性同时也暴露了消息的重要性,容易引起攻击者的注意和破坏,这造成了一种新的不安全性。另一方面,随着软硬件技术的发展,现有加密算法的安全性正受到严峻挑战。以数字水印为代表的信息隐藏技术并不限制正常的数据存取,而是保证隐藏的信息不引起攻击者的注意,从而减少被侵犯的可能性。在此基础上再结合使用密码学方法来增强隐藏信息的安全性和抗攻击能力。数字水印(DigitalWatermarking)技术是指用信号处理的方法在宿主数据中嵌入不易察觉且难以去除的标记,在不破坏原有数据内容和对象的可用性的前提下,达到保护数据安全的目的。在数字水印技术中,水印嵌入可以视为在强背景下叠加一个弱信号(水印)。人眼视觉系统(HVS)的对比度门限受视觉系统的空间、时间和频率特性的影响,只要叠加的水印信号强度低于人眼视觉系统(HVS)的对比度门限,就无法感觉到信号的存在,即水印是不可见的。从数字通信的角度看,水印嵌入可理解为一个在宽带信道(载体数据)上用扩频通信技术传输一个窄带信号(水印)。尽管水印信号具有一定能量,但分布到信道中任一频率上的能量是难以检测的。水印的译码(检测)则是一个有噪信道中弱信号的检测问题。嵌入的信息不能被人的知觉系统觉察或注意,只有通过专用的检测器或阅读器才能提取。水印信息可以是作者的序列号、公司标志、有特殊意义的文本等,可用来识别文件、图像或音乐等制品的来源、版本、原作者、拥有者、发行人、合法使用人对数字产品的拥有权。虽然数字水印技术不能阻止盗版活动的发生,但它可以判别对象是否受到保护,监视被保护数据的传播、非法拷贝,进行真伪鉴别,解决版权纠纷并为法庭提供证据。数字水印技术弥补了密码、数字签名等技术的不足。数字水印的通用模型数字水印的通用模型包括水印嵌入、水印提取、水印检测三个部分。为了增强水印安全性,给攻击者增加去除、伪造水印的难度,目前大多数水印方案都在加入时采用了密钥,只有掌握密钥的人才能顺利提取水印。设I为原始载体信息,W为水印信息,K为密钥,F为水印嵌入算法,则嵌入水印后的载体信息I′可以表示为:I′=F(I,W,K)使用水印提取算法,从含有水印信息的载体中获取原始水印信息的过程被称为水印提取。水印提取时,有的水印系统需要已知原始载体的部分或全部信息,有的不需要原始载体的任何信息,后者称为盲检。数字水印的主要特性(1)安全性:嵌入在宿主数据中的水印是不可删除的,且能够提供完全的版权证据。(2)透明性:在数字产品中嵌入数字水印不会引起明显的降质,并且不易被察觉,不影响宿主数据的可用性。(3)鲁棒性:在经历多种无意或有意的信号处理过程的攻击后,数字水印仍能保持完整性或仍能被准确鉴别。除了各种恶意攻击外,对关系数据库的正常维护和更新也会修改数据值。数据库水印的鲁棒性是指水印数据库不会因为数据的某种改动而导致水印信息丢失的能力。倘若攻击者修改的元组数量很多,嵌入在数据库中的水印信息遭到破坏,那么该关系数据库也会因数据修改太多而失去其本身的使用价值。(4)检测能力:从水印数据库中检测出水印信息的能力。水印系统的检测能力要强,误判率要低。误判分虚检和漏检两种,虚检是关系数据库中无水印时,却检测到水印存在;漏检是指加了水印的关系数据库却没有检测到水印的存在。数字水印的分类(1)按水印的特性划分根据水印的特性可以将数字水印分为易损水印和鲁棒水印。易损水印对信号的改动很敏感,很容易被破坏,主要用于完整性验证;鲁棒水印要求具有好的鲁棒性能,主要用于数字作品中版权信息的标识。目前,鲁棒水印较易损水印应用更加广泛。(2)按表现形式划分根据水印的表现形式,数字水印可以分为可见水印和不可见水印。如果作品中嵌入的水印信息能够直接用肉眼辨别,这种水印称为可见水印;而不可见水印要求在嵌入数字作品后不会引起作品的明显降质,不易被察觉。(3)按检测过程划分根据水印的检测过程可以将数字水印分为明文水印和盲水印。在水印的提取或检测过程中,明文水印需要原始载体的部分或全部信息,而盲水印不需要原始载体的任何信息。例如将明文水印用于操作跟踪,为了发现非法发行特定副本的人,将原始作品和非法副本一起提供进行检测。一般明文水印具有较好的安全性和鲁棒性,但许多应用场合受到原始载体的限制,大多使用盲水印。(4)按水印嵌入和提取时使用的密钥划分根据嵌入水印和提取水印时使用的密钥是否相同可分为对称水印和非对称水印。如果在嵌入和提取水印时使用相同的密钥,则称为对称水印;当水印嵌入和提取过程中使用的密钥可以不同,则称为不对称水印。(5)按隐藏位置划分根据数字水印的隐藏位置水印可分为空域水印和频域水印,空域水印是通过直接在空域中对采样点的幅度值作出改变进行水印嵌入;频域水印通过改变变换域系数的方法嵌入水印。频域水印算法复杂度高,但频域水印具有较好的安全性、可嵌入的水印信息量大等特点。(6)按用途划分不同的应用需求造就了不同的水印技术。根据数字水印的用途,数字水印又可以分为票据防伪水印、篡改提示水印、隐蔽标识水印和版权保护水印。票据防伪水印主要用于打印票据和电子票据的防伪;篡改提示水印是一种脆弱水印,用于标识宿主数据的完整性和真实性;为了限制非法用户对保密数据的使用,利用隐蔽标识水印可隐藏保密数据的重要标注;数字作品既是知识作品又是商品,数字化技术的飞速发展,为数字水印技术发展提供了广阔的领域,版权标识水印是目前应用最广泛的一类水印。(7)按载体划分数字水印按载体可分为图像水印、视频水印、音频水印、文本水印,以及近年来兴起的软件水印、网格水印、数据库水印。基于关系数据库的数据库水印,它具有鲁棒性、对称性、不可见性,且可实现盲检。10多年来,数字水印技术得到了比较深入的研究。从研究对象上看,目前的研究主要集中在多媒体领域,如图像水印、视频水印、音频水印等,另有少量对文本水印、软件水印以及三维网格数据水印的研究。数据库水印的特点数据库水印是指用信号处理的方法在数据库中嵌入不易察觉且难以去除的标记,在不破坏数据库内容和可用性的前提下,达到保护数据库安全的目的。由于数据库的特殊性,在其中不易找到能插入水印标记的可辨认冗余空间,因而研究具有一定难度,成熟的水印算法还很少。与多媒体数据相比,数据库水印的主要区别在于:(1)多媒体数据对象是由大量的位组成的,并且许多位是冗余的。关系数据库则是由许多独立的元组组成,难以找到可辨认的冗余空间。(2)多媒体数据对象各个点之间主要存在空间上的有序关系,而组成关系数据库的元组之间以及元组的属性值集合之间是无序的,数据间一般存在依赖关系。(3)多媒体数据对象某个部分的删除或替换,很容易引起知觉上的变化,而关系数据库却可以简单地去掉一些元组或者用其他类似的关系数据中的元组来代替而不易被发觉。这使得数据库水印易于被攻击且难以发现。(4)数据库数据主要被机器程序读取和处理,无法像多媒体数据那样基于人类视觉模型(HVS)或听觉模型(HAS)来实现数字水印的隐蔽嵌入。(5)静态的多媒体数据很少进行更新,而数据库一般更新频繁,这给保证数字水印的鲁棒性带来困难。数字水印典型算法目前,典型的数字水印算法主要有空域算法、变换域算法、压缩域算法、NEC算法和生理模型算法五类。空域算法是一种常见的数字水印算法,为了保证水印的不可见性,空域算法一般是随机选择图像点最不重要的像素位(LSB)进行水印信息嵌入。包Schyndel算法、Patchwork算法和部分文本水印算法等。数据库水印算法目前常用的数据库水印算法主要分为两种:(1)利用一定失真范围内的数据变形来嵌入水印。IBMAlmaden研究中心的Rakesh.Agrawal等在这方面做了开创性的研究。他们于2002年首次进行了向关系数据库嵌入比特位模式的实验。该实验利用数据库关系中数值型元组存在的冗余空间,通过在某些数值型属性值中引入少量误差,对其最低有效位(LeastSignificantBits,LSB)进行位操作,实现水印信息的嵌入。实验针对一个只包含数值型数据的数据库,首先选用单向Hash函数,根据用户给定的密钥和元组主键值以及需要标记的元组比例来确定哪些元组需要标记,然后根据可以标记的属性数和比特位数确定标记的属性及其比特位位置。在整个关系数据库中许多个比特位标记组合的比特位模式就是嵌入的水印信息。(2)基于元组排序和划分集合实现水印嵌入。该方法由美国Purdue大学的Radu.Sion等提出。首先根据元组的加密键值哈希对其进行秘密排序,然后基于“均方差”特性构造子集,取连续序列数
本文标题:数据库水印技术
链接地址:https://www.777doc.com/doc-6810028 .html