您好,欢迎访问三七文档
D-S证据理论简介吴有光写于2014年1月21日,仅供学术讨论,不得用于商业目的。一、一个包含不确定性的例子奥巴马某天走在路上很苦恼,他在为怎么找到金三胖并拿钻地炸弹钻死他而苦恼。奥巴马的钻地炸弹上面的导航仪是从中国某个山寨厂家订的,这个坑爹的导航仪只能识别白色衣服。但万幸的是,三胖只会穿黑色或者白色衣服。奥巴马对于三胖的恶劣行为已经无法忍受了,哪怕一天,或者一秒。于是,他决定,如果确定明天三胖穿白色衣服,那么就用钻地炸弹钻死他;如果明天三胖穿黑色,那么就在家里画圈圈诅咒他。现在奥巴马的问题变为:明天三胖到底是穿黑色衣服还是白色衣服?奥巴马的情报来源是两个地方,坑爹的中央情报局CIA和坑妈的军情六处MI6。这两个情报机构每天都会奥巴马汇报第二天的金三胖穿衣情况。奥巴马的问题进一步转化为:如何融合CIA和MI6的情报判断明天三胖到底穿不穿白色衣服。于是我们建立三胖的穿衣元素为集合,其所有的子集构成的全集为,其中:(i),情报准确,肯定为白色的情况;(ii),情报准确,表示肯定为黑色的情况;(iii),表示或者为黑色或者为白色,情报不准,且不知道其中和的可能性各为多少;(iv),表示空集。注意,第(iii)情况不能包含第(i)或(ii)种情况,即四种情况是互不包含的。中情局在前一天得到金三胖第二天的穿衣可能为:。(1)集合之间的关系,和。这几个集合之间的关系集中在这玩意儿上,它包含了部分的可能,也包含了部分的可能。在证据推理中,认为=,所以。这直接造成了,和二者可能性之和不为1!!!这其实是可以直观解释的,问题做一定的转化,比如:问:中情局认为三胖穿白色衣服的概率为多少?回答:。问:中情局认为三胖不穿白色衣服的概率为多少?回答:这应该是所有不含白色的子集的概率之和,即。注意:穿和不穿白色衣服的概率之和,并不为1。所以中情局又称KD-CIA(坑爹CIA)。那么的补集到底是什么?应该是,在本例中,应该是。这个集合在D-S证据推理的理论推导中并不常见。那么的补集又是什么?应该是,在本例中,应该是。这个集合在D-S证据推理的理论推导中经常出现。再回头看看,表示肯定为白色,表示肯定不是白色,这二者的直和并不是全集,因为还存在“有可能是白色有可能是黑色”的情况,因为我们假设了“肯定是白色”和“有可能是白色有可能是黑色”是互不包含的。(2)概率之间的关系根据集合之间的关系,可以得到如下的关系因为,所以;因为的补集是,所以+=1;因为补集为,所以+=1。关键的关键,就是要理解在这种允许模糊推理情况下的,A和非A并不构成直接的互补关系。在本例中,,===0.2+0=0.2。于是+=0.3+0.21.0。二、三个函数的定义根据上面的例子,下面规范一下符号,其中代表,代表。称为样本空间,其元素为和;的所有子集组成了另外一个全空间,可以称为取值空间,即。CIA对于每一种取值可能的赋值函数,即前面提到的函数,我们称为概率分配函数,也就是坑爹的CIA把全概率1怎么样分配给各种取值可能,以用来糊弄奥巴马。当情报准确时,我们得到可以信任的概率,比如=0.3,这个0.3是可以信任的,所以称为信任函数,写为,为取到的那个子集,这里。情报里含有不准确的情况,引发了另一个问题,三胖穿白色衣服的最大可能是多少?显然应该是==0.3+0.2=1-=1-(0.5+0)=0.5。这个取值,我们也定义一个函数来表示它,因为这是最大可能性,所以称为似然函数,即来表示。于是我们有了三个函数:概率分配函数、信任函数和似然函数。信任函数和似然函数之间必然有:,二者的关系如图1:图1bel和pl函数关系图在本例中,如果取,则有。现在可以看到坑爹的中情局的坑爹程度了,也就是他给出的情报的模糊程度(不确定程度)为=0.2,也就是最可能穿白色和肯定穿白色之间区间的大小。其实,仔细观察,就知道这个区间的大小是由那个不确定性子集的概率不为0所产生的,即。这个区间越大,说明坑爹程度越高,奥巴马将会越抓狂。三、DS证据推理福无双至,祸不单行。当奥巴马对CIA失望透顶,转而向MI6投来期盼的目光时,MI6充分显露了他的坑妈本性,他对金三胖明天穿衣的预测为:。指望不上这这俩傻兄憨弟,奥巴马怀揣干粮,跋山涉水,翻山越岭穿越回1976年,找到哈佛数学家ArthurP.Dempster,要求根据(1)(2)告诉他明天三胖穿白色衣服的概率到底多少。Prof.ArthurP.DempsterProf.GlennShafer即求。Dempster悄悄的把他和Shafer发明的办法告诉了奥巴马。奥巴马如获至宝,蹦蹦跳跳的回去准备他的钻地炸弹去了。那么Dempster到底怎么计算的呢?Dempster把CIA和MI6看做两个不同的信息源,融合二者的数据以得到的公式为:(3)也就是,Dempster认为CIA和MI6都是对同一样本空间的取值可能进行概率分配,那么应该跟二者中任何一个认为三胖穿白衣的子集有关,不过并不是直接相等的关系,需要一个加权。权重计算为:(4)这里显然=++=0.3*0.7+0.5*0.4+0.2*1=0.21+0.2+0.2=0.61。于是,最后的公式为(5)或者写为(6)推而广之,假设样本空间为,则取值空间。设有个信息源,其概率分配函数为。对取值空间任一子集的判决为:(7)其中如下定义:(8)四、结束语D-S证据推理满足比贝叶斯概率论更弱的条件,具有直接表达“不确定”和“不知道”的能力,显然是用于综合不同信息(知识)来源的好办法。貌似可以用在多源信息融合、情报分析、多属性决策等,特别是综合专家的意见的时候(因为专家爱扯淡,东扯扯,西扯扯,貌似什么都说了,又貌似什么都没说)有人说DS证据推理存在以下问题,等你去突破:1,要求证据独立,但很多时候并不满足。如果证据不独立如何处理?2,证据合成规则理论支持还不够坚固。3,计算上存在指数爆炸问题。需要了解更详细的D-S证据推理,自己网上找资料去。更进一步的讨论,已经不属于本文的内容,不过你已经读完本文,应该可以回答下面的问题了。请问:到底三胖穿白衣的概率是多少?(计算依据为公式(5),如果你实在看不懂那些集合之间的包含关系,那么参照我根据公式(4)计算的过程)追问:奥巴马家炸弹多,当三胖穿白衣可能性高于0.5时,即用钻地炸弹,请问奥巴马最后有没有钻死金三胖?(未完待续)
本文标题:证据理论简介
链接地址:https://www.777doc.com/doc-5974559 .html