您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > ch15规则学习-周志华
戴望州第十五章:规则学习大纲基本概念序贯覆盖剪枝优化一阶规则学习归纳逻辑程序设计基本概念机器学习里的规则:若……,则…….回归分类聚类……若,则若,则;若,则若,则逻辑规则规则集充分性与必要性冲突消解:顺序规则、缺省规则、元规则基本概念规则头规则体逻辑蕴含符目标概念(逻辑文字)逻辑文字逻辑“与”读作:若(文字1且文字2且…),则(目标概念)成立原子公式基本概念命题逻辑命题规则原子命题:逻辑连词:一阶逻辑一阶规则常量:变量:(n元)谓词/函数:项:原子公式:逻辑连词逻辑量词:大纲基本概念序贯覆盖剪枝优化一阶规则学习归纳逻辑程序设计序贯覆盖+++++++++-+++++++++++-----------------------------------在训练集上每学到一条规则,就将改规则覆盖的样例去除,然后以剩下的样例组成训练集重复上述过程(分治策略)。序贯覆盖+++++++++-+++++++++++-----------------------------------序贯覆盖+++++++++-++-----------------------------------Rule1序贯覆盖+++++++++-++-----------------------------------Rule1序贯覆盖++++-++-----------------------------------Rule1Rule2序贯覆盖++++-++-----------------------------------Rule1Rule2序贯覆盖------------------------------------Rule1Rule2Rule4Rule3大纲基本概念序贯覆盖单条规则学习剪枝优化一阶规则学习归纳逻辑程序设计单条规则学习目标:寻找一组最优的逻辑文字来构成规则体本质:搜索问题搜索空间大,易造成组合爆炸方法:自顶向下:一般到特殊(泛化)自底向上:特殊到一般(特化)单条规则学习自顶向下策略:一般到特殊(特化)+++++++++-+++++++++++-----------------------------------单条规则学习自顶向下策略:一般到特殊(特化)+++++++++-+++++++++++-----------------------------------单条规则学习自顶向下策略:一般到特殊(特化)+++++++++-+++++++++++-----------------------------------Rule1单条规则学习自顶向下策略:一般到特殊(特化)+++++++++-+++++++++++-----------------------------------Rule1Rule2Rule3Rule4单条规则学习自底向上策略:特殊到一般(泛化)+++++++++-+++++++++++-----------------------------------单条规则学习自底向上策略:特殊到一般(泛化)+++++++++-+++++++++++-----------------------------------单条规则学习自底向上策略:特殊到一般(泛化)+++++++++-+++++++++++-----------------------------------Rule1单条规则学习规则评判:增加/删除哪一个候选文字准确率信息熵增益(率)基尼系数……规避局部最优集束搜索:每次保留最优的多个候选规则……大纲基本概念序贯覆盖剪枝优化一阶规则学习归纳逻辑程序设计序贯覆盖(非最优)+++++++++-+++++++++++---------------------------------贪心算法导致的非最优情况序贯覆盖(非最优)+++++++++-+++++++++++---------------------------------序贯覆盖(非最优)+++++++++-+++++++++++---------------------------------Rule1序贯覆盖(非最优)+++++++++-+++++++++++---------------------------------Rule1序贯覆盖(非最优)+++++++++-+++++++++++---------------------------------Rule1Rule2序贯覆盖(非最优)+++++++++-+++++++++++---------------------------------Rule1Rule2Rule3Rule4Rule5剪枝优化预剪枝似然率统计量[ClarkandNiblett,1989]后剪枝减错剪枝(REP)[BrunkandPazzani,1991]穷举所有可能的剪枝操作(删除文字,删除规则),复杂度非常高用验证集反复剪枝直到准确率无法提高二者结合IREP[FürnkranzandWidmer,1994]每生成一条新规则即对其进行REP剪枝IREP*[Cohen,1995]对IREP的改进RIPPER[Cohen,1995]大纲基本概念序贯覆盖剪枝优化RIPPER一阶规则学习归纳逻辑程序设计RIPPER[Cohen,1995]+++++++++-+++++++++++-----------------------------------Rule1Rule2Rule3Rule41.IREP*生成规则集覆盖了两个负样本!RIPPER[Cohen,1995]+++++++++-+++++++++++-----------------------------------1.IREP*生成规则集2.选取一条规则,找到其覆盖的样例Rule2Rule3Rule4RIPPER[Cohen,1995]+++++++++-+++++++++++-----------------------------------1.IREP*生成规则集2.选取该规则,找到其覆盖的样例a)重新生成规则Rule2Rule3Rule4RIPPER[Cohen,1995]+++++++++-+++++++++++-----------------------------------1.IREP*生成规则集2.选取该规则,找到其覆盖的样例a)重新生成规则b)特化原规则再泛化Rule2Rule3Rule4RIPPER[Cohen,1995]+++++++++-+++++++++++-----------------------------------1.生成规则集2.选取一条规则,找到其覆盖的样例a)重新生成规则b)特化原规则再泛化3.把原规则和新规则分别置入规则集进行评价,留下最好的Rule2Rule3Rule4RIPPER[Cohen,1995]+++++++++-+++++++++++-----------------------------------1.生成规则集2.选取一条规则,找到其覆盖的样例a)重新生成规则b)特化原规则再泛化3.把原规则和新规则分别置入规则集进行评价,留下最好的。4.反复优化直到无法进步RIPPER将所有规则放在一起优化,通过全局的考虑来缓解序贯覆盖的局部性Rule3Rule4大纲基本概念序贯覆盖剪枝优化一阶规则学习归纳逻辑程序设计一阶规则学习“一阶”的目的:描述一类物体的性质、相互关系实际应用中很难量化颜色、…、敲声的属性值一阶规则学习利用一阶关系来挑“更好的”瓜21颜色更深根蒂更蜷1比2好一般情况下可以省略全称量词一阶规则学习属性-值(Attribute-value)数据【命题逻辑】关系型(Relational)数据【一阶逻辑】背景知识样例FOIL[Quinlan,1990]序贯覆盖生成规则集自顶向下学习单条规则候选文字需考虑所有可能的选项规则生长的评判标准为FOIL增益后剪枝优化规则集能否引入新变量?能否使用否定文字?能否允许递归?能否引入函数嵌套?:p(f(f…(f(X))))大纲基本概念序贯覆盖剪枝优化一阶规则学习归纳逻辑程序设计归纳逻辑程序[Muggleton,1991]目标:完备地学习一阶规则(Horn子句)仍然以序贯覆盖方法学习规则集一般采用自底向上策略学习单条规则不需要列举所有可能的候选规则对目标概念的搜索维持在样例附近的局部区域自顶向下策略的搜索空间对于规则长度呈指数级增长最小一般泛化(LGG)[Plotkin,1970]“泛化”:将覆盖率低的规则变换为覆盖率高的规则“一般”:覆盖率尽可能高“最小”:变换时对原规则的改动尽可能小寻找两条规则LGG的步骤:找出两条规则中涉及相同谓词的文字考察谓词后括号里的项:s,t不是谓词相同的项,则,V为任意未出现过的变量s,t为谓词相同的项,递归考察其括号内的项删除没有相同谓词出现的文字最小一般泛化(LGG)[Plotkin,1970]最小一般泛化(LGG)[Plotkin,1970]其他基于LGG的ILP算法考虑否定文字不同的初始化选择多条特殊规则考虑所有背景知识(RLGG)[Plotkin,1971]…归纳演绎逆归结[MuggletonandBuntine,1988]演绎(deduction)VS归纳(induction)“……猜想是很不好的习惯,它有害于作逻辑的推理。你所以觉得奇怪,是因为你没有了解我的思路,没有注意到往往能推断出大事来的那些细小问题(thesmallfactsuponwhichlargeinferencesmaydepend)。举例来说吧,我开始时曾说你哥哥的行为很不谨慎。请看这只表,不仅下面边缘上有凹痕两处,整个表的上面还有无数的伤痕,这是因为惯于把表放在有钱币、钥匙一类硬东西的衣袋里的缘故。对一只价值五十多镑的表这样不经心,说他生活不检点,总不算是过分吧!……。”歇洛克·福尔摩斯演绎法研究(Thescienceofdeduction)——《四签名》规则(一般)事实(特殊)目标事实(特殊)归结与逆归结[MuggletonandBuntine,1988]演绎:归结原理[Robinson,1965]归纳:逆归结如何考虑带变量的逻辑表达式?已成立的事实规则归结掉(消去)已满足的文字p.从此若需验证r是否可满足,只需验证q是否成立.归结项归结商演绎:验证逻辑表达式的可满足性输入输出一阶逆归结置换:用项替换变量复合置换:逆置换:合一:通过置换让两个表达式相等最一般合一置换(MGU):任意一个合一置换都是MGU的复合置换MGU一阶逆归结一阶归结:当,一阶逆归结:例子(p.353):找一个不在归结项中的使存在一个解:使得逆归结[MuggletonandBuntine,1988]四种完备的逆归结操作逆归结[MuggletonandBuntine,1988]吸收吸收#1吸收#2逆归结[MuggletonandBuntine,1988]辨识逆归结[MuggletonandBuntine,1988]内构逆归结[MuggletonandBuntine,1988]内构逆归结[MuggletonandBuntine,1988]互构谓词发明目标概念:“楼梯”stair(X,Y):-a(X,Y).stair(X,Y):-a(X,Z),stair(Z,Y).a(X,Y):-vertical(X,Z),horizontal(Z,Y).自动发明得到的a(X,Y)即是楼梯的梯级归纳逻辑程序学习完备地学习一阶规则谓词发明:发现领域中隐含的结构得到的规则可直接作为逻辑程序进行应用其他归纳逻辑程序学习方法:命题化学习[LavracandDzeroski,1993]逆蕴含[Muggleton,199
本文标题:ch15规则学习-周志华
链接地址:https://www.777doc.com/doc-6547366 .html