您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 38本体技术决策树算法的研究及在高校教务管理中的应用
天津师范大学硕士学位论文本体技术决策树算法的研究及在高校教务管理中的应用姓名:朱红霞申请学位级别:硕士专业:教育技术学指导教师:张桂芸20100401本体技术决策树算法的研究及在高校教务管理中的应用作者:朱红霞学位授予单位:天津师范大学相似文献(10条)1.学位论文王鹤基于决策树的ID3算法的研究与改进2008数据分类是数据挖掘中一个重要的内容。常见的分类模型有决策树、神经网络、遗传算法、粗糙集等。其中决策树算法是以实例为基础的归纳学习算法,以其易于提取显示规则、计算量相对较小、可以显示重要决策属性和较高的分类准确率等优点而得到广泛的应用。论文从学习数据挖掘的基础理论出发,重点介绍和研究了决策树的ID3算法,并分析了ID3算法存在的以下缺点:1、ID3不能处理连续性数据。2、ID3算法在选择分裂属性时倾向于选择属性值多的属性。3、计算效率低。针对以上的缺点,论文的主要工作体现在以下几个方面:第一、归纳了数据挖掘技术的总体研究情况,包括数据挖掘的定义,挖掘的主要过程和主要技术手段等。第二、从宏观上介绍了分类技术的理论基础,对几种常见决策树算法进行了分析和比较,例如ID3、C4.5、CART算法,并重点分析了决策树的ID3算法。第三、论文对决策树算法进行了优化研究,提出了一种改进的ID3算法,改进的算法与决策树的ED(Effective-Degree)算法相结合,选取新的标准作为选择分类属性。通过对新算法在测试样例上训练得出的结果表明:改进算法在能有效提高分类的精度,改善ID3算法选择分裂属性时倾向取值较多的不足,总体性能上优于目前广泛应用的ID3算法。2.会议论文韩松来.张辉.周华平决策树算法中多值偏向问题的理论分析2005多值偏向是决策树算法中普遍存在的问题,以往人们对于多值偏向问题的分析主要是基于实验观测的.该文针对决策树算法中的多值偏向问题提出了一种理论分析方法,并使用该方法分析了四种常用的决策树算法--ID3算法、Gini指数算法、x2统计算法和Relief算法.理论分析的结果跟实验观测的结果相一致,证明了这种分析方法的有效性.3.学位论文袁琴琴基于决策树算法的改进与应用2006数据挖掘(DataMining)是信息处理技术研究领域的一项重要课题。它是指从大型数据库或数据仓库中提取隐含的、未知的、及有潜在应用价值的信息或模式的过程。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。分类是数据挖掘技术研究的一个重要方向。常用的分类模型有决策树、神经网络、遗传算法、粗糙集、统计模型等。本文主要研究决策树ID3算法及其改进算法。由于数据挖掘中分类算法在商业应用中最为广泛,而决策树算法是数据挖掘分类的核心算法之一。在决策树算法中有Quinlan于1986年提出的ID3算法最为著名,该算法有三大主要缺点:1.算法往往偏向于选择取值较多的属性,而取值较多的属性并不总是最优的属性。2.ID3只能处理离散属性,对于连续型的属性,在分类前需要对其进行离散化。3.ID3必须知道从叶子节点到树根的路径上所有内节点对应的属性的属性值。为了解决这些问题,本文在ID3算法的基础上提出了改进算法,通过使用同一训练集对不同算法建立的决策树的比较,得出改进算法比ID3算法所得的决策树更为理想。本文用Java这种完全面向对象的高级语言实现ID3算法及改进算法,应用在网上书店交易方案的挖掘实例中,完成从数据导入到生成规则的完整的数据挖掘步骤,并使生成的规则可视化显示,为决策者提供决策支持。另外采用XML存储待挖掘数据,鉴于XML的“足以表达各种类型的数据,应用于与不同的数据源进行交互,解决了数据的统一接口问题”优点,尝试并应用在ID3算法的改进与实现中,为任意数据库转换成XML格式的数据挖掘提供了思路。4.期刊论文廖晓威.马利庄.王彦.LIAOXiao-wei.MALi-zhuang.WANGYanES-ID3算法及其在中医辨症中的应用-计算机工程与应用2008,44(32)提出了一种具备自训练学习能力的ES-ID3决策树算法.该算法克服了传统ID3算法要求所有动l练样本必须事先进行分类处理的约束,通过充分利用已采集但未进行分类的准训练样本进行自训练学习过程,非常适用于获取训练样本代价较高的环境,如医学病例样本采集等.对肝病中医辨症问题应用该算法,实验证明,无论从分类的准确性及对关键决策属性的提取能力,较之于传统ID3算法,该算法均有显著提高;算法结论能对医疗工作提供有效帮助.5.学位论文李春江集合划分上的模糊积分与ID3算法2010模糊积分也叫非线性积分,是传统(Lebesgue)积分的推广,其主要特点是其测度不满足可加性。br 决策树算法是一种归纳学习算法,ID3算法是最具代表的决策树算法之一,它以信息论中的信息熵为度量标准,递归的选取扩展属性,生成一棵树。树的生成过程就是集合的划分过程。考虑到集合的划分对决策树产生的影响,本文提出了一种集合划分上的模糊积分,研究了其基本性质,以及这种新型模糊积分在一定条件下的计算,将其用于ID3算法,证明了ID3算法中利用极小熵选择的属性对应集合的最细化分,从而本文也为ID3算法提供了一个数学理论依据。6.期刊论文高学东.尹阿东.宫雨.武森一种改进的决策树算法-工业工程与管理2004,9(4)根据ID3算法中信息增益计算原理的特点,利用上凸函数的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率.从实验和理论两方面证明,改进的ID3算法与原ID3算法相比,在构造决策树时具有相同的准确率和更高的计算速度.7.学位论文赵建峰数据挖掘中一种基于遗传算法改进的ID3算法2008随着现代信息技术的迅速发展,许多领域都积累了大量的数据,对发现潜在于这些数据中的知识与规律的渴望造就了数据挖掘学科的兴起及数据挖掘技术的发展。作为一个多学科交叉的综合性领域,数据挖掘涉及了数据库、统计学、机器学习、高性能计算、模式识别、神经网络和数据可视化话等学科。决策树算法是对一组已知示例进行归纳学习,并生成一颗决策树的方法。该算法目前已经被广泛应用于自动知识获取领域。最为典型的决策树分类器学习算法是ID3算法,它采用自顶向下分而治之的策略,利用信息增益的标准选择分裂属性,能保证构造出一棵简单的树。该算法简单高效,生成的知识易于被人理解,但是在面对大量的数据获取的数据进行知识提取时存在着过度拟合的问题。在深入分析ID3算法的基础上提出了基于遗传算法改进的ID3算法并利用该算法对网络上包含入侵的数据进行了建模。该算法首先将已有的知识的规则作为遗传基因,进行进化,利用遗传算法将现有的规则集进行了分割,然后再利用划分的规则集生成决策树群,之后利用决策树群给出预测结果。实验结果表明,该算法能够较好的进行分类,并对比了ID3算法给出的结果。8.期刊论文刘璇.唐慧强.许遐祯.项瑛.LiuXuan.TangHuiqiang.XuXiazhen.XiangYing决策树算法在农业气象灾害统计中的应用-农机化研究2009,31(7)分析了决策树分类算法中的ID3算法和C4.5算法,在论述分类挖掘的基础上分析了决策树分类挖掘系统的建立思想、步骤及算法,并把这两种算法应用到优化农业气象灾害统计的实验中,研究了决策树算法在气象灾害导致的直接经济损失评估中的应用,实验结果证明了该方法的可行性.9.学位论文张悦前向决策树算法的研究与改进2010决策树学习是应用最广泛的归纳推理算法之一。目前存在的决策树归纳算法大多数是基于自顶向下的贪婪算法,它在每个结点都执行一个局部最优决策。然而,在大多数情况下,贪婪算法构造的树不是全局最优的。对于贪婪算法的改进,前向搜索是一种众所周知的技术。大多数人认为,前向决策树算法产生的决策树优于贪婪算法,并且搜索深度越深其效果越好。然而,在实际中前向决策树算法得到的结果并非如此,许多文献通过实验指出在决策树归纳过程中前向搜索往往会伤害决策树的质量。br 本文以ID3算法为基础,研究了前向决策树算法,并与贪婪算法的建树过程进行了对比。通过实例将前向决策树算法与经典的ID3算法进行了比较,结果表明针对某些特定的问题前者在保证分类精度不降低的同时也简化了决策树。本文还重点分析了前向决策树算法存在的缺点,正是由于算法本身存在的这些缺陷使得产生的决策树没有质量上的提高。为了改进前向决策树算法,本文提出了一种基于属性约简的建树方法——受限制的前向决策树算法。改进后的算法限制了前向决策树算法的搜索空间,首先使用属性约简方法选择出一个属性子集,然后在预先选定的属性子集中使用前向搜索方法寻找最优分裂属性进行决策树的建造。通过在部分UCI数据集上做实验,可以看出本文提出的方法能减小决策树的规模,提高预测精度。10.学位论文郝玲ID3算法的模糊扩展研究2005决策树算法是对一组已知示例进行归纳学习,并生成一棵决策树的方法。该算法已被广泛的应用于自动知识获取领域。ID3算法是一种典型的决策树归纳算法,这种算法在假定示例的属性值和分类值是确定的前提下,使用信息熵作为启发式建立一棵清晰的决策树。随着示例模糊表示的出现,清晰的决策树已不能满足不精确知识获取的需要。模糊决策树归纳是从具有模糊表示的示例中学习模糊规则的一种重要方法,从符号值属性类分明的数据中提取规则可视为模糊决策树归纳的一种特殊情况。模糊决策树算法是清晰决策树算法的一种扩展。由于构建最优的模糊决策树是NP-hard,因此,针对启发式算法的研究是非常必要的。本文主要是对经典的决策树启发式算法-ID3算法进行分析研究,在示例模糊表示的基础之上,将其进行扩展成为模糊ID3算法,并与其它的决策树归纳算法进行比较。ID3算法原有的模糊扩展可视为本文的一个特例。通过实验与理论分析,发现本文的模糊ID3算法应用于符号值属性类分明的数据库时从训练准确度、测试准确度和树的规模等方面都要优于其它的模糊扩展例如Min-Ambiguity算法。本文链接:授权使用:无锡市图书馆(wxstsg),授权号:09874f42-ee04-4cf5-acbc-9e71016eb218下载时间:2011年1月20日
本文标题:38本体技术决策树算法的研究及在高校教务管理中的应用
链接地址:https://www.777doc.com/doc-4204556 .html