您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > ID3算法的研究以及在成绩统计辅助决策系统中的应用
厦门大学硕士学位论文ID3算法的研究以及在成绩统计辅助决策系统中的应用姓名:张凌申请学位级别:硕士专业:控制工程指导教师:罗键;江善贤20070401ID3算法的研究以及在成绩统计辅助决策系统中的应用作者:张凌学位授予单位:厦门大学相似文献(10条)1.学位论文刘光明ID3算法的研究及在以政府决策为主题的挖掘系统中的应用2006以政府决策为主题的数据挖掘系统是对呼叫中心数据库和政府各部门的统计信息进行数据挖掘和规则提取,从而为政府各部门改进工作,提高为民办事效率提供决策支持。要实现以政府决策为主题的数据挖掘系统,需要对呼叫中心和各部门的统计信息数据进行预处理,然后对处理后的数据建立数据挖掘模型,最后对挖掘后的数据模型进行评价与展示。本文从学习数据挖掘的基础理论出发,研究发现,以政府决策为主题的数据挖掘系统采用决策树算法来建立数据挖掘模型,决策树算法中最成功、影响最大的是ID3算法。因而,本文首先重点学习了决策树的ID3算法,通过研究分析ID3算法发现ID3算法存在两个缺点:1、ID3算法不能处理连续型数据。2、ID3算法在选择分裂属性时倾向于选择属性取值多的属性。针对这两个缺点,本文提出了一个改进的ID3算法,改进的算法提出一种预处理技术来处理连续型数据。另外该算法还提出了利用信息增益率来选择分裂属性的标准。通过对新算法在测试样例上训练得出的决策树分析,结果表明:1、改进后的ID3算法能有效的提高分类的精度,改善了ID3算法选择分裂属性时倾向取值较多的不足。2、改进后的ID3算法能有效的处理连续型数据。最后,本文将改进ID3算法应用于以政府决策为主题的数据挖掘系统,取得良好的实践效果。2.期刊论文李娜.翁惠玉.LiNa.WengHuiyu数据挖掘技术在健康管理系统中的应用-微型电脑应用2010,26(1)该文研究了基于决策树的ID3算法,针对ID3算法应用在健康管理系统中存在的问题,提出了一个改进的算法,并利用改进算法对居民健康档案数据进行慢性病诱因的数据挖掘,挖掘结果证明,改进算法的决策树在健康管理系统中的数据挖掘是有效的.3.学位论文赵建峰数据挖掘中一种基于遗传算法改进的ID3算法2008随着现代信息技术的迅速发展,许多领域都积累了大量的数据,对发现潜在于这些数据中的知识与规律的渴望造就了数据挖掘学科的兴起及数据挖掘技术的发展。作为一个多学科交叉的综合性领域,数据挖掘涉及了数据库、统计学、机器学习、高性能计算、模式识别、神经网络和数据可视化话等学科。决策树算法是对一组已知示例进行归纳学习,并生成一颗决策树的方法。该算法目前已经被广泛应用于自动知识获取领域。最为典型的决策树分类器学习算法是ID3算法,它采用自顶向下分而治之的策略,利用信息增益的标准选择分裂属性,能保证构造出一棵简单的树。该算法简单高效,生成的知识易于被人理解,但是在面对大量的数据获取的数据进行知识提取时存在着过度拟合的问题。在深入分析ID3算法的基础上提出了基于遗传算法改进的ID3算法并利用该算法对网络上包含入侵的数据进行了建模。该算法首先将已有的知识的规则作为遗传基因,进行进化,利用遗传算法将现有的规则集进行了分割,然后再利用划分的规则集生成决策树群,之后利用决策树群给出预测结果。实验结果表明,该算法能够较好的进行分类,并对比了ID3算法给出的结果。4.学位论文王鹤基于决策树的ID3算法的研究与改进2008数据分类是数据挖掘中一个重要的内容。常见的分类模型有决策树、神经网络、遗传算法、粗糙集等。其中决策树算法是以实例为基础的归纳学习算法,以其易于提取显示规则、计算量相对较小、可以显示重要决策属性和较高的分类准确率等优点而得到广泛的应用。论文从学习数据挖掘的基础理论出发,重点介绍和研究了决策树的ID3算法,并分析了ID3算法存在的以下缺点:1、ID3不能处理连续性数据。2、ID3算法在选择分裂属性时倾向于选择属性值多的属性。3、计算效率低。针对以上的缺点,论文的主要工作体现在以下几个方面:第一、归纳了数据挖掘技术的总体研究情况,包括数据挖掘的定义,挖掘的主要过程和主要技术手段等。第二、从宏观上介绍了分类技术的理论基础,对几种常见决策树算法进行了分析和比较,例如ID3、C4.5、CART算法,并重点分析了决策树的ID3算法。第三、论文对决策树算法进行了优化研究,提出了一种改进的ID3算法,改进的算法与决策树的ED(Effective-Degree)算法相结合,选取新的标准作为选择分类属性。通过对新算法在测试样例上训练得出的结果表明:改进算法在能有效提高分类的精度,改善ID3算法选择分裂属性时倾向取值较多的不足,总体性能上优于目前广泛应用的ID3算法。5.期刊论文李成章.王道平.LICheng-zhang.WANGDao-ping基于ID3算法的供应商评价方法研究-技术经济与管理研究2009,(2)随着信息技术的发展,供应链已经越来越成为商业发展的趋势,供应商作为供应链的源头,其质量很大程度上决定了整条供应链的竞争能力.本文在总结比较常见的供应商评价方法的基础上,提出了将数据挖掘中的ID3算法应用到供应商的评价中,以使对供应商的评价更客观,更准确.6.学位论文刘祺决策树ID3算法的改进研究2009数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程,是信息处理技术研究领域的一项重要课题。它是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的以及有潜在应用价值的信息或模式的过程。它融合了数据库、人工智能、机器学习等多个领域的理论和技术。分类分析是数据挖掘技术研究的一个重要方向。数据挖掘中分类算法在商业应用最为广泛,而决策树算法又是数据挖掘分类的核心技术算法之一。Quinlan于1986年提出的ID3算法在决策树算法中最为著名。本文主要研究决策树ID3算法及其改进算法。本文首先详细地介绍了ID3算法,然后对其进行了深入地研究。ID3算法有两大缺点:第一,ID3算法由于使用log进行计算,所以运算起来并不简单;第二,算法往往偏向于选择取值较多的属性,而取值较多的属性却不总是最优的属性。其次,为了解决ID3算法运算复杂的缺点,引入麦克劳林公式,在ID3算法的基础上提出了ID3简化算法,使运算变得简洁;为解决ID3算法偏向于选择取值较多的属性的不足,通过使用数据结构中的二叉树来存储决策树,在ID3算法基础上提出了将ID3简化算法与普通二叉树算法相结合的ID3简化算法的二叉树存储算法。然后通过使用同一训练集的实例进行具体计算,分别得到其对应的决策树。最后对不同算法建立的决策树进行比较研究,得到结论:通过对ID3算法、ID3简化算法和ID3简化算法的二叉树存储算法三种决策树算法的比较,证明应用ID3简化算法的二叉树存储算法比ID3算法和ID3简化算法得到的决策树更为理想。7.期刊论文郑丽萍Id3算法的研究及应用-硅谷2008,(24)论述ID3算法,根据中医脏腑辨证数据的特点,简化经典的ID3算法,描述一个针对中医脏腑辨证数据的数据挖掘过程模型,并在这个模型的指导下,对临床病人的实时诊断症状和证候之间的关系进行分析、预测,在保证正确诊治率的前提下提高运行的效率.8.学位论文满桂云决策树分类数据挖掘算法研究及其在学生信息管理系统中的应用2007随着信息技术在企业中的普遍应用及多年的数据积累,面向分析型应用的数据挖掘及数据仓库技术逐渐发展起来。数据挖掘是用于从大量数据中寻找有用的信息,即从大型数据库或数据仓库中提取人们感兴趣的、隐含的、事先未知的、潜在的知识的过程。本文详细介绍了数据挖掘中的各类知识及算法。决策树算法是数据挖掘中最常用的一种方法,它能够直接体现数据的特点,便于理解,具有较好的分类预测能力,并能方便提取决策规则。文中重点介绍了基于决策树的分类算法中的ID3算法。但是ID3算法还存在着一些不足,本文针对其多值偏向性、决策树剪枝等方面的不足,根据相似性原理,对ID3算法进行改进,引入以描述属性和决策分类属性的趋近度确定测试属性,构建决策树。并对改进过的T_ID3算法和ID3算法进行理论和实例对比验证,结果表明T_ID3算法避免了多值偏向性问题,在剪枝有效性等方面也有了一定的提高。论文最后较为详细的介绍了本校学生信息管理系统的具体实现过程,并对面向毕业生就业情况分析主题进行数据挖掘,最后对挖掘结果进行分析,结合实际工作,为高校学生管理决策提供参考。9.学位论文陆秋基于决策树ID3算法的数据挖掘技术研究与应用2007决策树方法是数据挖掘的重要方法,通常用来形成分类器和预测模型。决策树方法包含多种不同的算法,其中ID3算法是决策树方法的典型代表,是决策树生成最常用的具体实现方法,它利用信息论中的信息增益寻找数据库中具有最大信息量的属性字段,建立决策树的一个结点,再根据该属性字段的不同取值建立树的分枝,在每个分枝集中重复建立树的下一个结点和分枝。通过这种方式,可以保证决策树具有最小的分枝数量,使得到的决策树冗余最小。但是,目前的ID3算法存在着偏向于选择属性取值较多的属性,而实际中属性值较多的属性却不总是最优的属性。多值偏向可能导致从数据集中归纳出错误的规则,使决策树的性能下降,因此测试属性的选择问题成为ID3算法的一个关键问题。针对上述问题,本文提出了一种避免了多值偏向问题的ID3改进算法——NewDtree算法。该算法是以属性相似度的理论框架为基础,通过计算条件属性和决策属性的相似度,然后把相似度的大小作为测试属性的选择标准。本文应用理论分析方法对NewDtree算法不存在多值偏向问题进行了证明,通过对NewDtree算法在UniversityofCalifornia,Irvine(UCI)机器学习数据集中的2个标准数据集训练得出的决策树进行分析,NewDtree算法能有效的提高分类的正确率,弥补了ID3算法选择测试属性时偏向取值较多的不足。最后,为了证明NewDtree算法的实用性,本文将NewDtree算法应用于以高校就业分析为主题的数据挖掘系统中,以实现对高校就业数据的分类,建立挖掘模型,进而给该校现在的管理决策者提供决策支持。该系统实现的关键技术在于构建决策树时测试属性的选择计算,以及决策规则的存取这两个问题。通过实验证明:该算法生成的决策树提取的决策规则较ID3算法有效,分类结果与实际基本相符,极大地提高了系统的工作效率。10.期刊论文姜红艳.JIANGHong-yan决策树ID3算法在学生成绩中的应用-鞍山师范学院学报2008,10(4)介绍了数据挖掘中决策树的分类方法和概念,以及著名的ID3算法,同时也介绍了ID3算法在学生成绩中的应用.本文链接:授权使用:上海海事大学(wflshyxy),授权号:71fc4575-af33-4d70-85ad-9df7005b3de7下载时间:2010年9月20日
本文标题:ID3算法的研究以及在成绩统计辅助决策系统中的应用
链接地址:https://www.777doc.com/doc-610108 .html