您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 机械/模具设计 > 数据挖掘在机械制造业外购件供应系统的应用
重庆大学硕士学位论文数据挖掘在机械制造业外购件供应系统的应用姓名:张亮申请学位级别:硕士专业:计算机技术指导教师:郭平;李如斌20041110数据挖掘在机械制造业外购件供应系统的应用作者:张亮学位授予单位:重庆大学参考文献(29条)1.RakeshAgrawal.RamakrishnanSrikantMiningSequentialPatterns2.RakeshAgrawal.RamakrishnanSrikantFastAlgorithmsforMiningAssociationRules3.王军数据挖掘技术4.陈宁.周龙骧数据采掘技术5.查看详情6.JiaweiHan.JianPeiMiningFrequentPatternsPattern-Growth:MethodologyandImplications7.ProfDrirK.DeVlaminckDr.ASrinivasanFrequentPatternDiscoverinFirst-OrderLogic8.陈黎大序列挖掘算法研究20029.DorianPyleDataPreparationforDataMining199910.朱建秋数据挖掘应用案分析11.数据挖掘技术12.数据挖掘13.JiaweiHan.范明.孟小峰数据挖掘概念与技术14.张云涛.龚玲数据挖掘原理与技术15.史忠植知识发现200216.IBMIBMDB2InterlligentMinerforDataTutorial17.郝先臣.张德干.高光来.赵海数据挖掘工具和应用中的问题[期刊论文]-东北大学学报(自然科学版)2001(2)18.李绪成.王保保挖掘关联规则中Apriori算法的一种改进[期刊论文]-计算机工程2002(7)19.石教英.蔡文力科学计算可视化算法与系统20.SWeisberg.王静龙.李宝慧应用线性回归199821.万南洋数据仓库事实表的建模理论与方法[期刊论文]-计算机工程2002(11)22.杨炳儒.孙海洪.熊范纶利用标准SQL查询挖掘多值型关联规则及其评价[期刊论文]-计算机研究与发展2002(3)23.刘勇.康立山.陈毓屏非数值并行算法—遗传算法199524.钱卫宁.周傲英针对海量复杂数据的聚类分析技术研究2002(09)25.MSChen.JSPark.PSYuEfficientDataMiningforPathTraversalPatterns26.查看详情27.李德毅一种测试数据挖掘算法的数据源生成方法200028.梁曼君.张瑞.熊范纶从数据库中发掘定量型关联规则1999(08)29.段晓峰网站日志的数据挖掘[学位论文]硕士2003相似文献(10条)1.期刊论文李雄飞.苑森淼.董立岩.全勃.LIXiong-Fei.YUANSen-Miao.DONGLi-Yan.QUANBo多段支持度数据挖掘算法研究-计算机学报2001,24(6)在基于相联规则的数据挖掘算法中,Apriori等算法最为著名.它分为两个主要步骤:(1)通过多趟扫描数据库求解出频繁项集;(2)利用频繁项集生成规则.随后的许多算法都沿用Apriori中“频繁项集的子集必为频繁项集”的思想,在频繁项集Lk-1上进行JOIN运算构成潜在k项集Ck.由于数据库和Ck的规模较大,需要相当大的计算量才能生成频繁项集.AprioriTid算法给每个事务增加了一个唯一标识Tid,其特点是只扫描一趟数据库,其余趟扫描(如第k趟扫描)均在相应的数据集Ck上进行.由于数据规模改变不大,各算法的效率差别并不明显.该文提出分段计算支持度的思想,是把一个项集的支持度分段计算,每一个段记录该项集在相应规模事务中出现的频度,从而构成一个支持度向量.由于有了项集的多段支持度,可以推测出该项集能否包含在更大规模的频繁项集中,采用这种算法既提高了在扫描数据库过程中的信息获取率,又能及时剔除超集不是频繁项集的项集,进一步缩减了潜在项集的规模.在数据集扫描过程中,按文中定理1的思想调整数据集,达到提高频繁项集生成效率的目的.2.学位论文王朝晖数据挖掘与检索技术在税务系统中的应用2004本文中数据挖掘系统采用了多段支持度算法.多段支持度算法提出了分段计算支持度的思想,是把一个项集的支持度分段计算,每一个段记录该项集在相应规模事务中出现的频度,从而构成一个支持度向量.由于有了项集的分段支持度,强化了潜在频繁项集的约束条件,提高了在扫描数据库过程中的信息获取率,因此能够预知某些项集作为潜在频繁项集的价值,及时剔除超集不是频繁项集的项集,进一步缩减了候选项集的规模,同时在每趟扫描中逐次减小扫描数据规模,达到了提高频繁项集生成效率的目的.基于分段支持度思想,算法还提出了种子项集的概念,用种子项集(而不是频繁项集)来生成候选项集.由于种子项集的规模比频繁项集小,因此相应的减小了所生成的候选项集的规模.由于算法的改进,运行效率的提高,使数据挖掘系统在实践具体应用中有了很好的效果.3.会议论文蔡江辉.张继福.赵旭俊一种基于距离支持度的离群数据挖掘算法2007现有离群数据发现算法大多是针对低维数据的,这些算法在处理高维海量数据时存在效率问题,而且要求输入参数较多,影响了结果的客观性。针对不同要求下离群数据发现任务,利用距离支持度来改变离群数据的约束范围,提出了一种基于距离的高维海量离群数据挖掘算法DB-HDLO,该算法与传统的最短距离系统聚类算法SL具有相同聚类结果。以恒星光谱数据为数据集,实验验证了该算法能够高效准确地对高维海量数据聚类,并根据不同要求发现离群数据。4.学位论文李刚基于多支持度的正负关联规则挖掘技术的研究2008关联规则的研究是数据挖掘的重要内容之一,现有的关联规则挖掘算法大都是在频繁项集的基础上进行挖掘,关于非频繁项集的研究较少,然而在研究负关联规则后,非频繁项集因包含重要的负关联规则而变得非常重要。同时,现有的关联规则挖掘算法大多是在单一最小支持度的限定条件下进行的,而事实上由于不同数据属性的发生频率不同,仅依靠单一的最小支持度限定就可能无法正确反映挖掘对象本身的特征。为了弥补单一最小支持度的不足,进而出现了多最小支持度算法。本文在多最小支持度算法的基础上,对多支持度算法进行了改进和完善,提出了3种新的算法:MMS-inFS算法、2LMS-inFS-FS算法和MLMS算法。MMS-inFS算法是在多支持度算法的基础上增加了一种对非频繁项集的约束机制,使其能够同时挖掘频繁项集和非频繁项集。2LMS-inFS-FS算法是基于两级多支持度的挖掘算法,是将MMS-inFS算法中的对非频繁项集的约束由单一的支持度更改为多支持度,即对每个项集设定了两级支持度,一级支持度用于约束频繁项集,另一级用于约束非频繁项集,这样能够更好的限定频繁项集和非频繁项集。MLMS算法是一种基于多层最小支持度的算法,即对不同长度的项集采用不同的最小支持度。对于新提出的算法模型,我们与其它几种模型进行了比较,并且通过实验表明这些算法是非常有效的。5.期刊论文林海萍.LINHai-ping数据挖掘的容错性研究-现代计算机(专业版)2006,(7)应用容错式挖掘,更多有用的信息可以从真实世界被噪音干扰的数据中获取.然而在过去相关的研究中,容错式频繁模式挖掘问题不是没有成熟的定义,就是将问题局限于仅找出允许固定错误数据项数的频繁模式.本文提出了比例性容错频繁模式挖掘的问题,并给出了两个实现算法:第一个算法称为FT-BottomUp,采用FT-Apriori定理找出允许所有可能错误数据项数的容错频繁模式;第二个算法FT-LevelWise,将所有的容错频繁模式按照它们所允许的错误数据项目数量分成多个群组,并分别挖掘出各个群组内的频繁模式.6.学位论文白秀玲基于支持度的粗糙集约简算法研究2003该文研究了已有的粗糙集约简算法,分析了这些算法中存在的问题,提出一种粗糙集约简算法RSVR,该算法以实用性作为设计目标,重点不在于求得最佳属性约简,而在于求得满足用户需求的最佳值约简,同时对支持度不同的规则分别作不同处理,以满足用户的需要.该算法具有如下特点:结合关联规则和粗糙集挖掘方法;加入用户主观信息,删除支持度很小的规则,提高约简率;主要针对某些类型的实用系统进行值约简.通过对真实数据集的测试,比较了其它约简算法,结果表明:该算法简单有效,易于实现,能获得较好的约简.该文设计和实现了一个数据挖掘原型系统:院内感染数据挖掘系统.该系统具有KDD基本的系统结构,依照KDD的步骤,利用约简算法RSVR进行数据挖掘.通过与其它粗糙集约简算法的比较,表明:该算法的约简效率大大优于其它粗糙集约简算法,挖掘出的结果基本符合日常生活,具有很好的实用价值.7.期刊论文沈亚萍.郑诚.SHENYa-ping.ZHENGCheng在多数据库中确定支持度的有效方法-计算机工程与设计2008,29(23)提出了一种用于在多数据库环境下确定模式的支持度的方法.数据挖掘总是在强关联规则模式中进行挖掘,因此计算模式的支持度必不可少.由于多数据库与单数据库的本质不同,单数据库中的支持度只具有本地效应,它的数值和计算方法在多数据库中都是不适用的,因此需要找到一个在多数据库中计算支持度的方法.又由于每个本地数据库的各方面情况不同,因此各自在总部制定决策时的地位和重要性也就各异.于是,在考虑某模式的支持度时,不能简单的将该模式在各本地数据库中的支持度进行平均,而需要引进权值的概念.在综合考虑了这些因素之后,提出了一些确定权值的方案,并给出了一个基于权值计算支持度的方法.8.期刊论文张春生.宋琳琳.ZHANGChun-sheng.SONGLin-lin分段支持度Apriori算法及应用-计算机工程与应用2010,46(16)首先指出单支持度的Apriori算法的局限性,分析了目前为克服单支持度Apriori算法的局限性而提出的多支持度的Apriori算法的不完备性,针对事务中的一些潜在规则,提出了一种分段支持度Apriori算法.算法不是简单地对经典Apriori算法进行扩展或改进,而是从理论上破坏了Apriori算法全局、高频两个性质,采用分段支持度的方法对数据库进行数据挖掘,可以发现经典和多支持度Apriori算法不能发现或很难发现的强关联规则,并以较快的速度得以实现.9.期刊论文宫雨.GONGYu分组多支持度关联规则研究-计算机工程与设计2007,28(5)关联规则是数据挖掘的重要任务之一,传统关联规则算法只有一个最小支持度,假设项出现的频率大致相同,而在谮实际中并非如此,由此产生了多支持度关联规则问题.该问题针对每个项给定不同的支持度,而在实际应用中项可以划分成若干个组,每组有一个支持度.由此提出了分组多支持度关联规则问题,针对该问题给出了基于多支持度性质对项进行分组的方法.该方法可以降低2-项候选集的数目.在此基础上,进一步给出了相应的多支持度关联规则发现算法,并通过实验证明了算法的有效性.10.学位论文朱晓东基于支持度变化的关联规则挖掘算法及实现2005随着数据库技术的发展,我们已经积累了海量的数据.这些数据中蕴涵了大量有价值的知识、模式、规律等,人们为了获得这些信息用以指导自己的生产、生活而应运产生了数据挖掘技术.数据挖掘又称为数据库中的知识发现,在最近几年被数据库界广泛研究,并且已经在商业、金融、医疗等领域得到成功地应用.因此,数据挖掘技术的研究就有着重要的意义.关联规则是数据挖掘的一个重要挖掘方法.自从Agrawal等学者于1993年首先提出了挖掘顾客交易数据库中项集的关联规则问题以来,诸多的研究学者对关联规则进行了大量的研究并取得了丰硕的成果.由于关联规则挖掘一般面向的是大型事务数据库,关联规则的提取需要重复扫描数据库,因而当前在关联规则挖掘领域的研究热点集中在如何提高挖掘算法的高效性上.本文就针对这个问题提出了一种从大型数据库中挖掘关联规则的快速算法.由于当使用关联规则进行数据挖掘时,使用者为了达到一定的挖掘效果,经常需要不断地改变关联规则的支持度阈值,因此该算法以经典的Apriori算法为
本文标题:数据挖掘在机械制造业外购件供应系统的应用
链接地址:https://www.777doc.com/doc-125779 .html