您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 论文开题报告-数据挖掘技术的应用
在职攻读硕士学位研究生开题报告学号:研究生类别:□高校教师□工程硕士□同等学历研究生:班剑锋导师:王燕研究方向:智能信息处理论文题目:数据挖掘技术在铝电解质量管理中的应用专业(学科):计算机技术学院:计算机与通信学院入学时间:2007年4月开题时间:年月日年月日填报说明一、开题报告中的一至七项必须采用计算机输入和打印,开题报告格式可在研究生部网址下载。二、开题报告为A4大小,于左侧装订成册。各栏空格不够时,请自行加页。三、开题答辩成绩(即每个学生开题报告评审表的平均成绩)由学院研究生专干填写,学院负责人签署是否同意开题的意见。五、开题报告通过后,分别由研究生、导师、学院和研究生部各存档一份。0学位论文题目数据挖掘技术在铝电解质量管理中的应用课题来源根据工作实践自拟一、课题意义及国内外研究现状综述1、课题意义近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,千万万个数据库被用于商业管理、政府办公、科学研究和工程开发等等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。因此,面对人们被数据淹没,人们却饥饿于知识的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融合(DataFusion)以及决策支持等。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门很广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。质量管理是企业管理的一个重要组成部分,传统的以纸介质为媒介的手工质量管理方式和方法面临着前所未有的挑战。由于铝电解冶炼行业的特点,在生产过程中会产生大量与质量有关的数据,如何管理好这些数据成为众多铝电解企业所必须面对的问题。目前,国内铝电解企业所建立的质量管理信息系统水平参差不齐,一部分企业只建立了基于单机系统的简单质量数据管理系统,系统没有覆盖质量管理的全部流程,大部分业务还是以纸介质传递为主;一部分企业建立了基于网络的质量管理信息系统,数据实现了网上传递,但对质量数据的应用,仅限于打印和简单的查询,并没有应用科学的分析方法对数据进行进一步的深度分析。采用C/S与B/S技术相结合,运用数据挖掘技术的质量管理信息系统既可以解决质量数据网上传递问题又可以对质量数据进行有效的科学分析,对铝电解企业具有非常重要的意义。2、国内外研究现状综述KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。迄今为止,由美国人工智能协会主办的KDD国际研讨会已经召开了7次,规模由原来的专题讨论会发展到国际学术大会,人数由二三十人到七八百人,研究重点也逐渐从发现方法转向系统应用,并且注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。此外,数据库、人工智能、信息处理、知识工程等领域的国际学术刊物也纷纷开辟了KDD专题或专刊。IEEE的KnowledgeandDataEngineering会刊领先在1993年出版了KDD技术专刊,所发表的5篇论文代表了当时KDD研究的最新成果和动态,较全面地论述了KDD系统方法论、发现结果的评价、KDD系统设计的逻辑方法,集中讨论了鉴于数据库的动态性冗余、高噪声和不确定性、空值等问题,KDD系统与其它传统的机器学习、专家系统、人工神经网络、数理统计分析系统的联系和区别,以及相应的基本对策。1目前,数据挖掘技术在铝电解质量管理方面的应用研究,主要集中在对系统产生的日报数据进行分析,利用决策树技术对报表数据进行处理,发现阳升时间、氧化铝加料量、阳降时间影响阳极效应的发生,可以根据给出的决策树模型找到减少效应发生概率的有效途径。工作电压、效应持续时间和效应电压会影响电解槽的平均电压,可以用数据挖掘方法来处理铝电解中大量的报表数据,从这些大量数据中获取降低能耗和成本的方法,并根据效应持续时间对平均电压进行预测。但是,铝电解生产是一个复杂的过程,影响最终成品质量的因素不仅包括电解槽生产过程的条件,还包括原辅材料质量、原铝质量、成品质量、炭块质量、铸造配比等多方面因素。因此,建立一个覆盖铝电解生产全过程的质量数据挖掘系统,利用分类、聚类、关联规则等方法发现各种数据之间的内在联系,从而总结出指导铝电解实际生产的最佳实践。随着DMKD研究逐步走向深入,人们越来越清楚地认识到,DMKD的研究主要有3个技术支柱,即数据库、人工智能和数理统计。数据库技术在经过了80年代的辉煌之后,已经在各行各业成为一种数据库文化或时尚,数据库界目前除了关注万维网数据库、分布式数据库、面向对象数据库、多媒体数据库、查询优化和并行计算等技术外,已经在开始反思。数据库最实质的应用仅仅是查询吗?理论根基最深的关系数据库最本质的技术进步点,就是数据存放和数据使用之间的相互分离。查询是数据库的奴隶,发现才是数据库的主人;数据只为职员服务,不为老板服务!这是很多单位的领导在热心数据库建设后发出的感叹。由于数据库文化的迅速普及,用数据库作为知识源具有坚实的基础;另一方面,对于一个感兴趣的特定领域——客观世界,先用数据库技术将其形式化并组织起来,就会大大提高知识获取起点,以后从中发掘或发现的所有知识都是针对该数据库而言的。因此,在需求的驱动下,很多数据库学者转向对数据仓库和数据挖掘的研究,从对演绎数据库的研究转向对归纳数据库的研究。专家系统曾经是人工智能研究工作者的骄傲。专家系统实质上是一个问题求解系统,目前的主要理论工具是基于谓词演算的机器定理证明技术——二阶演绎系统。领域专家长期以来面向一个特定领域的经验世界,通过人脑的思维活动积累了大量有用信息。在研制一个专家系统时,知识工程师首先要从领域专家那里获取知识,这一过程实质上是归纳过程,是非常复杂的个人到个人之间的交互过程,有很强的个性和随机性。因此,知识获取成为专家系统研究中公认的瓶颈问题。其次,知识工程师在整理表达从领域专家那里获得的知识时,用if-then等类的规则表达,约束性太大,用常规数理逻辑来表达社会现象和人的思维活动局限性太大,也太困难,勉强抽象出来的规则有很强的工艺色彩,差异性极大,知识表示又成为一大难题。此外,即使某个领域的知识通过一定手段获取并表达了,但这样做成的专家系统对常识和百科知识出奇地贫乏,而人类专家的知识是以拥有大量常识为基础的。人工智能学家Feigenbaum估计,一般人拥有的常识存入计算机大约有100万条事实和抽象经验法则,离开常识的专家系统有时会比傻子还傻。例如战场指挥员会根据在某地发现一只刚死的波斯猫的情报很快断定敌高级指挥所的位置,而再好的军事专家系统也难以顾全到如此的信息。以上这3大难题大大限制了专家系统的应用,使得专家系统目前还停留在构造诸如发动机故障论断一类的水平上。人工智能学者开始着手基于案例的推理,尤其是从事机器学习的科学家们,不再满足自己构造的小样本学习模式的象牙塔,开始正视现实生活中大量的、不完全的、有噪声的、模糊的、随机的大数据样本,也走上了数据挖掘的道路。数理统计是应用数学中最重要、最活跃的学科之一,它在计算机发明之前就诞生了,迄今已有几百年的发展历史。如今相当强大有效的数理统计方法和工具,已成为信息咨询业的基础。信息时代,咨询业更为发达。然而,数理统计和数据库技术结合得并不算快,数据库查询语言SQL中的聚合函数功能极其简单,就是一个证明。咨询业用数据库查询数据还远远不够。一旦人们有了从数据查询到知识发现、从数据演绎到数据归纳的要求,概率论和数理统计就获得了新的生命力,所以才会在DMKD这个结合点上,立即呈现出忽如一夜春风来,千树万树梨花开的繁荣景象。一向以数理统计工具和可视化计算闻名的美国SAS公司,领先宣布进入DMKD行列。数据挖掘所能发现的知识有如下几种:广义型知识,反映同类事物共同性质的知识;特征型知识,反映事物各方面的特征知识;差异型知识,反映不同事物之间属性差别的知识;关联型知识,反映事物2之间依赖或关联的知识;预测型知识,根据历史的和当前的数据推测未来数据;偏离型知识,揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决策的需要。当前,DMKD研究正方兴未艾,预计在21世纪还会形成更大的高潮,研究焦点可能会集中到以下几个方面:研究专门用于知识发现的数据挖掘语言,也许会像SQL语言一样走向形式化和标准化;寻求数据挖掘过程中的可视化方法,使得知识发现的过程能够被用户理解,也便于在知识发现过程中的人机交互;研究在网络环境下的数据挖掘技术,特别是在Internet上建立DMKD服务器,与数据库服务器配合,实现数据挖掘;加强对各种非结构化数据的挖掘,如文本数据、图形图像数据、多媒体数据。但是,无论怎样,需求牵引,市场驱动是永恒的,DMKD将首先满足信息时代用户的急需,大量基于DMKD的决策支持软件工具产品将会问世。二、课题研究目标、研究内容和拟解决的关键性问题1研究目标和内容研究目标:设计一套覆盖铝电解生产全过程的质量数据信息系统,建立质量数据库。利用数据挖掘技术对铝电解生产过程中产生的海量质量数据进行特征化、关联、分类、聚类分析以及演变和偏差分析,发现生产管理中存在的不足,让数据来指导电解生产,从数据中发现决策知识。研究内容:传统的铝电解质量及过程控制系统存在着网络处理能力较差,信息孤岛现象严重,数据分析能力欠缺等问题,将数据仓库与数据挖掘技术引入到铝电解质量系统中,并结合计算机网络技术,进行了深入的理论和实验研究,主要内容如下:异构数据库数据集成,目前数据集成典型的方法主要有模式集成方法和数据复制方法。其中模式集成是指在构建集成系统时将各数据源的数据视图集成为全局模式,使用户能够按照全局模式透明地访问各种数据源的数据;数据复制是指将各个数据源的数据复制到与其相关的其他数据源上,并维护数据源整体上的一致性,提高信息共享利用的效率。将数据仓库和数据挖掘技术引入到铝电解控制系统的过程中,结合铝电解的经验和知识,充分利用控制系统产生的各种数据,设计并开发铝电解数据挖掘系统;研究聚类分析模型,对氧化铝、炭块、氟化盐等原辅材料质量数据,电解槽生产过程的工作电压、效应持续时间和效应电压等数据,以及原铝质量数据的分析,实现对单槽和系列槽的槽况分类,从而找出各种因素在铝电解生产中的内在规则。数据挖掘系统的设计,把多维分析、人工智能、数据库、铝电解生产工艺等领域的技术结合在一起,通过数据准备、数据选取、数据预处理、数据变换、确定KDD目标、选择算法、数据挖掘、模式解释、知识评价的步骤从大量数据中提取有效的、新颖的、潜在有用的知识。2拟解决的关键性问题质量数据业务流程的改进。铝电解数据挖掘系统模型研究。3三、拟采取的研究方法、技术路线、试验方案及其可行性分析在铝电解生产过程中计算机控制技术已经普及,例如生产过程控制的自动化、向电解槽中添加氧化铝的自动化等。当前,电解槽系列的电流强度、槽电压及其随时间的变化
本文标题:论文开题报告-数据挖掘技术的应用
链接地址:https://www.777doc.com/doc-4283151 .html