您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 人工神经网络及其在化工中的应用
人工神经网络的算法及其在化工中的应用摘要摘要数据挖掘技术是当今一项新兴技术,它综合运用人工智能、计算智能、模式识别、数理统计等先进技术从大量数据信息中挖掘和发现有价值和隐含的知识。人工神经网络是由大量同时也是很简单的处理单元广泛连接构成的复杂网络系统。它具有自学习、高容错和高度非线性描述能力等优点,使其在化工领域得到了广泛的应用。这些应用主要包括:故障诊断、过程控制、物性估算、专家系统和建筑节能等。但人工神经网络在化工领域的进一步应用还有赖于对化工领域问题的抽提(即符合神经网络的输入输出表达)及网络本身性能优化的进一步研究。关键词:数据挖掘技术;人工神经网络;化工应用人工神经网络算法及其在化工中的应用11数据挖掘技术1.1数据挖掘技术概述化工生产在生产产品的同时,也产生大量关于生产过程的信息。这些信息的有效利用极大地促进了化工生产的科学管理和生产优化,与此同时,日益积累的信息也带来了许多新的挑战和问题,如信息过量、信息真假难辨、信息安全隐患、信息矛盾等。面对这一挑战,数据挖掘技术应运而生,并显示了强大的生命力。[1]数据挖掘是一门交叉学科,涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算机和专家系统等多个领域。数据挖掘的两个高层次目标是预测和描述。预测的基本任务包括分类、回归、时间序列分析和预测。描述的基本任务包括聚类、总结、关联规则和序列发现。数据库技术只是将数据有效地组织和存储在数据库中,并对这些数据作一些简单分析,大量隐藏在数据内部的有用信息无法得到。而机器学习、模式识别、统计学等领域却有大量提取知识的方法,但没有和实际应用中的海量数据结合起来,很大程度上只是对实验数据或学术研究发挥作用。数据挖掘从一个新的角度将数据库技术、机器学习、模式识别和统计学等领域结合起来,从更深层次中发掘存在于数据内部有效的、新颖的、具有潜在效用的乃至最终可理解的模式。1.2数据挖掘技术分类数据挖掘技术通常可以分为一下几种方法:[2](1)数学统计方法数学统计方法主要用于完成总结知识和关联知识挖掘。它利用统计学、人工神经网络算法及其在化工中的应用2概率论的原理对关系中各属性进行统计分析,建立一个数学模型或统计模型,以找出他们之间的关系和规律。常用的统计方法包括判别分析、因子分析、相关分析、回归分析、偏最小二乘回归(PLS)和聚类法等。(2)决策树决策树技术主要用于分类、聚类和预测的预测建模技术。它利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的字段,建立决策树的一个结点,再根据字段的不同取值建立树的分枝,在每个分枝子集中重复建立下层结点和分枝,这样便生成一颗决策树。接着对决策树进行剪枝处理,再把决策树转化为规则,利用这些规则可对新事例进行分类。典型决策树方法有分类回归树(CART)、ID3和C4.5等。(3)模式识别方法模式识别是数据挖掘的主要方法之一。它是一种借助于计算机对信息进行处理、判决分类的数学统计方法。模式识别方法大致可以分为统计模式识别和句法模式识别两大类。统计模式识别将每个样本用特征参数表示为多维空间中的一个点,根据“物以类聚”的原理,同类或相似的样本间的距离应较近,不同类的样本间的距离应较远。这样,就可以根据各样本点间的距离或距离的函数来判别、分类,并利用分类结果预报未知。统计模式识别是工业优化中的常用方法。(4)人工神经网络方法人工神经网络方法用于分类、聚类、特征挖掘、预测和模式识别。神经网络方法模仿动物的脑神经元结构,以M-P模型(由Mceulloch和Pitts提出)和Hebb学习规则为基础。在本质上是一个分布式矩阵结构,通过对训练数据的挖掘,逐步计算(包括反复迭代或累加计算)神经网络连接的权值。(5)遗传算法人工神经网络算法及其在化工中的应用3遗传算法主要用于解决全局优化问题,适用于分类和关联规则挖掘等。遗传算法是一种基于达尔文进化论中基因重组、突变和自然选择等概念的算法,具有随机性和自适应性等特点。从一个初始规则集团(如知识基因)开始,逐代地通过交换对象成员(杂交、基因突变)产生群体(繁殖),评价并择优复制(适者生存,不适者淘汰),逐代积累计算,最终得到最优的或是近似最优的知识集。(6)粗糙集方法粗糙集方法用于数据简化(例如,删除与任务无关的记录或字段)、数据意义评估、对象相似或差异性分析、因果关系及范式挖掘等。RoughSet理论是Pawlak在20世纪80年代提出来的,用于研究非精确性和不确定性知识的表达、学习、归纳等方法的。主要思想如下:在数据库中将行元素看成对象,列元素是属性,把对象的属性分为条件属性和决策属性,按各属性值是否相同划分等价类。等价关系R定义为不同对象在某个(或几个)属性上取值相同,这些满足等价关系的对象组成的集合称为该等价关系R的等价类。(7)支持向量机方法支持向量机方法主要用于有限数据的分类、回归和预报建模。早在20世纪60年代,以数学家Vapnik为代表的学派就开始努力建立一套能保证从有限样本得出预报能力最强数学模型的“统计学习理论”(statisticallearningtheory,简称SLT)并于1992年和1995年先后提出分类和回归的支持向量机算法(supportvectormachine,简称SVM)。支持向量机的基本思想可以概括为:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数实现的。SLT和SVM算法在很大程度上解决了模型选择与过拟合问题,小人工神经网络算法及其在化工中的应用4样本、非线性和维数灾难问题,局部最小点问题等。(8)可视化技术可视化是计算机应用技术的发展趋势,也是数据挖掘的研究方向之一。可视化数据分析技术拓宽了传统的图表功能,用直观图形式将信息模式、数据关联或趋势呈现给决策者,使之能交互分析数据关系,如把数据库中多维数据变成多种图形对揭示数据总体状况、内在本质及规律至关重要。可视化技术将人的观察力和智能融入数据挖掘系统,极大提升了系统挖掘的速度、层次和内容。2.神经网络方法概述2.1神经网络方法的发展从1943年心理学家W.S.McCulloch和数学家W.Pitts研究并提出M-P神经元到今天,人类对神经网络的研究已过了半个多世纪的历程。进入80年代后期,在美国、日本等一些工业发达国家里,掀起了一股竞相研究神经网络的热潮,神经网络的研究进入复苏阶段,特别是1986年Rumelhart和McCelland为首的科学小组提出的误差逆传播学习网络及其学习算法,已成为至今影响最大的一种网络学习法。到了21世纪,神经网络技术逐渐趋于成熟和理智。[3]人工神经元网络(ArtificialNeuralNetwork,简称ANN)是模仿人类脑神经活动的一种人工智能技术,是由大量的同时也是很简单的处理单元广泛连接构成的复杂网络系统。人工神经网络是建立在现代神经科学研究基础上的一种抽象数学模型,它反映了大脑功能的基本特征,但并非逼真地描写,只是某种简化、抽象和模拟。给ANN一些样本,ANN通过自学习可以掌握样本规律,在输入新的数据和状态信息时,可用ANN进行自动推理和控人工神经网络算法及其在化工中的应用5制。由于反向传递学习算法BP网络和Hopfield网络的出现与再次兴起,使其应用领域不断扩大。2.2神经网络方法分类人工神经网络有多种算法,但可粗略地分为两类:有教师学习的人工神经网络和无教师学习的人工神经网络。前者主要是对已知样本进行训练,然后对未知样本进行预测。此类方法的典型代表是误差反向传播(BP,BackPropagation)人工神经网络。后者亦称自组织人工神经网络,无须对已知样本进行训练,则可用于化合物的分类,如Kohonen神经网络和Hopfield神经网。2.3BP神经网络算法在以上各种算法中,应用得最多的是BP人工神经网络[4]。从结构上讲,BP网络是典型的多层网络,分为输人层、隐含层和输出层,层与层之间采用完全互连方式,同一层单元间不存在相互连接。BP网络的第一层即输入层,接受外界输入,最后一层即输出层,产生输出。在输入层和输出层之间,有若干个隐含层。在各层之间,只有相邻层的神经元之间存在联系。对输入X进行某种函数运算,即得到神经元的输出Y。在化工的应用领域中,常用的函数形式是S型函数F(x)。1F1expxxBP算法的具体步骤是:(1)初始化,即随机地设置各层权重系数和值;(2)将训练样本数据X加到网络输入端,计算各层的输出Y,将输出值与期望值相比得到误差信号;人工神经网络算法及其在化工中的应用6(3)根据误差信号重新调整连接权重;(4)如果小于预定误差,则认为网络已收敛而停止学习,反之,则返回(2)继续学习(3)。算法框图如下:图1BP算法框图3.神经网络方法应用化工行业有着生产过程复杂、对象特性多变、间歇或半连续生产过程多、有一定的危险性及污染环境等特点,使得化工领域需要一个技术及环境的改支撑环境,对其进一步发展有很大的促进作用。ANN在化工中的应用主要在以下几个领域:故障诊断、过程控制、物性估算、专家系统和建筑节能。人工神经网络算法及其在化工中的应用73.1故障诊断当系统的某个环节发生故障时,若不及时处理,就可能引起故障扩大并导致重大事故的发生。因此建立高效的、准确的实时故障检测和诊断系统,消除故障隐患,及时排除故障,确保安全、平稳、优质的生产,已成为整个生产过程的关键所在。故障诊断是ANN最有应用价值的领域[5]:(1)通过训练ANN,可形成和存储有关过程知识并直接从定量的历史故障信息中学习;(2)ANN具有滤出噪音及在噪音情况下得出结论的能力,使ANN适合于在线故障诊断和检测;(3)ANN具有分辨原因及故障类型的能力。常用故障诊断方法是反向传播的方法(BP网)和径向偏置函数网络(RBF网),但另一方面模糊神经元网络作为一种更接近人脑思维的网络,可能是解决此问题的关键和研究方向。神经网络用于故障诊断和校正不必建立严格的系统公式或其它数学模型,经数据样本训练后可准确、有效地侦破和识别过失误差,同时校正测量数据中的随机误差。与直接应用非线性规划的校正方法相比,神经网络的计算速度快,在化工过程的实时数据校正方面具有明显的优势。然而现有的神经网络软件,直接应用于测量数据校正时,需要进行离线的训练,难以同数据校正系统有机地相结合;其次,为适应化工过程数据的复杂性,需要提高神经网络算法的训练速度和收敛性[6]。3.2过程控制随着化学工业的不断发展,对化工过程控制的要求日益严厉。常规的控制系统有时会显得力不从心,而神经网络本身所具有的优点正好能满足控制人工神经网络算法及其在化工中的应用8过程的主要要求:——处理日益复杂的系统的需要;——过程设计要求日益增高的需要;——减少不确定因素及环境要求的需要。神经网络的出现及应用也变得自然。随着ANN研究的不断深入,神经网络越来越多地应用于控制领域的各个方面,从过程控制、机器人控制、生产制造、模式识别直到决策支持神经网络都有应用。ANN可以成功地建立流程和控制参数间的非线性关系及构造相关的数学模型,并可跟踪瞬息过程及具有稳健功能等,因此可有效地用于化工过程最优化和控制。1986年,Rumelhart第一次将ANN用于控制界。神经元网络用于控制有两种方法,一种用来构造模型,主要利用对象的先验信息,经过误差校正反馈,修正网络权值,最终得到具有因果关系的函数,实现状态估计,进而推断控制;另一种直接充当控制器,就像PID控制器那样进行实时控制。神经元网络用于控制,不仅能处理精确知识,也能处理模糊信息。Hussain认为神经网络在化工过程控制领域的应用主要在三个方面:预测控制、反向模型基础控制和适应控制。而在控制工艺中,神经网络用得最多的便是预测控制工艺。Edwards和Goh阐述了ANN用于优化控制相对其它传统的线性参数模型的一些优点。这种预测控制算法是以模型为基础的,同时包含了预测的原理,可以灵活方便地处理输入输出等的约束问题。图2展示了神经网络的预测控制策略。3.3物性估算用神经
本文标题:人工神经网络及其在化工中的应用
链接地址:https://www.777doc.com/doc-2752298 .html