您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > [译]人工神经网络技术在模式识别中的应用
题目:人工神经网络技术在模式识别中的应用原题目:useofartificialneuralnetworkinpatternrecongnition学院:内蒙古农业大学专业:农业电气化与自动化学号:2013205037姓名:祁飞导师:武佩教授论文提交日期:二О一四年七月二十人工神经网络技术在模式识别中的应用JayantaKumarBasuDebnathBhattacharyyaTai-hoonKimComputerScienceandEngineeringDepartmentHeritageInstituteofTechnologyKolkata,Indiabasu.jayanta@yahoo.co.inMultimediaEngineeringDepartmentHannamUniversityDaejeon,Koreadebnath@sersc.com,taihoonn@empal.com摘要在众多传统的模式识别中,关于统计法的研究最深入,并且已经在实践中应用。近年来,结合人工智能神经网络技术的模式识别引起了人们重大的关注。该识别系统的设计需注意以下问题:模式类、传感环境、模式表示、特征提取和选择;聚类分析、分类器的设计和学习、选择、训练和测试样本、绩效评估。尽管已经对该领域研究了近乎50年,但是对复杂多向性的模式的识别,定位以及规模的设定等普遍问题仍没有较好的解决方法。新兴的技术,如数据挖掘(指从资料中发掘资讯或知识),网络搜索,多媒体数据,人脸识别,andcursive手写识别,检索等都基于强大和高效的模式识别技术。本文的目的就是总结和比较了几种著名的方法。这些方法应用于不同时期的人工神经网络,识别研究的主题和应用。这些方法都走在这一令人激动和具有挑战性的领域的最前沿。关键词:模式识别,相关性,神经网络。1.介绍模式识别是研究如何实现机器对环境的观察,让机器学会从它们所观察的环境背景中提取兴趣信息(此处的兴趣实为人为设定的特征范围),并且做出合理可靠的模式类别。尽管已经经历了近50年的研究,对于一般的机器模式识别系统的设计仍是一个可望而不可及的目标。在大多数情况下,人类才是最佳的模式识别系统。但我们至今无法破解人类是如何进行高效的模式识别的。ROSS强调诺贝尔奖获得者赫伯特西蒙,他主要发现了模式识别对于人们的研究有至关重要的影响:“模式间的相关性越高,则得到的结果越准确。”这对于支持人工智能的人们来说是一个好消息。由于计算机可以稳定的进行模式识别,事实上成功的计算机程序可以进行如下工作:帮助银行信用分数的申请人,帮助医生诊断疾病,在某种模式识别的基础之下帮助飞行员降落……我们需要投入更多的经历来对模式识别进行研究。我们的目标是介绍一种基于人工神经网络的模式识别方法。并且是利用可用的传感器,处理器和领域知识去进行自动判断的最好,最可行的方法。2.模式识别自动(机器)识别,描述,分类,模式分类,这些问题对于各种各样的工程和科学学科,如生物学,心理学,医学,市场营销,计算机视觉,人工智能和遥感是非常重要的。所谓的模式可以是一个指纹,一个手写的字,一个人的脸或者一段声音。识别/分类一种模式,有以下两种方式之一:(1)监督分类方法(例如:判别分析)。用已知类别的样本训练分类器。(2)非监督分类方法(例如:聚类分析)。样本的数据类别未知。模式识别被用于解决分类问题。通常分类规则由设计者设定(监督分类方法)或者根据样本之间的相似性进行分类(非监督分类方法)。其应用还包括数据挖掘(定义一个“模式”,例如相关性或者大量的多维模式中的异常值),文件分类(有效的搜索本文文档),财政预测,多媒体数据库的组织和检索,生物识别技术。随着计算机技术的迅速发展,大规模数据的处理速度得到大幅提升。数据分析和分类的方式是多样并精确的,同时也对其应用进行了扩展。与此同时,随着对大规模数据处理和性能严格控制方面(速度,准确性和成本)的需求日益增加,自动模式识别系统开始迅速发展。模式识别系统的设计主要涉及以下三方面:(1)数据的采集和预处理;(2)数据表示;(3)数据分类规则制定。所要识别的问题决定了传感器的类型。传感器可用于预处理技术,表示方案和数据分类模型的确定。人们普遍认为要对所识别的问题定义清晰,并且对其充分约束(小组内差异和大组内差异),才会得到简单的模式识别表示法和数据分类模型。对于大部分模式识别系统来说,从一些例子中(训练集)进行学习是很重要的,并且可以作为系统理想的属性参数。四个用于模式识别最有名的方法是:(1)模版匹配;(2)统计分类;(3)语法、结构匹配;(4)神经网络。3.人工神经网络神经网络技术的主要特点:研究复杂的非线性输入输出之间的关系。通过一连串的训练过程,自动调整以适应数据。目前神经网络对模式识别技术最常用的是前馈网络。前馈网络包含多层感知器和径向基函数网络。另一种常用的网络是自组织映射(SOM),或者Kohonen神经网络。它主要用于数据聚类和特征映射。为了使神经网络能有效地完成特定的分类识别任务,神经网络过程学习过程中需要涉及到网络更新结构和连接的权重。用神经网络模型解决模式识别问题的方法如今已经成为主流。原因有两点:人们对于特定的领域看似低的需求和初学者对于高效算法学习的必要性。人工神经网络(ANNs)为特征提取(使用隐藏层)和分类(例如:多层感知器)提供了一套新的非线性算法。此外,除了特征提取外,分类算法也可以应用神经网络技术,为实现理想的硬件设备提供方法。神经网络技术是通过模拟生物神经系统实现的。它可以像大脑那样处理信息。这种模拟技术最先进的就是通过新颖的结构对信息进行处理。神经网络技术的工作原理是通过大量高度关联的神经元互相协调共同解决问题的。一般针对性的应用于模式识别和数据分类。神经网络技术需要通过不断的学习过程才能实现它的意义。而这个学习的过程实际上就是不断调整神经元之间的突触。4.研究进展基于模式识别技术的交互式语音应答系统(IVR),由SyedAyazAliShah,AzzamulAsar和S.F.Shaukat二人于2009年第一次提出。此系统可以在用户输入正确密码之后,要求用户输入自己的声音样本,系统将自动验证用户身份。加入语音模式识别技术可以进一步提高安全级别。此系统的发展完全针对固定电话系统。对系统测试的结果较为满意的地方是其对于错误信息可以较快的进行回馈。它可以有效的为电话或者类似媒体提供身份识别保护。在这里,将声音中的梅尔频率倒谱系数(MFCC)作为特征向量进行提取。而多层感知器(MLP)用于将提取出来的特征值进行匹配。模型的频率是8kHz,采用8位脉冲格式码进行调制。在最高层,所有的语音识别系统都包含两个模块:特征值模块和特征值匹配模块。同样也有两种操作模式:训练模式和识别模式。这两种模式都包含特征值提取和特征值匹配。语音识别系统在训练模式下创建数据库,又称为系统的数据收集。在这种模式下,从声音信号中提取有用的特征值和模型进行训练。该模型的功能应尽可能的超越已知的训练库,以便其能有效地区分是否为本人声音,排除替代者的声音。在识别模式下,系统对未知说话人的身份进行判断。在这种模式下,系统从相同的未知说话人的语音信号中提取特征值,因为在训练模式,因此提取到的特征值需要跟数据库中的值做比较,然后计算相似得分。根据计算所得的分数进行判别。系统说话人进行验证,最终返还的结果无非是接受或者拒绝两种。产生于说话人验证系统的两种类型的错误—假拒绝(FR)和假接受(FA)。当正确说话者的声音遭到系统拒绝,那么称为假拒绝(FR),反之成为假接受(FA)。对于任务底层数据不明确的情况,神经网络技术是处理输入输出之间复杂关系最有效的方式之一。神经网络技术是相对较为先进的研究此情况的方法。在这项技术之中,前馈反向传播网络用于对声音进行分类。该网络通过使用MFCC技术提取特征值从而创立训练集。这个模型是一个专门针对说话者语音识别的系统,它可以正确的识别说话人身份而拒绝其他顶替者。多层感知器(MLP),共有四层:输入层,两个隐藏层和一个输出层。其中输入层有19个神经元(指使用MFCC提取的19个特征向量),传递函数为线性。该输出层只有1个神经元(二元决策),传递函数为线性。该系统的训练算法为反向传播算法。并且通过建立训练函数进行训练。这个训练函数通过训练数据来实现(监督式学习)。其算法采用梯度下降算法(GD)。在测试阶段,系统对于识别目标声音,设定了10%的容差。如果系统输出值大于或小于10%,则系统的识别结果仍然是精确情况下的接受或者拒绝,不会产生偏差。测试的数据包括神经网络已经训练过的50个目标声音样本(正在训练神经网络的样本除外)和125个顶替者的声音样本。顶替者的声音样本从13个人(男)中收集。50个声音样本中,有41个可以被识别。因此误识别率仅有18%。同样的对于125个顶替者的声音样本,只有17个被错误的接受为正确声音样本。因此误接受率大约为14%。目前,应用于识别股票价格的算法主要有两种:基于规则匹配的算法和基于改进的算法。然而,这两种算法都需要其领域专家的参与,并且其学习能力较弱。为解决这些问题,XinyuGuo,XunLiang&XiangLi提出了基于人工神经网络的股票价格模式识别方法。实验表明,神经网络可以有效地对模式特征进行学习。并且准确的对模式进行识别。至于股票投资方面的识别技术,已经过研究团队全面的审核。技术模式分析被认作是最重要的技术分析方法之一。根据长期的股票分析经验,股票分析师总结出大量有利于投资策略的技术,大体分为两类:连续模式和反转模式。连续模式指出,股票价格将保持目前的趋势。而反转模式指出:股票价格将顺着相反方向发展。本文中,18个典型的技术模式被选择为研究对象,包括10个连续模式和8个反转模式。该模式识别技术主要可以分为两大类:第一类是基于规则的算法,第二类是基于模版的算法。在股票价格模式识别系统中,基于神经网络技术的方法已经被提出。然而最明显的区别在于该网络的输入并不包括该系列中的每一个时间节点。相反地,分割过程就在这个系统中将初始时间序列分割并且提取相应的特征值。对于每一个特征值,分割的过程中,就价格来说,其特征值都在最后的时刻才计算。最终由价格特征值序列代替整个时间序列,并作为网络输入的一部分。通过调整分割长度,不仅减少了计算代价,还改变了对于股票识别的时间间隔。在这里,18种典型的模式识别技术已经被审查过了。三层前馈神经网络通常由一个输入层,一个输出层和一个隐含层构成。在输入层中,每一个神经元对应一个特征值,在输出层,每一个神经元都对应一个预设的模式。最好的情况是一旦某样本被输入到网络中,将输出零向量而样本所属的模式除外。然而,由于分类误差的存在,一些测试样本不属于18种预设模式。一些不能按照预设精确的输出。508间证券交易所提供2029个样本,其中包括593个连续模式和1436个反转模式。作为训练样本,与此同时,4937个样本中155个是在同时间间隔中,从其他证券交易所获得的。有54个连续模式,270个反转模式,4613个两者都不属于。为了提高电力系统短期负荷预测的精度,2007年,一种新型负荷预测模型由WenjinDai,PingWang提出。该文章提出了使用模式识别实现短期负荷预测的方法。这种模式识别方法的输入集属于多层fed-forward神经网络。系统通过BP学习算法训练样本。负荷预测已经成为研究电气工程的主要领域之一。近年来,将人工神经网络技术用于短期负荷预测,可以把握因素的内部规则并且可以完成复杂的数学映射运算。因此,人工神经网络技术可以大规模的有效地应用于短期负荷预测。短期负荷预测在电力系统安全,经济运行规划方面非常有用。它也被用于启动和关闭机组。通过运输计划和负荷管理。电功率的特点之一就是它不能被储存。也就是说,电能的产生,传输,分流和使用都是同时的。此系统中,神经网络参照以前的负载模式,并且利用最近的负荷数据预测结果。它在全球范围内有效地为电力系统短期负荷预测提供方法。反响传播已被实验,所提出的方法并不需要计算大量的时间。用于训练神经网络的
本文标题:[译]人工神经网络技术在模式识别中的应用
链接地址:https://www.777doc.com/doc-2861015 .html