您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 知识工程学一个新的重要研究领域
2007年7月教育技術學報Jul.2007第1卷第1期JournalofEducationalTechnologyVol.1No.182知识工程学:一个新的重要研究领域黄荣怀1,李茂国2,沙景荣31北京师范大学网络教育实验室,北京100875;2教育部高等教育司,北京100816;3北京师范大学网络教育实验室,北京100875[摘要]知识工程是源于专家系统建造而形成的一个研究领域,目前已经成为一个跨学科的综合学科。本文简要介绍了知识工程的概念,分析了知识工程的主要研究领域,如软计算、Agent、自然语言理解、逻辑与推理、形象思维研究、基于事例的推理、机器学习、知识本体论等的主要进展及存在的问题。最后提出广义的知识上程学是“一门研究人类智能及人类知识的机理,以及如何用机器模拟人的智能并促进人类知识发展的学科”,也可以且应该作为教育技术学的一个重要研究方向。[关键词]知识工程;人工智能;教育技术;专家系统一、知识工程概述1977年第五届国际人工智能联合会议上,美国斯坦福大学(StanfordUniversity)计算机系教授费哥巴姆(Feigenbaum)作了关于“人工智能的艺术”(TheArtofArtificialIntelligence)的讲演,提出“知识工程”这一名称,指出“知识工程是应用人工智能的原理与方法,对那些需要专家知识才能解决的应用难题提供求解的手段。恰当地运用专家知识的获取、表达和推理过程的构成与解释,是设计基于知识的系统的重要技术问题”[1]。知识工程的发展从时间上划分大体经历了3个时期:1.大约从1965年至1974年为实验性系统时期。1965年费哥巴姆教授与其他科学家合作,研制出DENDRAL专家系统。这是一种推断分了结构的计算机程序,该系统贮存有非常丰富的化学知识,它所解决问题的能力达到专家水平,甚至在某些方面超过同行专家的能力,其中包括它的设计者。DENDRAL系统标志着“专家系统”的诞生。2.从1975年至1980年为MYCIN时期。20世纪70年代中期MYCIN专家系统研制成功,这是一种用医学诊断与治疗感染性疾病的计算机程序“专家系统”。MYCIN专家系统是规范性计算机专家系统的代表,许多其他专家系统都是在MYCIN专家系统的基础上研制而成的。MYCIN系统不但具有较高的性能,而且具有解释功能和知识获取功能,可以用英语与用户对话,回答用户提出的问题,还可以在专家指导下学习医疗知识,该系统还使用了知识库的概念和不精确推理技术。MYCIN系统对计算机专家系统的理论和实践,都有较大的贡献。3.1980年以来作为知识工程的“产品”在产业部门开始应用的时期。知识工程的研究,目前在美国开展得较为活跃和深入,并且主要集中在斯坦福大学。人工智能的研究表明,专家之所以成为专家,主要在于他们拥有大量的专门知识,特别是长时期从实践中总结和积累的经验技能知识。从知识工程的发展历史可以看出,知识工程是伴随“专家系统”建造的研究而产生的。实际上,知识工程的焦点就是知识。知识工程领域的主要研究方向包含知识获取、知识表示和推理方法等,其研究目标是挖掘和抽取人类知识,用一定的形式表现这些知识,使之成为计算机可操作的对象,从而使计算机具有人类的一定智能。人工智能的研究方向非常广泛,本文对以下几个典型的研究方向作简要介绍和分析,以此说明如何使机器(主要指计算机)“具有”人类智能所面临的困难及存在的问题:·软计算:模仿自然法则的计算方法·主体Agent:机器世界中有“思维”的个体知识工程学:一个新的重要研究领域83·自然语言理解与机器翻译:让机器“懂得”人类语言·逻辑与推理:机器的“思维”机制·形象思维研究:让机器具有“视觉认知”·基于事例的推理:让机器应用“经验(知识)”·机器学习:让机器也能“学习”·知识本体论:认识“知识”的本质要让计算机“具有”人类智能,首先必须了解“人类智能”,“人类智能”离不开“人类知识”,因此必须研究“人类知识”的机理。另一方面,人工智能的最终目的还是为人类服务,让人类具有更多的“智能”,促进人类知识的发展,因此需要从教育、心理、传播、社会、经济等不同的角度和维度来研究有关人类知识的问题。所以,笔者认为需要提出一个广义的知识工程学的概念,它是“一门研究人类智能及人类知识的机理,以及如何用机器模拟人的智能并促进人类知识发展的学科”。教育技术学作为一门涉及教育、心理、传播、信息科学等的综合性交叉学科,它不仅要研究教育中的“技术”问题,而且要利用其研究主体的特殊知识背景来研究知识发现、知识处理、知识传播、知识扩散等问题。因此,教育技术学作为一个联结教育、心理、传播、信息科学等学科的重要纽带,也可以且应该把(广义的)知识工程作为其一个重要的研究方向。二、关于智能计算凡是仿照自然法则构造的计算,均可称为智能计算(Computationalintelligence),有时也称为软计算(Softcomputing)。它主要包括三个内容:模仿人类处理方式引入的模糊计算(Fuzzycomputing)、依据生物神经网络的工作规则引入的神经计算(Neuralcomputing)和模仿生物界的“优胜劣汰”法则的遗传算法和进化计算(Evolutioncomputing)。人工神经网络是模仿人类大脑的某些工作机制的一类计算模型。它始于1943年美国学者McCulloch和Pitt、首先提出的一种神经元的数学模型,即M-P模型。在20世纪40、50年代形成了第一次高潮。由于理论及技术两方面的限制,60、70年代进入第一个低潮。到80年代中期,由于理论研究的进展,特别是有效学习算法(即下面要谈到的机器学习)的提出,如BP算法等,神经网络研究开始复苏,出现了第二次高潮。到目前,第二次浪潮似乎已经退去。神经网络在模式识别方面有一些成功的应用,包括用于分类、识别或优化计算等。遗传算法是模拟自然界中按“优胜劣汰”法则进行进化过程而设计的算法。Bagley和Rosengerg于1967年在他们的博士论文中首先提出了遗传算法的概念。1975年Holland出版的专著奠定了遗传算法的理论基础。如今遗传算法不但给出了清晰的算法描述,而且也建立了一些定量分析的结果,在众多领域得到了广泛的应用,如用于控制(煤气管道的控制)、规划(生产任务规划)、设计(通信网络设计)、组合优化(TSP问题、背包问题)以及图像处理和信号处理等。对于软计算问题,目前主要的问题是算法的“可扩展性”和“可理解性”问题,即所给的算法对处理海量的数据是否有效以及由所给的算法得来的规则、对人来说是否容易理解。三、关于主体AgentAgent是Minsky在1986年出版的《思维的社会》一书中提出的,认为社会中的某些个体经过协商之后可求得问题的解,这些个体就是Agent。Agent应具有自主性、社会交互性、反应能力和预动能力,能通过感知环境而做出动作。从Agent模型来看,有思考型Agent(如BDI表示和推理)、反映型Agent(不会推理,直接由感知到动作)和两者混合型。Agent理论最初是作为一种分布式智能模型被提出的,其研究方法有逻辑方法与经济学方法两种。对Agent思维状态的直观描述涉及信念、愿望、目标、意图、承诺、规划等概念。·信念,属于思维状态的认知方面,描述了Agent对当前世界状况以及为达到某种效果可能采基本理论研究84取的行为路线的估计。·愿望,属于思维状态的感情方面,描述了Agent对未来世界状况以及可能采取的行为路线的喜好。·目标,描述Agent的追求,实际是Agent从愿望中选择的了集。·意图,引导并监督Agent的动作,属于思维状态的意向方面。·承诺,描述Agent对于所追求的意图的坚持程度,并控制对意图的重新考虑,实际表示从目标到意图的转换。·规划,把意图按特定结构组合为规划,它在意图系统的实现中起重要作用。关于Agent理论的地位仍有争议,有的人认为Agent理论用于具体实现Agent,有的人认为Agent理论是用于知识表示方面的,还有的人认为Agent理论应是对认知科学和析学中一些概念的形式化。目前Agent的成功案例包括有产品拍卖、军事演习与机器人足球赛等。四、关于自然语言理解与机器翻译自然语言理解的研究起始于机器翻译。早在1946年,英国的A.DonaldBooth和美国的W.Weaver就开始了机器翻译方面的研究。经过50多年的研究,出现了许多的理论与方法,如基于对话的、实例的、知识的、词汇的、神经网络的、原则的、规则的、统计(或语料库)的等机器翻译方法。但并不像市场上机器翻译产品宣传广告讲的那么成功,就是国际上研究时间最长、最好的SYSTRAN系统,在英法机器翻译过程中,1993年,对开放文本,达到流畅程度的译准率只有54%,一般还可以用的译准率达到74.3%。可以想象,英法这两个同语系的语言的翻译水平就仅如此,那么不同语系的汉外翻译(如汉语译成英语),要困难得多。现今的机器翻译还只能翻译那些能想到的日常句了,即教科书句了。信息检索也是一个非常热门的研究与开发领域,包括文本分类、文本主题识别、文本检索与自然语言检索、文本过滤、文本摘要、文本安排、文本信息获取、文本自动书写、文本挖掘等诸多领域。从网上信息检索或搜索引擎的情况看,检索的基本准确率只有10%一20%。自然语言理解和信息检索是语言信息研究的两个重要方面。自然语言理解的基础是现代语言学的研究。语言既是一个民族的根本,又是知识的最好表现形式。但我国语言学的研究状况并不乐观,比如在汉语里面,到底应该分成多少词性,语言学界争论不休,至今没有一个定论。另外像汉语的基本句型、汉语的语义分类、汉语带词性标注语料库等一系列基础性的工作没有开始或得不到足够的重视。关于我国语言信息处理研究,基础研究仍然还是最重要的,包括提高分词的精度,建设带词性、词法搭配、句法和语义的国家级语料库。关于研究方法,将更多地采用统计方法,特别是将统计与规则结合起来。一个总的趋势是部分分析代替全分析、部分理解代替全理解,部分翻译代替全翻译。另一个值得注意的重要研究方向是,随机语言模型的建模工作正在由基本的线性词汇统计转向结构化的句法领域。根据语料统计信息建立一定的优先评价机制,对输入句了的分析结果进行概率计算,从而得到概率意义上的最优分析结果。五、关于逻辑与推理一个数学理论通常包括概念的界定、命题的陈述和定理的证明等三部分。数学理论中的概念有基本概念与合成概念之分。基本概念是一些不加定义的抽象对象,一个新的合成概念由若干基本概念或这个理论中已有的合成概念来定义。数学命题有对错之辨、真假之分。真命题可分为基本命题与被证明的命题。基本命题是不证自明的命题,称为公理,它与人们的直觉与经验一致,被人们所接受。一个数学命题的证明是指从公理和已有的定理出发,使用逻辑推理规则,把命题作为推理规则的逻辑结论推导出来。命题是由概念及子命题通过逻辑连接词连接而成,及所谓的谓词逻辑。以知识工程学:一个新的重要研究领域85上方法就是所谓的公理化方法,最早来自于欧几里德的《几何原本》;在数学理论中普遍采用。后来又被推广到力学、物理学甚至生物学等其他自然科学。公理化方法实际是一种整理知识,特别是数学知识的方法。通过许多数学家的努力,用数理逻辑的语言和方法建立了一套关于公理系统的理论框架,这就是所谓的形式化方法。在人工智能领域中,在知识表示与推理方面,仅靠公理化方法和数理逻辑是不够的,因此出现了许多新的理论与方法,包括非经典逻辑与开放逻辑等,非经典逻辑的典型代表是模态逻辑。模态逻辑(Modellogic)及其扩展(包括时态逻辑、认知逻辑、动态逻辑、表述逻辑和行为逻辑等)已经成为更适用于各种应用领域的逻辑系统。基本的模态逻辑的语言是在经典逻辑语言的基础上,通过引入两个模态算了口(必然算了)和令(可能算了)得到的。与经典逻辑不同,模态逻辑公式的真值不是函数地依赖于其组成部分的真值。高效的模态推理方法和推理系统的建立,是使用模态逻辑及其扩展作为知识表示工具成功与否的关键。近些年来,模态推理的研究虽然距离人们的期望还有一定的距离,但也得到了长足的发展。
本文标题:知识工程学一个新的重要研究领域
链接地址:https://www.777doc.com/doc-201885 .html