您好,欢迎访问三七文档
词计算和语言动力学系统的基本问题和研究王飞跃中国科学院自动化研究所复杂系统与智能科学重点实验室2004年6月1日目录一.问题背景二.词计算和语言动力学理论的简单回顾三.从数计算到词计算:语言动力学的基本框架四.基于胞空间和胞映射的LDS计算方法五.语言动力学系统的基本问题及其研究方法六.总结与展望问题背景马克思:“一门科学只有在成功地运用数学时,才算达到了真正完善的地步”模糊集合的提出者Zadeh教授:“科学界有一种根深蒂固的传统看法,即在科学理论中使用自然语言是数学不成熟的表现”为什么进行词计算和语言动力学研究现实性原因人类已习惯于用自然语言描述和分析事物,特别是涉及社会、政治、经济和管理中的复杂过程,排除自然语言的代价太大了。本质性原因感性信息或知识通常只能用自然语言来描述,由于人类分辨细节和存储信息的认知能力的内在限制,感性信息在本质上是不精确的。进行词计算和语言动力学研究的实质:信息的有效利用数计算:主要处理基于测度的信息(Measurement-basedInformation)词计算:主要处理基于感知的信息(Perception-basedInformation)利用词计算和语言动力学系统的基本原则不知道原则(Thedon’tknowrationale)不能够以足够的精度确定变量或参数的值,进而用数来描述。不需要原则(Thedon’tneedrationale)不需要数值,语言值就足够了。不想要原则(Thedon’twantrationale)太细节的知识反而无效。不确定原则(Thecan’tdefinerationale)无法精确定义的概念,例如因果关系等。我们的认识由于信息正交性,我们必须利用感性信息来获取更多的信息,人类最终会认识到,利用自然语言的词计算,不是可有可无的可选项,而是必需的。(引用Zadeh)这似乎是一场“回归”自然语言的运动,但决不是科学上的倒退或马克思所认为的学科不成熟的表现:“周而复始”,但处于不同的层次,是螺旋式发展。利用自然语言知识和信息,建立以词计算为基础的系统描述,分析,控制和综合的语言动力学系统,是未来系统研究,特别是复杂系统研究的一个重要而有意义的方向。这一点,在处理社会,经济,生态等人造复杂系统的动态描述和分析时,尤为显著。词计算和语言动力学理论的简单回顾:词计算1996年由Zadeh提出,见:“FuzzyLogic=ComputingwithWords”IEEETransactionsonFuzzySystems,Vol.4,No.4,pp.103-111,1996.词计算是语言变量概念的直接扩展词计算和语言动力学理论的简单回顾:语言动力学系统1995年由王飞跃提出,见:“Modeling,AnalysisandSynthesisofLinguisticDynamicSystems:AComputationalTheory”Proc.ofIEEEInt’lWorkshoponArchitectureforSemioticModelingandSituationControlinLargeComplexSystems,Monterey,CA,1995,pp173-178.是试图用一种类似于求解微分差分方程的方式解决逻辑推理过程的副产物语言动力学系统的狭义应用高层决策的语言动态模拟和分析语言动力学计算实例语义稳定LDS语义周期变化LDS语义收敛LDS语义发散LDS狭义语言动力学的一般例子语言动力学系统出现在许多复杂系统的分析与控制应用之中。例如,在对一个复杂问题制定控制策略或规则的过程中,通常用语言或词来表达问题,描述情形,提出目标,制定策略,明确并实施评价程序。这一过程可以看作是一个语言动力学过程:用词描述问题和情形:语言过程描述用词提出目标:语言目标函数用词制定策略:语言控制设计用词确定评价程序:语言状态反馈狭义语言动力学研究的核心内容基于词和数的混合计算由系统的静态描述转为动态描述和推理由非完整的开环系统转为完整的闭环系统语言动力学系统的广义应用人机的智能交互在物理系统中的模拟信号与数字计算机中的数字信号之间通讯时,我们要使用模拟/数字(A/D)和数字/模拟(D/A)转换器,它们已变成了无所不在的标准硬件,其性能由转换精度而定。我国学者已经指出,为了有效地利用信息,我们必须在硬件和软件之后,建立“知件”体系,而语言动力学可能会发展成为有效开发、综合利用各专门领域“知件”的一种解析且可计算的通用工具。可以设想,在将来的人机交互中,特定领域的文字/数字(W/N)和数字/文字(N/W)转换器,将同A/D与D/A转换器一样重要和广泛,不同的是它们是软件而不是硬件,其性能将由其语法和语言处理的智能水平所决定。从硬件、软件到知件-语言动力学的可能应用0102030405060701995年1997年1999年2001年国内外合计本实验室专家评论有关LDS研究文章数目分布(9份相关杂志会刊统计)IEEETransactionsonSystems,Man,andCybernetics主编LarryO.Hall教授对本项目工作的评价是:“Apieceofsolidandqualitywork,andmayleadtoawholenewfield.”(一项扎实且有品位的工作,可能会导致一个全新的研究领域。)TaylorFranklinBestPaperAward•国际大会特邀报告1次•2002年IEEESMCTaylorFranklin最佳论文奖1项(每年在IEEESMC学会会议会刊的500余篇文章中选出)语言动力学的基本框架-从词到点的转换1A2ANA1w3w2w隶属函数论域1…超立方体3w1w1w1xNx2x2w模糊集合的Kosko几何表示语言和数值动力学系统的映射表示及相互关系从数值动力学到语言动力学由多维空间到超立方体单元的转换完成了由传统数值动力学系统到语言动力学系统的转变。在理论上,所有传统动力学系统的概念和方法,都可以根据这一转换而直接推广到语言动力学系统中。语言动力学和词计算的基本公式),,(1kFkkkUXXNMNFIZII:),(kHkkXYPNHIZI:),,(kRkkkVYUMQPRIZII:LDS状态方程:LDS输出方程:LDS反馈控制:这里:IN,IM,IP和IQ都是超立方体,Z是非负整数集合,F,H,R是模糊逻辑算子。相应词的模糊集合定义状态词:输出词:控制词:输入词:XiDxiiXxxX,/YiDyiiYyyY,/UiDuiiUuuU,/ViDviiVvvV./语言动力学系统的稳定性概念和解析定义LDS的轨迹词的极限值正(负)不变词集平衡词P-K轨迹LDS的稳定性LDS的渐进稳定性LDS的全局稳定性主要问题量的问题:精度要求Nn带来的计算量问题质的问题:语义要求带来的词之不连续区分的问题模糊超立方体中的两个相邻点必须是看作两个不同的点。这样的话,一个在两个相邻点之间摆动的LDS就被认为是不稳定的。然而,这两个点可能是同一个点由测量误差造成的两个表现,或者是由隶属函数的主观性表现出两个点,或者是由于信息的颗粒性所造成的。因此,从应用角度来看,这两个只能作为一个点来考虑。也就是说,从这两个点所表示的两个字来看,在实际意义它们是相同的,因而系统应该看成是稳定的。点与词的实际不对称映射基于胞空间和胞映射的LDS计算方法及其应用Z论域1A1A2隶属函数ANZ超立方体超立方体上的胞空间结构及对应词的隶属函数族基于胞映射的语言动力学基本方程LDS状态映射:LDS输出映射:LDS反馈映射:kkkFktQZCZ,,1kkHktZCP,kkkRktWPCQ,,其中tk是胞空间新的时间区间,Zk,Qk,Pk和Wk分别是状态、控制、输出和输入词胞,CF,CH和CR是由F,H和R构造出的胞映射。胞空间构造的基本问题对于指定用于描述复杂系统的K个词,如何构造一个胞结构使得这K个词可以合理地分布在超立方体中?最佳或均匀格点词胞分布定义合理性的一种方法是将这些词尽可能地均匀分布,但对于高维超立方体,简单的均匀分割是无效的。此时,可利用数论中高维空间数值积分的最佳或均匀格点集来实现词的合理地分布。nnnnniFNiFFiFFiZ,,2,Halton格点集:从词胞到词,再到数的清晰化算法词胞词数清晰化清晰化VdVxViiNiiizA1NiNiiiiA11*Z基于胞空间和胞映射的LDS的分析与设计利用在胞空间的搜索算法分析LDS的全局动态特性利用离散动态规划设计LDS的最佳语言控制算法语言动力学系统的基本问题及其研究方法常规数值动力学系统的词化及其相关的动力学特性分析词计算和语言动力学系统的动态特性分析多映射和马尔可夫过程在语言动力学中的应用在数据挖掘中的应用在复杂系统的建模、分析控制和综合中的应用常规数值动力学系统的词化及其相关的动力学特性分析的目的可以验证语言动力学系统的概念和分析方法是否正确合理,因为我们对数值动力学的特性已十分了解和清楚可以探索一条将低层数值模型抽象总结为高层语言模型的途径,这在许多领域,特别是在生态、社会系统中十分有价值可以建立一种新型的动态数据挖掘和知识发现的方法,如果成功,这将有助于研究海量信息的处理和表示词计算和语言动力学系统的动态特性分析常规数值动力学系统词化后,其原有的混沌和分叉现象在对应的语言动力学系统描述中是否继续存在?同词化的分辨率、粒度和表达规则有什么关系等一般语言动力学系统本身在其超立方体空间中是否存在不动点、混沌和分叉现象?如何进行判定和分析等在已有工作的基础上,探讨如何有效地在语言动力学系统中引入胞空间和胞映射,并建立系统的指标体系和数值方法,验证胞空间和胞变换的逼近精度、稳定和敏感特性计算语言动力学系统在引入胞空间和胞变换后,如何建立有效的搜索和数值分析方法,系统地在胞空间中分析不动点、混沌和分叉等动态现象四片混沌的虫口数值模型11nnnxmxx虫口模型,m=3.58,初值x0=0.55nnnXXX11对应四片混沌的虫口语言模型虫口模型,M=“近似为3.58”,初值x0=“近似为0.5”。语言清晰化后的数值虫口混沌特性多映射和马尔可夫过程在语言动力学中的应用常规数值动力学系统词化后,不可避免的会出现计算词可能与几个规定的词相关,因此转化成一个规定词是一种近似在语言动力学系统中引入胞空间和胞变换后,一个胞被映射之后可能与几个细胞有交合,因此转化成一个胞是一种近似问题是这种近似有时不见得合理或有意义,所以我们必须研究映射多值性所带来的问题。研究这一问题的一个非常自然的工具就是马尔可夫过程,最直截了当的方式就是将计算词与规定词的相关程度作为马尔可夫过程中状态转移概率,或者把被映胞在映射后与其它胞的交合部分大小作为转移概率如此一来,我们就可以通过马尔可夫过程理论和方法研究“随机”语言动力学系统在数据挖掘中的应用这方面的主要思想是通过语言动力学系统动态分析的特性,将数据挖掘中的一些方法,特别是聚类分析的方法词化,并进一步挖掘出基于词计算的状态模型、输出模型和反馈模型,从而形成知识的动态表示和分析利用。在复杂系统的建模、分析、控制和综合中的应用针对一些具体的复杂系统应用LDS。目前,我们已开展在经济系统、生态系统、人口系统、以及智能交通系统的诱导“软”控制策略的制定中的初步应用。总结与展望语言动力学系统是在词计算概念正式提出之前就提出的概念。与国际上其它许多词计算方法不同,基于词计算的语言动力学系统,强调实际的可计算性,突出动态计算,而不是静态推理。这一特色是由于借用了常规数值动力学系统中的概念,方法和体系而造成的。这方面工作的继续和深入,可形成有特色的关于复杂系统建模、分析、控制和综
本文标题:语言动力学
链接地址:https://www.777doc.com/doc-4147059 .html