您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > 第8讲-语义分析(2012)
第8讲语义分析semanticsanalysisLanguagewithoutmeaningismeaningless!语义分析的重要性目前我们已经学习了:分词、词性标注、统计和规则句法分析演示同学作业语义分析的重要性仅仅知道了句子的结构,是否就可以了?句子:Tomranthemachine.(Tom(ran(themachine))).有多层意思ran(跑run,操作…)句子:Everyboylovesadog.((Everyboy)(loves(adog))).每个男孩都喜欢那只狗每个男孩都有自己喜欢的狗语义分析的重要性看中文的例子:猴子吃香蕉学生吃食堂老乡吃大碗结构上是合乎语法的,但语义上是不合情理的!meaningwordmeaningmeaningful(flick)&meaningless(blick)sentencemeaningmeaningful(Jackswims.)meaningless(swimsmetaphorical(比喻)every.)ambiguousbearJacksawamanwithatelescope.从以上例子分析知道,仅仅在句法结构的层次上分析出句子的结构,并不能妥善地解决机器理解与翻译或其它方面的问题。因此,还必须进行语义分析。1如果不考虑单词所具有的语义,就不能进行语言的翻译。2句法结构相同的句子,它们的语义往往有着很大的不同。这时,如果不进行语义分析,整个分析工作就几乎寸步难行。那么语义分析又是采用什么样的理论和方法达到确切理解句子意思的目的呢?下面我们具体来学习这些理论和方法,并回过头来看看能否解决以上的问题。关于语义的一些基本概念义位语义场语义特征格语法语义网络。。。义位在词典编撰中,称每一个词义为一个义项,在语义学中也称之为义位:如,“明白”有4个不同的意思:内容、意思等使人容易了解;清楚;明确;公开的、不含糊的;聪明;懂道理;知道;了解这表明“明白”这个词包含四个不同的义位.(1)义位间的关系上下义关系指两个义位(上义义位和下义义位)间存在类属关系狮子和狗是同位关系(co-hyponyms)杨树是植物的下位关系词(hyponym)生物是动物和植物的上义词(hypernymy)生物动物狮子狗牛植物…梧桐杨树槐树…上下位关系例(2)整体-部分关系part-meronym一个义位所表达的对象是另一个义位所表达的对象的组成部分。例如:手是身体的一部分;body,armhouse,roof整体-部分关系例其它(3)同义关系synonymhope,wish(4)反义关系antonymywide,narrow;old,young语义场任何义位都会与其他的义位通过某一种或几种关系关联起来,这种由几个相互的义位的语义系统称为语义场语义场理论:一种语言的所有义位的集合是该语言最大的语义场,这个大的语义场可分成较小的子场,子场又可以继续分成更小的场,这样一层层分下去,会在某个时候得到不能再分的最小语义场。语义场语义场的组成不是随意的,要求场内的各个义位之间是互相联系、互相制约和互相规定的,这种内在关系是外部世界中的关系决定的。例:“师傅和徒弟”,两个义位构成一个语义场,二者共同规定外部世界中的一种关系。但是单独“师傅”或“师傅和儿子”连个义位集合都不是语义场,因为不是互相联系、制约或必然联系。分类:分类义场、关系义场、两极义场、同义义场等;语义特征所有义位都能利用有限数量的语义特征进行组合而得到。例如:对“男人,女人”义场,可以通过义位分解提取一些语义特征:义位特征人性别男人是男女人是女例wordnet知网hownet知网(Hownet)1作者:董振东董强网站:概念描述举例NO.=017144W_C=打G_C=VE_C=~网球,~牌,~秋千,~太极,球~得很棒W_E=playDEF=exercise|锻练,sport|体育其中DEF是核心,采用特定的“知识描述语言”知网(Hownet)2打017144exercise|锻练,sport|体育男人059349human|人,family|家,male|男生日072280time|时间,day|日,@ComeToWorld|问世,$congratulate|祝贺写信089834write|写,ContentProduct=letter|信件北京003815place|地方,capital|国都,ProperName|专,(China|中国)儿童基金会024083part|部件,%institution|机构,politics|政,#young|幼,#fund|资金,(institution|机构=UN|联合国)知网(Hownet)3义原总数:1500多个义原分类:共8类–基本义原事件、实体、次要特征属性、属性值、数量、数量值–语法义原:描述语法特征,如POS语法–关系义原:描述意义关系,类似于格关系动态角色动态属性知网HowNet:的应用例通过句子内部概念密度的计算,可以消除一部分歧义例:食堂没地方,我在餐馆吃了蛋炒饭。wordnet的应用例食堂没地方,我在餐馆吃了蛋炒饭分词:食堂没地方,我在餐馆吃了蛋炒饭利用地方在wordnet的意思:#1指地理位置如祖国的某个地方#2指空间如没地方#3指部分如:他说话有对的地方wordnet的应用例将三种含义分别列在两棵不同的名词集成语义树上,其中一个树的部分如图:通过计算食堂和地方的距离,可以看到“地方”的正确词义实在物物体空间地区地理范围地方#1物质营养物食品粮食炒饭蛋人工物建筑物区域地方#2大厦饭馆食堂wordnet的应用例WORDNET在计算语言界备受热衷如:仅仅依靠wordnet,名词的语义消歧就超过60%它被广泛应用于主题含义识别;图像检索;文本语义分类;网上文本过滤;语料库语义标注等方面wordnetWordNet:格语法菲尔摩(C.J.Fillmore)在题为《格辩》的论文中,提出了格语法格语法中,利用句子的动词周围的名词性成分与动词的语义组合关系来形成表达句子意义的格结构。格语法格语法是美国语言学家菲尔摩于1966年提出的一种新理论。他认为:句法分析中的主语、宾语等语法关系只是表层结构上的概念,在语言的底层,所需要的不是这些表层的语法关系,而是用施事、受事、工具、受益等概念所表示的句法语义关系。而这些语义关系经过变换后,才在表层结构中成为主语或宾语。格的含义“格”-case:原指某些屈折语中用于表示词间语法关系的名词和代词的形态变化。如主格、宾格等--这些是传统上的格,属于表层格。格语法中的格是“深层格”,是指句子中词与词之间的及物性关系,如:动作和施事者的关系、动作和受事者的关系等,这些关系就是语义关系。最初列出的6个格:施事格(Agentive)句子主动词所表现的事件、行为或状态等的主动发起者,如:Tombrokethewindows.工具格(Instrumental)该成分代表的对象是句子主动词所表现的事件、行为中使用的工具,如Tombrokethewindowswithaball.与格(Dative)该成分代表的对象是句子主动词所表现的事件、行为的参与者,如Tomegivemeaball.最初列出的6个格:使成格(Factitive)由动词确定的动作或状态所形成的客体如:JohndreamedadreamaboutMary.方位格(locative)表示由动词或状态的处所或空间方位如.Heisinthehouse.客体格(objective)表示由动词确定的动作或状态所影响的事物如.Heboughtabook.格语法菲尔摩的格也被称为语义角色,深层格等。格体现了句子动词和名词的语义组合关系。举例看下面几个例子:(1)Thedooropened.(2)Thekeyopenedthedoor.(3)Theboyopenedthedoor.(4)Thedoorwasopenedbytheboy.(5)Theboyopenedthedoorwithakey.分析以上各句:“表层结构”不同:各句的语法结构有所不同;主语、谓语等属性也有所不同;“深层结构”却是一致的:施事格:theboy客体格:thedoor(也称受事格)工具格:thekey均是针对动词“open”的语义关系。格语法格语法通常有三部分组成:基本规则词汇部分转换部分基本规则(1)S→M(形态)+P(命题)形态→时、态、句式、情态和时间等(2)P→V+C1+C2+…CnP→Vb+格变元Vb→run,walk,break,…(3)C→K+NP格变元→格关系+[NP|S]格关系→AGT,OBJ,SOUR,LOC,TIME…格表菲尔摩认为命题中需要的格包括:施事格:helaguhed.工具格:hecuttheropewithaknife.承受格heistall.使成格JohndreamedadreamaboutMary.方位格Heisinthehouse.客体格Heboughtabook.受益格HesangasongforMary.源点格IboughtabookfromMary.格表终点格:IsoldacartoMary.伴随格:hesangasongwithMary.底层格是格语法解释语义和句法现象的基本工具。但确定一张完整的格的清单却十分困难。每个框架都包含了一批词语,理解这些词语的词义,必须以理解整个框架为前提。比如“Removing”这个框架中就包含了“abduct、clear、confiscate、……”等动词,也包含了“ejection、elimination、……”等名词。这些词语的“共性”(尽管句法上分属不同词类),在同一个“语义框架”中得到了体现。词汇部分为了实现语义分析,系统需设置各个动词的抽象的框架结构。如:“看”、“写”的抽象的框架结构分别为:[中心1:“看”角色[施事:(动物)受事:(具体物)]][中心2:“写”角色[施事:(人类)受事:(作品)工具:(器具)]]计算机根据以上框架结构和语义词典,可以分析下面两个句子,得到具体的格框架结构:例1:资料已经看完了;例2:他写毛笔[中心1:“看”角色[施事:“”受事:“资料”]]时态[完成态]][中心2:“写”角色[施事:“他”受事:“”工具:“毛笔”]]转换部分即对格语法进行转换操作。大致采用移动、删除、插入、复写等方法。在格框架一致的情况下,不同语言需采用不同的转换操作。如对英语而言:A的介词是by;B的介词是for;D的介词是to等等。使用格语法进行语义分析分析的结果可用“格框架”来表示如:Intheroom,hebrokeawindowwithahammer.格框架:[BREAK[case-frameagentive:heobjective:windowinstrumental:hammerlocative:room[MODALS:time:past]使用格语法进行语义分析语义分析具体要做的是:把格框架中的格映射到输入句中找到的短语上。分析基础:词典中要记录动词的格框架和名词的语义信息。使用格语法进行语义分析具体分析抽象步骤:(1)判断待分析词序列中主要动词,并在动词词典中找出该动词的格框架。(2)对格内容进行相应的填充。(3)根据句子中出现的标志判断句子的情态Modal.例:已知动词词典中动词“看”的格框架如下,要求使用格语法对句子“资料已经看完了”做语义分析。
本文标题:第8讲-语义分析(2012)
链接地址:https://www.777doc.com/doc-6196954 .html