您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 自然语言处理-第9章-句法和语义的关系.
Chapter9句法和语义的关系2000.04这一章将讨论联系句子的逻辑形式和句法结构的方法。这使得在剖析句子过程中,可以的到它的逻辑形式,这种方法我们称之为语义理解(semanticinterpretation);另外,有一种方法允许我们由一个特定的逻辑形式产生相应的句子结构树,即语义实现(semanticrealization)。为了完整的联系句法和语义,就需要每一个成分都有其合适的意思表达式。成分的意思和子成分的意思之间的关系可以在带有特征的文法中指定,因为每一个句法规则都有其相应的语义理解规则,这种方法常称为rule-by-rule方式的语义理解。9.7由逻辑形式产生句子9.1语义理解和合成性9.2一个用于语义理解的简单文法字典9.3介词短语和动词短语9.4词条化的语义理解和语义角色9.5简单问题的处理9.6用特征合一的语义理解End考查语言中的一些基本结构,在剖析一小段英语过程中建立一个文法来产生每一个成分的逻辑形式,在这两节中所用的逻辑形式是命题-变量的结构。讨论语义合成的观点并引入λ演算(lambdacalculus)作为建立合成理论的工具。如何用语义角色来产生逻辑形式,并主要讨论建立分级字典的必要性,因为用它可以减少确定词条意思的工作量。讨论语义理解中如何处理简单的问题。讲述形成逻辑形式的另一种方法,它将利用附加特征,从而比λ表达方法更具有选择性,这样允许我们表达可逆的文法。讨论语义实现,阐述对于给出逻辑形式和可逆文法,如何产生相应的句子。9.1语义理解和合成性在语义理解过程中,我们有一个重要的假定:语义的合成过程(compositionalprocess)。这就意味着一个成分的意思可以由它的子成分的意思单独地推导出。合成理论有一些很吸引人的性质,尤其理解可以随着子短语的理解而增加,例如句法中的上下文无关文法就是关于句法的合成理论,只需将规则应用于子成分的类型,不用考虑它们的内部结构,如规则:S→NPVP,不管NP的特定形式,通过简单的加入一个NP规则:NP→PRO,这样一个新类型的句子就产生了,即具有一个代词处于可接受的位置的任何句子,这个吸引人的性质正是我们进行语义理解所需要的。语言的合成性常根据严格的标准来定义,一个子成分的意思将在其它子成分的意思映射到新成分的过程中起作用,而在合成方法中,要求常大大放宽,只要按一个成分,一个成分的意思逐渐增加即可。这将是我们用合成理论所会碰到的难题之一。围绕这个问题,可以引入无范围的逻辑形式(theunscopedlogicalform)。如果我们定义语义理解的目标是产生一个无范围的逻辑形式,则上个句子将表达成:(LOVESl1(NAMEj1“Jill”)EVERYdDOG1)它更加接近句子的句法结构。[例1]一个典型的问题是带有量词的句子:Jillloveseverydog.这个句子的句法结构只是将词聚集在一起组成短语:(Jill)(loves(everydog)))但这个句子的无歧义的逻辑形式若用谓词-变量的形式(predicate-argumentform)描述,则为:(EVERYd:(DOG1d)(LOVES1l1(NAMEj1“Jill”)d))合成模型倾向于使文法更容易扩展和维持。但建立一个语义理解的合成理论看似容易,但做起来难:首先,句子的句法结构和逻辑形式的结构之间存在结构的不一致。例如:短语everydog是动词短语loveseverydog的一个子成分,然而它的语义理解━广义的量化短语(EVERYd:(DOG1d)…)━看起来象是把动词短语的意思作为它的一部分;更糟糕的是好象把everydog的理解分裂开了:将量词结构和变量从谓词中分离出来。结果是很难看出everydog孤立地代表什么意思及如何用它来构造整个句子的意思。这表明对于每条狗d都有一个由Jilllovingd的事件l1。在这当中,逻辑形式的各个部分和句法分析中的成分之间就不是简单的一一对应关系。它的意思是Jackdied,这种理解似乎与动词kick以及bucket毫无关系。这样的句子的意思就不象是由子成分的意思构造出来,处理这种情况的一种方法是允许将语义意思赋予整个短语,而不是根据语义合成。我们原来就假设基本单元是单词(或词素),习惯用语的表达则建议将其推广,使得一个完整的短语可以有一个基本的(即不用推导的)意思。这样动词短语kickthebucket有着类似于动词die的基本意思。在合成意思不能应用于理解习惯用语时,通过观察特定的句法意译来匹配这些句子。例如:表示被动的句子ThebucketwaskickedbyJack,就不能解释成Jackdied。对于合成理论的另外一个挑战是习惯用语。[例2]你可以说Jackkickedthebucket。解决这个问题的另一种方法是对习惯用语中出现的单词引入新的意义。例如,kick将有一个意思DIE1,它的宾语的子词类是BUCKET1类型。虽然习惯用语是语言中一个非常有趣而且很重要的方面,但在接下去的几章中,我们将没有讨论它。为了达到本书的目的,你可以假设基本意思总是和单词联系在一起。有趣的是,这个句子是有歧义的,它有一个由每个词的意思所构造的意思:(KICK1k1(NAMEj1“Jack”)THEbBUCKET)而另一个由词Jack和短语kickthebucket的基本意思所构造的意思:(DIE1d1(NAMEj1“Jack”))如果语义理解的过程是合成,那么你必须能够赋予任何的句法成分一个相应的语义结构。比如:你必须能够赋予每一个动词短语一些固定的意思形式,使它能够用于含有VP子成分的规则。考虑最简单的情况,动词短语只包含一个不及物动词,如句子Jacklaughed。一种方法是动词短语laughed的意思是作为一个一元谓词(aunarypredicate),这对任何对象的laughed(过去形式)动作来说是为真。这种方法能一般化吗?也就是说,每个动词短语VP都有一个意思,即是作为一个一元谓词吗?考虑句子JackkissedSue。它的逻辑形式是:KISS1k1(NAMEj1“Jack”)(NAMEs1“Sue”))动词短语kissSue的意思是什么?它作为一元谓词,对任意对象作了kissedSue的动作来说都是为真的吗?但是,到目前为止我们仍无法表达这样复杂的一元谓词。BOX9.1λ演算(lambdacalculus)和λ变换(lambdareduction)λ演算的式子包含一个等价的断言:表达式=表达式这个系统中最关键的公理是((λxPx)a)=P{x/a}其中Px是包含x的任意式子,在式子P{x/a}中,用a替代所有的x。我们定义两种操作:λ变换(lambdareduction)λ提取(lambdaabstraction)λ演算将可以用来表达上面的例子,尤其表达式(λx(KISSk1x(NAMEs1“Sue”)))是带一个变量的谓词,你可以将x看作变量,而且这个谓词对任意的对象O来说都是为真的,这样在表达式的最终结果中子成分O对x来说是一个正确的命题。象其他谓词,你可以由λ表达式和变量构造一个命题。在逻辑形式语言,下面这个命题:((λx(KISS1k1x(NAMEs1“Sue”)))(NAMEj1“Jack”))我们通常说的最终表达式是通过λ表达式(λx(KISS1x(NAMEs1“Sue”)))应用于变量(NAMEj1“Jack”)而获得的,这个操作称为λ变换(lambdareduction)。当且仅当(NEMEj1“Jack”)满足谓词(λx(KISSk1x(NAMEs1“Sue”)))时,这个命题为真。而当且仅当(KISS1k1(NAMEj1“Jack”)(NAMEs1“Sue”))为真,上述定义的命题为真。我们已经不得不引入新的概念如λ表达式。你可以试图放去这种方法,而建立其他方式的语义理解,然而,当处理更大的文法或更复杂的情况时,合成理论将更吸引人。[例3]用这种方式,动词短语可以容易地连接,即使他们具有不同的句法结构,象句子:Suelaughsandopensthedoor.这个句子含有两个VP:laughs和opensthedoor。它们可以合并成为一个复杂的一元谓词,即(λa(&LAUGHS1l2a)(OPENS1o2aTHEd1DOOR)))它在句子someonewhobothlaughsandopenthedoor.中作一元的谓词是为真的。这是动词短语的正确形式,它可以和其它成分(如其它VP)连接,比如可以应用于作主语的NP,其逻辑形式为(NAMEs1“Sue”),从而形成一个原始的句子:(&(LAUGHS1l2(NAMEs1“Sue”))(OPENS1o2(NAMEs1“Sue”)THEd1DOOR))前者是在句子someonewholaughs.中作一元谓词是为真的,即(λa(LAUGHS1l2a));后者在句子someonewhoopensthedoor.中作一元谓词是为真的,即((λa(OPENS1o2aTHEd1DOOR))。考虑其它例子:介词短语修饰的名词短语可以有很多方法处理,例如对于名词短语Themaninthestore中的介词短语inthestore,我们可以有一个不独立的意思。一种特定的技巧可先寻找修饰的位置,然后合起来理解。但这种技巧在理解句子Themanisinthestore.或Themanwasthoughttobeinthestore.时是无助的。如果介词短语有一个独立的意思,如一元谓词:(λo(IN-LOC1oTHEs1STORE))它作为名词短语的修饰语(增加一个新的限制)以及作为句子的谓语一样,很容易理解。名词短语Themaninthestore的逻辑形式是:THEm1(MAN1m1)(IN-LOC1m1THEs1STORE)而句子Themanisinthestore.的逻辑结构则为IN-LOC1THEm1MAN1THEs1STORE)这是两个简单的例子,如果你采纳语义合成的话,那么还会产生许多其他推广。通常,每个主要的句法短语都对应着特定的语义结构:VPs和PPs映射为一元的谓词(可能是不能用λ表达式建立的复杂的表达式);句子映射到命题;NPs则映射到术语;小的词类映射到表达式,在表达式中定义它们在大的词类中的作用。既然在相同的句法中的每个成分映射到同种的语义结构,这可以按一定的格式处理,例如:你可以不知道VP的特定结构,只要它的意思是一个一元谓词,你就可以用它来建立包含它的更大的成分。9.2一个用于语义理解的简单文法和字典这一部分将构造一个简单文法和字典来说明:在剖析时如何利用特征建立逻辑形式。为了使例子简单化,我们所要的逻辑形式先不用主题角色表示(thethematicrolerepresentation),而是采用上一节的谓词-变量结构来表示,这使得所有带相同子类型结构的动词可以以相同的方法处理。在9.4节再讨论确定主题角色的框架是如何生成。对于每一条词条和文法规则,我们需要增加一个SEM特征,例如:规则(SSEM(?semvp?semnp))→(NPSEM?semnp)(VPSEM?semvp)在给了带有SEM(NAMEm1“Mary”)的NP子成分和带有SEM(λa(SEE1e8a(NEMEj1“Jack”)))的VP子成分时,考虑这条规则是什么?新成分S的SEM特征是简单的表达式:((λa(SEESe8a(NAMEj1“Jack”)))(NAMEm1“Mary”))用λ变换简化后:(SEES1e8(NAMEm1“Mary”)(NAMEj1“Jack”))它正是我们所希望得到的句子。图9.1给出了当每个成分带有SEM特征时句子的剖析过程。SSEM(SEES1e8(NAMEm1“Mary”)(NAMEj1“Jack”))NPSEM(NAMEm1“Mary”)VPSEM(λa(SEES1e8aNAMEj1“Jack”)))VSEMSEES1NPSEM(NAMEm1“Jack”)图9.1带有SEM特征
本文标题:自然语言处理-第9章-句法和语义的关系.
链接地址:https://www.777doc.com/doc-7214274 .html