您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > WordnetHownet
WordNet介绍WordNet的词汇组织结构•WordNet–是一部在线词典数据库系统,采用了与传统词典不同的方式,即按照词义而不是词形来组织词汇信息。–1985年由普林斯顿大学认知科学实验室建立–WordNet将成为一种国际标准,许多国家在筹划和建立与英文WorNet兼容的本国语言WorNet系统。•欧洲有基于Wordnet的Eurowordnet,日本的日语和英语的概念词典。•韩国的Koreanwordnet。•微软的Mindnet。•中国有以Wordnet为框架而研制的现代汉语概念词典——中文概念辞书(CCD)和董振东、董强的Hownet(知网)。WordNet的词汇组织结构–同义词集(Synsets)WordNet将英语的名词、动词、形容词、和副词组织为Synsets,每一个Synset表示一个基本的词汇概念,并在这些概念之间建立了包括同义关系(synonymy)、反义关系(antonymy)、上下位关系(hypernymy&hyponymy)、部分关系(meronymy)等多种语义关系。WordNet的词汇组织结构–同义词集(Synsets)Example:地球绕着太阳转,自然会有寒来暑往的四季交替自然奥秘•{自然、必然、一定、必定}•{自然、天然}WordNet的词汇组织结构•词汇(Words)、同义词集、语义(Senses)的数量POSUniqueStringsSynsetsTotalWord-SensePairsNoun10919575804134716Verb110881321424169Adjective214601857631184Adverb460736295748Totals146350111223195817WordNet的词汇组织结构•多义词信息(1)词性单义词和语义多义词多义词语义名词动词形容词副词94685592015981382014510516854797874000218221151751900总计1204062594475298WordNet的词汇组织结构•多义词信息(2)词性平均词义(包括单义词)平均词义名词动词形容词副词1.232.171.451.242.753.522.762.41WordNet的词汇组织结构•词汇的矩阵模型WordMeaningsWordFormsF1F2F3……FnM1M2M3...MmE1,1E1,2E2,2E3,3...Em,nWordNet的词汇组织结构•WorNet中词语间的关系–主要的词汇关系•同义关系(构成Synsets)•反义关系(指针!)•上位关系(指针@)•下位关系(指针~)WorNet中词语间的关系•整体关系(名词、指针#m/#s/#p)•部分关系(名词、指针%m/%s/%p)•蕴含关系(动词、指针*)•因果关系(动词、指针)•近似关系(形容词、指针&)注:形容词如果是动词分词,用指针指()向该动词副词如果由形容词的派生而来,用指针(\)指向该形容词。WorNet中词语间的关系–同义关系(synonymy)WordNet用同义词集表示概念,最重要的关系就是同义关系。如果两种表达方式在语言文本中相互替代而不改变其意义,则着两种表达就是同义的。•例如:{heavy,weighty,ponderous}{light,weightless,airy}WorNet中词语间的关系–反义关系(antonymy)反义关系不是WordNet的基本组织关系。反义关系是一种词形关系,不是概念之间的语义关系。•例如下面的反义词对:男人女人上升/下降升高/下落heavy/lightweighty/weightlessWorNet中词语间的关系•形容词的反义关系•描述性形容词的语义组织方式与名词完全不同,采用N维超空间结构,而不是树形的层次结构。•描述性形容词的基本语义关系是反义关系。•形容词的同义词集用形容词簇表示•形容此词簇通过反义关系联系在一起。例如:•ponderous的语义近似于(similarto)heavy•直接反义词对(light/heavy)•间接反义词对(light/ponderous)WorNet中词语间的关系•形容词簇WorNet中词语间的关系–上下位关系(hypermymy&hyponymy)•上下位关系是词汇之间的语义关系。例如:{枫树}是{树}的下位词,{树}是{植物}的下位词•上下位关系也称为从属/上属关系,子集/超集关系,或ISA关系。•上下位关系不是一种对称关系,通常一个同义词集只有唯一的上位,而下位却很多。WorNet中词语间的关系•名词的上下位关系•名词的组织依照上下位关系构造名词语义树•名词的继承系统,构成一种层次关系(hierarchies)例如,橡树@---树@---植物@---生物•下位词汇的词条继承了他们上位词汇的所有属性(attributes)•名词的语义元素•25个起始概念:一般性概念,作为独立的层次结构•各领域的名次数量不等,互不排斥•大体覆盖了明确的概念和词汇范围WorNet中词语间的关系•名词的语义元素{act,action,activity}{naturalobject}{animal,fauna}{naturalphenomenon}{artifact}{person,humanbeing}{attribute,property}{plant,flora}{body,corpus}{possession}{cognition,knowledge}{process}{communication}{quantity,amount}{event,happening}{relation}{feeling,emotion}{shape}{food}{state,condition}{group,collection}{substance}{location,place}{time}{motive}WorNet中词语间的关系•名词的语义元素WorNet中词语间的关系•动词蕴涵关系(entailment)、动词的上位关系(hypernymmy)、方式关系(troponymy)、因果关系(causerelation)•动词之间的组织关系成为动词的蕴涵例如:打鼾逻辑上蕴涵睡觉,因为句子“他正在打鼾”蕴涵了句子“他正在睡觉”;如果第一个句子成立,则第二个句子必定成立。•蕴涵是一种单向关系•方式关系是一种特殊的蕴涵。例如:一个较一般化的动词V2,它的每一个方式词V1也蕴涵V2V1是V2的一种方式。WorNet中词语间的关系•动词的上位关系是方式关系的逆关系例如:一个较一般化的动词V2,它的每一个方式词V1也蕴涵V2V2是v1的上位词,{行走}是{跛行}的上位词•因果关系也是一种特殊的蕴涵关系如果V1必然导致V2,则V1蕴涵V2WorNet中词语间的关系•动词的语义组织:根据不同的语义领域划分为14类verbsofbodilycareverbsfunctionsverbschangeverbscognitionverbscommunicationverbscompetitionverbsconsumptionverbscontactverbscreationverbsemotionverbsmotion,perceptionverbspossessionverbssocialinteractionverbsweatherverbsWorNet中词语间的关系–部分关系(meronymy)•“部分-整体”关系例如:if“AYhasanX”or“AnXisapartofY”then{x1,x2,…,xn}aremeronym{y1,y2,…,ym}areholonym•部分关系是一种不对称的关系•部分关系是名词概念之间的一种语义关系。举例而言:“帽子”是“冒顶”、“帽边/帽檐”的群体词。界面说明界面说明•HowNet–知网(英文名称为HowNet)是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。–2000年由中科院计算机语言信息中心语言知识研究室董振东团队建立–HowNetisadatabase/networkofsemanticrelationshipsamongChinesewords.Conceptuallyit’ssimilartoWordNetofEnglish,buttheauthorclaimstheydiffersubstantially.•知网不是语义词典、义类词典、概念词典、英汉双语词典–知网不是词典•知网不是汉化的WordNet、不是WordNet的中文代用品•知网不是语言学研究的产物数据统计Chinesecharacter7152Chineseword&expression92159Englishword&expression86141Chinesemeaning106591Englishmeaning106731Definition27877Record172097义原的获取和选择Sememes2090Entity150thing(physical,mental,fact)component(part,fitting)timespace(direction,location)Event(relation,state;action)810Attribute245AttributeValue885Secondaryfeature121义原是最基本的、不易于再分割的意义的最小单位义原的组织和分类体系的建构实体Entity事件Event属性Attribute属性值AttributeValue次要特征Secondaryfeatures事件角色Eventroles事件角色的典型演员Typicalactorsofeventroles公理关系与角色转换Axiomaticrelationsandroleshifting反义义原对Antonymoussememepairs对义义原对Conversesememepairs知网中概念的定义(1)ConceptdefinitionsinHowNet–“buy”1.{GiveAsGift|赠:manner={guilty|有罪},purpose={entice|勾引}}2.{buy|买}Cf.SynsetdefinitioninWordNet–“buy”1.buy,purchase(obtainbypurchase;)2.bribe,corrupt,buy,makegreasepalm(makeilleagalpayment)知网中概念的定义(2)ConceptdefinitionsinHowNet–“buyer”{human|人:domain={commerce|商业},{buy|买:agent={~}}}Cf.SynsetdefinitioninWordNet–“buyer”buyer,purchaser,emptor,vendee(apersonwhobuys)哪个“buy”?--在WordNet中是歧义的;但在HowNet中是没有歧义的知网常识推理举例•Canadoctorwalk?•下列句子的省略如何推导的?“我在南京买了几本很好的词典,到家发现全都丢了。”--谁丢?丢什么?Canadoctorwalk?(1)1.“doctor”的定义DEF={human|人:HostOf={Occupation|职位},domain={medical|医},{doctor|医治:agent={~}}}2.“entity”义原分类体系表│││├{AnimalHuman|动物}{animate|生物:HostOf={Sex|性别},{AlterLocation|变空间位置:agent={~}},{StateMental|精神状态:experiencer={~}}}││││├{human|人}{AnimalHuman|动物:HostOf={Name|姓名}{Wisdom|智慧}{Abilit
本文标题:WordnetHownet
链接地址:https://www.777doc.com/doc-2867822 .html