自然语言理解.ppt
上传人:天马****23 上传时间:2024-09-11 格式:PPT 页数:32 大小:240KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

自然语言理解.ppt

自然语言理解.ppt

预览

免费试读已结束,剩余 22 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

11.1.1理解的实现过程第一项工作看起来很容易,似乎只是查一下字典就可以解决。而实际上由于许多单词有不止一种含义,因而只由单词本身不能确定其在句中的确切含义,需要通过语法分析,并根据上下文关系才能最终确定,例如,单词diamond有“菱形”、“棒球场”和“钻石”三种意思,在语句JohnsawSusan’sdiamondshimmeringfromacrosstheroom.中,由于“shimmering”的出现,则显然“diamond”是“钻石”的含义,因为“菱形”和“棒球场”都不会闪光。再如在语句I’llmeetyouatthediamond.中,由于“at”后面需要一个时间或地点名词作为它的宾语,显然这里的“diamond”是“棒球场”的含义,而不能是其他含义。第二项也是一个比较困难的工作。因为要以这些单词为基础来构成表示一个句子意义的结构,需要依赖各种信息源,其中包括所用语言的知识、语句所涉及领域的知识以及有关该语言使用者应共同遵守的习惯用法的知识。由于这个解释过程涉及到许多事情,因而常常将这项工作分成以下三个部分来进行:(1)语法分析。将单词之间的线性次序变换成一个显示单词如何与其他单词相关联的结构。语法分析确定语句是否合乎语法,因为一个不合语法的语句就更难理解。(2)语义分析。各种意义被赋予由语法分析程序所建立的结构,即在语法结构和任务领域内对象之间进行映射变换。(3)语用分析。为确定真正含义,对表达的结构重新加以解释。11.1.2语法分析要进行语法分析,必须首先给出该语言的文法规则,以便为语法分析提供一个准则和依据。对于自然语言人们已提出了许多种文法,例如,乔姆斯基(Chomsky)提出的上下文无关文法就是一种常用的文法。一个语言的文法一般用一组文法规则(称为产生式或重写规则)以及非终结符与终结符来定义和描述。例如,下面就是一个英语子集的上下文无关文法:11.1.2语法分析要进行语法分析,必须首先给出该语言的文法规则,以便为语法分析提供一个准则和依据。对于自然语言人们已提出了许多种文法,例如,乔姆斯基(Chomsky)提出的上下文无关文法就是一种常用的文法。一个语言的文法一般用一组文法规则(称为产生式或重写规则)以及非终结符与终结符来定义和描述。例如,下面就是一个英语子集的上下文无关文法:〈sentence〉∷=〈nounphrase〉〈verbphrase〉〈nounphrase〉∷=〈determiner〉〈noun〉〈verbphrase〉∷=〈verb〉〈nounphrase〉|〈verb〉〈determiner〉∷=the|a|an〈noun〉∷=man|student|apple|computer〈verb〉∷=eats|operats有了文法规则,对于一个给定的句子,就可以进行语法分析,即根据文法规则来判断其是否合乎语法。可以看出,上面的文法规则实际是非终结符的分解、变换规则。分解、变换从起始符开始,到终结符结束。所以,全体文法规则就构成一棵如图11-1所示的与或树,我们称其为文法树。所以,对一个语句进行语法分析的过程也就是在这个与或树上搜索解树的过程。可以看出,搜索解树可以自顶向下进行,也可以自底向上进行。自顶向下搜索就是从起始符sentence出发,推导所给的句子;自底向上搜索就是从所给的句子出发,推导起始符sentence。图11-1文法树例11.1下面是一个基于上述文法的语法分析程序。它采用自顶向下搜索。这个程序是先把所给的句子以符号表的形式约束给谓词sentence的变量X,然后对其进行分解和变换。如果最终分解、变换的结果与语言的文法树相符,则证明所给的句子语法正确;否则语法错误。例如,对于句子thestudentoperatsthecomputer要用该程序进行语法分析,则应给出询问:?-sentence([the,student,operats,the,computer]).这时,系统则回答:yes分析这个句子所产生的解树如图11-2所示。这个解树称为该句子的语法分析树。图11-2语法分析树需指出的是,这个程序虽然易于理解,但运行效率较低。因为在用append谓词对句子进行分解时一般要进行多次回溯。为此,我们把这个程序修改为如下形式:这个程序的每个谓词有两个参量,它们都是符号表。对于一个给定的句子,后一个表是前一个表的余表。语法分析时,把所给的句子以符号表的形式约束给sentence的第一个变量X,第二个变量约束为空表。如?-sentence([the,student,operats,the,computer],[]).则系统仍然回答:yes这个程序虽然难读,但它的运行效率较高。语法分