如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
1第08讲自然语言处理与问题综合系统目前在NLP中采用两种主要技术:关键词搜索(模式匹配)、语言处理(句法和语义分析)1、关键词分析:NLP程序在输入的句子中搜索关键词和短语,一旦找到关键词,程序可以产生特定的答案。搜索是必需和重要的,可采用启发式或智能算法,允许大量词汇。程序可以根据输入的关键词或与选择的短语相匹配的部分答案来实际构造答案。如果仅仅包含一个或几个关键词,这种方法是有效的,因为存储的答案很容易与关键词匹配,但是如果有较多的关键词,则很难找到合适的答案。图表示了关键词NLP理解输入语句的基本流程。语法分析(确定词的边界)、模式识别(将短语成分与预先存储的词和短语清单相比较),是两个关键的过程。当确定一个关键词时,则标记该词,以便用于选择适当的答案,或者用于构造答案。2、语言处理:对输入的语句进行句法和语义分析,这种方法在实际应用中实现的难度很大,甚至具有句法和语义分析功能的高级系统也难以胜任,因为由许多的词具有多种含义,并可以由很多方式将这些词组合成句子,NLP通过询问问题,以确定用户的表达的含义,例如:“你的意思是说……”(1)定义语言处理包括句法分析、语义分析、实用性分析。句法分析是对句子和短语的结构进行分析,以确定句子中词语词之间的语法关系;语义分析用来确定各种句法构成的含义;实用性分析试图确定句子之间以及上下文的关系。句子结构的表示--分析树:Hewroteabook(2)语言处理过程图表示了简化的处理过程,包括语法分析器、词典、理解器、知识库和产生器五个主要部分。自然语言接口应用:对于数据库和其他软件,普通用户在使用时会感到复杂难以使用,需要学习特殊的语言或命令,花费较多的时间和精力。采用自然语言前端,使得用户采用自然语言使用。自然语言接口的目的,在于是的不懂计算机语言的用户,可以掌握计算机的使用。语音识别和语音合成语音识别:所有类型语言识别系统都使用相同的技术,输入麦克风的语音产生模拟声音信号,然后通过模数转换器,转换成数字信号。数字信号以二进制代码形式存储到系统中,并且与已经存储的词或短语的二进制代码进行比较,当发现匹配时,则得到相匹配的词。接着,该词显示到屏幕上或者经过NLP进行语义分析。语音合成:语音合成与预先录制的声音的播放不同,是由基本的语言成分(词或短语)组成声音,并且可以形成任何希望的语音模式。8.1.6决策支持系统用户接口的研究如何为决策者表示数据及其相应的接口,不是简单的。这里面涉及许多应当考虑的变量:(1)用户。可以从下列两个方面度量:人口统计的(年龄、教育、经验);心理的(认知方式、智能、风险态度)(2)决策环境。可以从下面几个方面度量:决策结构;组织水平;稳定性、时间压力、不确定性。8.2问题综合系统8.3决策支持系统的综合部件8.3.1决策支持系统语言一个DSS既要达到模型和数据的结合,又要达到人机交互对话,需要利用功能很强的语言来完成。目前计算机的语言主要分两大类:数值计算语言(Pascal、C等)和数据库语音(FoxPro、Oracle等)。数值计算语言有很强的数值计算能力,包括指针、递归运算等,但不能对数据库直接操作;数据库语言有很强的数据处理能力(如数据的增删查改),但是他的数值计算能力很弱。而DSS对这两种能力都需要,需要综合的语言。目前只能通过接口语言(如ODBC、ADO等)将两类语言联系起来。目前要求DSS完全用自然语言描述、识别、求解问题是不现实的。目前的DSS语言只能是数值计算语言+数据库语言+接口语言的集成。用这种集成语言来描述、分析、解决问题,实现人机交互和问题综合系统。②多模型的组合运行把模型看成是程序中的模块,按照计算机程序结构形式(顺序、选择、循环)进行组合、组合嵌套,来完成多模型组合。多模型组合的最简单形式=单个数学模型+输入数据处理模型+输出数据处理模型,构成三个模型的组合。输出数据处理模型也可称为报表模型。知识的表示一阶谓词逻辑表示法25