如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
“自然语言处理导论”课复习提纲上半部分(参考材料:课程讲义)第1讲绪论:什么是自然语言处理(NLP)请举例说明自然语言和人工语言有哪些差异。请举例说明语言知识与自然语言处理之间的关系。第2讲中文文本的自动分词计算机对中文文本进行自动分词的困难主要有哪些?请概括说明最大匹配法分词和最大概率法分词的基本思想。二者是什么关系?分词质量的常用评价指标主要有哪些?第3讲词性标注方法请举例说明汉语的基本句法结构类型有哪些,各类结构的主要特点是什么。请举例说明汉语的主要词类有哪些,各类词的特点是什么。请概述用隐马尔可夫(HMM)模型进行词性标注的基本思想是什么。请概述韦特比算法(Viterbi)的主要过程。请概述基于转换的错误驱动的词性标注方法的主要思想及其处理流程。第4讲汉语的句法结构分析(上)什么是有限状态文法,上下文无关文法,两种文法的区别是什么。自底向上的句法分析与自顶向下的句法分析的区别是什么。Earley算法。Tomita算法。Tomita算法对LR算法的主要改进是什么。第5讲汉语的句法结构分析(下)请举例说明句法结构歧义有哪些不同的类型。什么是特征结构?请举例说明如何运用特征结构表达自然语言知识。什么是合一运算(Unification)?请举例说明如何运用合一运算表达自然语言知识。请概述如何在Earley算法中融入合一运算。第6讲语义分析不在考题范围内但属于本课程应掌握的知识内容。请举例说明自然语言中形式和意义之间的对应关系有哪些情况。义素分析法。配价分析法。请举例说明如何利用语义知识来帮助消除句法结构分析中的歧义。下半部分参考材料:StevenBird,EwanKleinandEdwardLoper.2009.NaturalLanguageProcessingwithPython.O’ReillyMedia.参见教学网页中对各章节的具体说明。特别说明,期末考试第8章第1、2、3、4节及第6章第4、5、6节不作要求。在复习中,注意区分熟悉对涉及的NLTK包及Python语言,掌握其核心的编程技能,对琐碎的细节并不做要求。、了解对涉及的NLTK包及Python语言,知道其常识的编程知识,对琐碎的细节并不做要求。等不同层次的要求。