人工智能--第7章-自然语言处理技术7.ppt
上传人:天马****23 上传时间:2024-09-13 格式:PPT 页数:56 大小:2.1MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

人工智能--第7章-自然语言处理技术7.ppt

人工智能--第7章-自然语言处理技术7.ppt

预览

免费试读已结束,剩余 46 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

人工智能7.7机器翻译7.7.1概述商业翻译系统可分为:直接型、中间语言型和转换型。大多数著名的大型机器翻译系统本质上都是“直接翻译”型的系统,如SystranLogosFujitsuAtlas最重要的大型机“转换型”机器翻译系统是METAL。目前最有名的两个“转换型”系统:Grenoble的Ariane和欧洲共同体委员会提供基金的Eurotra项目。80年代末,日本政府出资支持开发用于亚洲语言之间互译的中间语言系统,中国、泰国、马来西亚和印度尼西亚等国的研究人员均参加了这一研究。进入20世纪90年代后,在欧美、日本等发达国家,机器翻译不仅用于文字处理系统,而且正在朝着智能声控翻译通信技术的方向发展。如电话定票机器翻译系统。日本——翻译复印机,机内装有容量为3.7万个英文词量的数据库,能逐字逐句地把英文译成日文。日本、美国和德国——自动翻译电话。日本——通过计算机与通信网络连接的自动翻译电话。5种语言(英、法、德、意和西班牙)进行交谈——语音翻译机,它内存有1万个单词,6.5万个短语,发出的声音标准、清晰、易懂。美国——旅游用袖珍翻译机器,它准备了2250个常用短语(15种语言,每种各150个短语)。中国:军事科学院在1987研制开发出了“KY-l”实用型全文与题录兼容的英汉机器翻译系统,即经过中软商品化后的“译星全文翻译系统”。1994年,国防科技大学陈火旺院士组织研制成了英汉机器翻译系统Matrix,并进行了商品化。1994年,国防科技大学研制成了英汉机器翻译系统Matrix,并进行了商品化。完成人:史晓东1966年12月出生,江苏江阴人,国防科技大学博士毕业。2001年5月开始,担任联合国大学UNL中心中国语言中心副主任。2002年加盟厦门大学计算机科学系,现任厦门大学语言技术中心副主任。1994年5月,Matrix英汉机器翻译系统,在国家863-306主题专家组组织的智能接口评测获得第二名。1995年5月,Matrix系统参加了Intel公司与中国软件行业协会举办的第一届中国应用软件大奖赛,获得了二等奖,进入了加拿大市场,并在当年863-306主题的第二次评测中获得第一名。1998年3月,Matrix1.0和他新开发的Light1.0Beta3囊括863-306英汉机器翻译评测前两名。1999年5月,推出国内第一家免费网页翻译网站—“看世界”,开创了国内网络翻译的新时代。1999年7月,桑夏公司以他为主开发的英汉机器翻译技术作价2000万元,与燃气股份合资成立“海南桑夏环球网络有限公司”,主推“看世界”网站,致力于解决华人上网的语言障碍。东北大学自然语言处理实验室实验室二十多年积累的资源:机器翻译离工业化应用的标准还相差甚远。国内某些机器翻译软件称译文的可读性最高达到90%以上,但实际上机器翻译译文的可读性也只在70%,而正确率也只在20%左右。有太多让人不明白的地方;文不对题、莫名其妙译文比比皆是,正是“满篇洋文难不住,满篇译文看不懂”。金山快译Effects-BasedOperations贲可荣翻译:基于效果作战机器翻译:以效果为基础的操作机器将“基于效果作战”翻译为:Battleaccordingtotheresult再翻译:依照结果搏斗7.7.2机器翻译理论与方法机器翻译系统类型:1.直译式翻译系统(directtranslationMTsystems)透过快速的分析和双语词典,将原文译出,并且重新排列译文的词汇,以符合译文的句法。2.基于规则翻译系统(rule-basedMTsystems)先分析原文内容,产生原文的句法结构,再转换成译文的句法结构,最后再生成译文。它通过识别、标注兼类多义词的词类,对多义词意义进行排歧;对某些同类词性的多义词再按其词法规则不同消除歧义。3.中介语式翻译系统(inter-lingualMTsystems)类似转换式系统,但会先生成一种中介的表达方式,而非特定语言的结构;再由中介的表达式,转换成译文。程序语言的编译,也经常采取此种策略。4.知识库翻译系统(knowledge-basedMTsystems)此类研究多半有限定范围,并且使用知识获取工具,自动或半自动的大量收集相关知识,以充实知识库的内容。5.范例式翻译系统(example-basedMTsystems)将过去的翻译结果,当成范例,产生一个范例库。在翻译一段文字时,参考范例库中近似的例子,并处理差异处。6.统计式翻译系统(statistics-basedMTsystems)利用汉莎语料库(Hansardcorpus,英法双语语料库),总共有2,205,733英法句对作为训练语料,实现了英语到法语的统计机器翻译系统。2003年美国