中文网页褒贬态度的机器评价.doc
上传人:天马****23 上传时间:2024-09-12 格式:DOC 页数:51 大小:1.7MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

中文网页褒贬态度的机器评价.doc

中文网页褒贬态度的机器评价.doc

预览

免费试读已结束,剩余 41 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

-PAGEIV-硕士研究生学位论文题目:中文网页褒贬态度的机器评价姓名:苏玉梅学号:10108083系别:信息科学技术学院专业:计算机软件与理论研究方向:计算语言学导师:俞士汶教授孙斌副教授二○○四年五月版权声明任何收存和保管本论文各种版本的单位和个人,未经本论文作者同意,不得将本论文转借他人,亦不得随意复制、抄录、拍照或以任何方式传播。否则,引起有碍作者著作权之问题,将可能承担法律责任。北京大学硕士学位论文中文网页褒贬态度的机器评价-PAGEIV-中文网页褒贬态度的机器评价摘要天网知名度系统是基于北大天网搜索引擎技术和中文信息处理技术,针对用户定制的实体信息开展的个性化网络服务研究。重点研究了网页实体相关度评价算法,从而优化了针对特定信息的网络查询服务质量。在此研究中,通过对中文网页文本内容的大量观察,作者提出了中文网页褒贬态度机器评价的研究方向。基于褒贬评价的修辞属性,作者确定了以语言手段及领域标准为策略的评价算法,独立完成了网页褒贬态度机器评价模块的全部设计与开发,并为此准备了必要的褒贬评价语言知识库,包括在转化现有的基础静态褒贬义词典的有限资源之外,搜集来自真实中文网页的领域相关褒贬义补充词典,积累了一批褒贬态度表达的语言形式模板。该评价模型针对中文网页,依据领域补充褒贬义词典,对网页实体进行褒贬态度评价,其中包含了一系列评价要素,如褒贬结构、领域标准、实体有关、褒贬猜测等关键方法,关联了多种语言知识,从而更合理地模拟了人对网页褒贬信息的解析方法。该模块被应用到天网知名度系统,通过对75万网页近300个实体的评价测试,得到了有价值的实验结果。网页褒贬相关度评价模型的研究开发,为天网知名度系统的个性化网络服务做出了新的和有意义的尝试。关键词:褒贬态度机器评价网络信息服务TheEvaluationofAppraiseinChineseWebPagesAbstractTianWangFameSystemwasfocusedonpersonalizingWebInformationServices,whichwasbasedonTianWangInformationRetrievalSystemandthetechnologyofChineseInformationProcessing,mainlydevelopedtherelevanceevaluationonentityWebPagesandimprovedthesortingqualityoftheinformationretrievalaimedatthecustomizedrequirements,followingwhichtheauthorhasproposedtheevaluationofappraiseinChineseWebPagesastheextendedresearch.Inviewofcognitiverhetoric,theauthordevelopedtheappraiseevaluationmethodbasedonthelanguageknowledgeanddomanialcriterionabouttheentity.TheauthorhasfinishedtheimplementofthismoduleandembeddeditintoTianWangFameSystem.Asthenecessarylanguageknowledgeformachineevaluation,theauthorhasformalizedanelementaryappraisedictionaryandestablishedseveraldomanialsupplementallexiconsfromactualChineseWebPages,especiallyaseriesofappraisetemplate.ThismodulegavetheevaluationfocusedonWebPageentityanddomanialcriterion,includingthefollowingfactors,suchasentity-aboutness,appraise-structure,appraise-hypotheses.Throughassociatingseverallinguisticmaterialsandsimulatingthecognizanceofappraiserhetoricofhuman,theresearchhasgottenthevalueresultandcarriedanewexplorationinWebInformat