文本挖掘方法概述.ppt
上传人:天马****23 上传时间:2024-09-11 格式:PPT 页数:24 大小:2.3MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

文本挖掘方法概述.ppt

文本挖掘方法概述.ppt

预览

免费试读已结束,剩余 14 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据分析技术数据获取数据获取——常用两个类库数据存取示例——爬取中国房地产信息网的数据中文分词及词性标注中文分词工具去除停用词分词示例文本相似性计算计算文本相似性的主要算法用于实现LSI、LDA模型的python软件包——gensimLDA模型的计算举例情感极性判断情感计算旨在赋予计算机观察、理解和生成各种情感的能力,情感表达方式主要是文字、语音以及多模态数据。目前文本情感计算局限于褒贬二义的倾向性分析,方法以统计学习为主,缺乏情感语义资源的支撑和认知语言学的指导。我们研究目的旨在以多情感的语义资源为基础,以认知语言学为指导,进行文本的情感识别和情感迁移的研究。并将其应用在意见挖掘、产品评论和舆情监控等方面。利用情感分析技术和情感语义资源,①面向互联网海量的在线评论,主要针对产品、音乐、电影和博客等,分析产品的属性评价,生成产品的评价摘要;②利用主观评价,结合用户的行为,进行信息推荐;③统计博客的支持率和反对率,进而计算博主的个人声誉度。④也可以结合话题跟踪和检测技术,发现感兴趣的话题,建立话题的传播模型,计算话题的网络各个方面的倾向性,进行舆情分析。谢谢!