自动归类、自动聚类小软件介绍 信息组织课后作业.doc
上传人:sy****28 上传时间:2024-09-11 格式:DOC 页数:3 大小:80KB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

自动归类、自动聚类小软件介绍 信息组织课后作业.doc

自动归类、自动聚类小软件介绍信息组织课后作业.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

自动分类标引技术应用简介自动归类自动归类应用实例自动分类技术在搜索引擎中用的比较多,可以节省用户的判断时间,提高检索效率。WWLib是伍尔弗汉普顿网络图书馆的网络信息检索系统,它由伍尔弗汉普顿大学的计算机与信息技术学院提供技术支持,是使用了自动归类技术的网络信息检索系统,主要是针对网页进行自动分类。自动归类应用软件Dropit通过将不同类型的文件拖放到DropIt的悬浮窗上,它就会按照你设定的分发目标目录整理文件,什么类型到什么目录。一般为了省事方便,我们都会将下载的文件堆砌到同一文件夹下,时间一长,音频、视频、软件、游戏等各类文件混杂其中,查找十分不便。而手动整理起来又怕麻烦。Dropit简体中文便携版是一个可以根据用户制定的规则自动对文件进行分类的智能软件。用户只需要定义好分类规则,Dropit便会自动将同类文件放到同一文件夹下,实现自动整理,省时省力。例如:将图片1放入个人文件夹中的“武汉大学照片”中,只需要将目标文件移至标志处,再进行如下设置即可:下一次,只需将杂乱无章的文件夹拖至处,其中的图片即可进入“武汉大学照片”文件夹。SortMyfiles相比DropIt,SortMyfiles更是简化了设置这一步骤,直接针对文件夹。在SortMyFiles的SourceDirectory中选定该文件夹,默认会在该文件夹下生成相应类型的子文件夹。当然,你也可以将一个文件夹内的文件分类的其它文件夹内,比如库中的相应文件夹。选择好分类后,点击下面的SortMyFiles按钮,分类成功。如图所示:自动聚类2.1自动聚类应用实例王涛文本自动分类研究图书馆学研究2007.12.(1)文档聚类可以作为多文档自动文摘等自然语言处理应用的预处理步骤,比较典型的例子是哥伦比亚大学开发的多文档文摘系统Newsblaster。Newsblaster将每天发生的重要新闻文本进行聚类处理,并对同主题文档进行冗余消除、信息融合、文本生成等处理,从而生成一篇简明扼要的摘要文档。(2)对搜索引擎返回的结果进行自动聚类,使用户迅速定位到所需要的信息。比较典型的系统有vivisimo。系统允许用户输入检索关键词,而后对检索到的文档进行聚类处理,并输出各个不同类别的简要描述,从而可以缩小检索的范围,用户只需关注比较有希望的主题。另外这种方法也可以为用户二次检索提供线索。(3)对用户感兴趣的文档(如用户浏览器cache中的网页)自动聚类,从而发现用户的兴趣模式并用于信息过滤和信息主动推荐等服务。(4)聚类技术还可以用来改善文本分类的结果,改善数字图书馆服务和文档集合的自动整理等。2.2自动聚类应用软件谷歌学术搜索聚类分析软件软件主要用于血型、蛋白质多态、品种聚类等方面的统计分析,可自动进行杂合度、多态信息含量、遗传距离以及聚类的计算,并可自动画出聚类图。EasyClus:CytoSense建库及自动聚类分析软件EasyClus是针对CytoSense浮游植物流式细胞仪数据分析编写的专业分析软件,建立藻种专家库来对未知的环境水样中藻类信息进行自动聚类分析和比对。EasyClus软件采用多种逻辑运算方法,并经过多年的流式细胞仪数据分析检验,可根据人工预设的规则对流式细胞仪数据进行全自动的聚类分析,减少人工聚类分析带来的误差,大大提高流式细胞仪数据分析数据效率。注:自动聚类思想常常应用于网页搜索、工具开发等方面,但单纯的自动聚类软件数量类型十分有限,并且常常应用于生物制药方面。因软件对于学生而言实用度不大,所以未下载,但了解了大致功能。参考文献