多媒体数据挖掘.doc
上传人:sy****28 上传时间:2024-09-14 格式:DOC 页数:16 大小:25KB 金币:18 举报 版权申诉
预览加载中,请您耐心等待几秒...

多媒体数据挖掘.doc

多媒体数据挖掘.doc

预览

免费试读已结束,剩余 6 页请下载文档后查看

18 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

视频信息检索与数据挖掘EnterpriseServices1信息检索信息检索技术是一项成熟的处理文本数据的技术。信息检索技术是一项成熟的处理文本数据的技术。信息检索领域与数据库领域是并行发展的领域。检索领域与数据库领域是并行发展的领域。信息检索领域中所用的传统模型是信息被组织成文档,域中所用的传统模型是信息被组织成文档,且是信息量巨大的文档。巨大的文档。信息检索的过程就是根据用户的输入,信息检索的过程就是根据用户的输入,如关键词或示例文档,查找相关文档的过程。文档,查找相关文档的过程。EnterpriseServices2信息检索系统信息检索系统的典型例子是联机图书目录和联机文档管理系统。系统。信息检索系统和数据库系统处理的是不同类型的数据。信息检索系统和数据库系统处理的是不同类型的数据。信息检索领域一般用查全率和查准率对检索的效果进行量比评价。比评价。wwwEnterpriseServices搜集Web信息搜集Web信息建立索引库3检索查询用户基于关键字的检索在基于关键字的信息检索系统中,文档被看成字符串,在基于关键字的信息检索系统中,文档被看成字符串,可用一组关键字加以识别。一组关键字加以识别。用户提供一个关键字或一组由关键字构成的表达式,由关键字进行查询。这样,构成的表达式,由关键字进行查询。这样,用户可以找出包含关键字的全部文档。含关键字的全部文档。在基于关键字的信息检索系统中,还要考虑“同义词问题”在基于关键字的信息检索系统中,还要考虑“同义词问题”可以采用同义词的方法解决这个问题,。可以采用同义词的方法解决这个问题,对每个词都定义一个同义词。个同义词。基于关键字的信息检索系统还有一个难题,就是“基于关键字的信息检索系统还有一个难题,就是“多义词问即同一个关键字,题”,即同一个关键字,在不同的上下文中可能有不同的含遗憾的是,义。遗憾的是,目前这种基于上下文确定关键字含义的检索系统还不成熟。系统还不成熟。EnterpriseServices4基于相似性的检索与文档索引基于相似性的检索某些信息检索系统允许基于相似性的检索。这时,某些信息检索系统允许基于相似性的检索。这时,用户可给系统一个文档A然后要求系统找出与A相似相似”用户可给系统一个文档A,然后要求系统找出与A“相似”的文档。两个文档的相似性可以自定义,的文档。两个文档的相似性可以自定义,如根据一组共同的关键词作为相似性。同的关键词作为相似性。文档的索引一个高效的索引结构,一个高效的索引结构,对于信息检索系统查询的高效处理是十分重要的。系统可以采用倒排索引定位,效处理是十分重要的。系统可以采用倒排索引定位,包含关键词的文档。倒排索引是一种索引结构,含关键词的文档。倒排索引是一种索引结构,它包含两个索引表:文档表和词表。个索引表:文档表和词表。EnterpriseServices5WEBWEB-常用的搜索引擎Harvest搜索引擎Google搜索引擎InternetArchiveInktomi搜索引擎Baidu搜索引擎EnterpriseServices6多媒体检索技术多媒体检索技术主要是通过分析多媒体信息中的视觉和音频特征,以达到查找视觉和听觉上相似内容的目的。所谓基于内容的多媒体分析检索是指对多媒体数据(所谓基于内容的多媒体分析检索是指对多媒体数据(如视频、音频流等)频、音频流等)所蕴涵的物理的和语义的内容进行计算机分析理解,以方便用户查询,其本质是对无序的多媒体数据流结构化,提取语义信息,保证多媒体内容能被快速检索。EnterpriseServices7多媒体检索过程与文本信息检索相比,多媒体分析检索要复杂得多。一般多媒体分析检索有四个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据索引结构的构造与检索,见下图。在多媒体中,可以同时存在不同媒质数据,如视频、图像、音频、三维图形和字幕等,因此能够从每种媒质中提取不同特征。EnterpriseServices8基于内容的图像检索基于内容的图像检索系统与传统的基于文本的检索系统具有着完全不同的框架。系统的核心是图像特征数据库。图像特征既可以从图像本身提取得到,也可以通过用户的交互获得,以用于计算图像之间的相似度。1、选择、提取和索引能够充分表达图像的视觉特征。2、处理基于相似度的图像索引。3、处理用户对检索结果的反馈意见,改善检索结果。EnterpriseServices9基于内容的图像检索基于内容的图像检索系统在未来几年中的可能的发展方向。(1)图像检索人图像检索人(1)图像检索人-机结合(2)高层语义和底层视觉特征差距(2)高层语义和底层视觉特征差距(3)面向