人工智能-第2章-知识表示和推理(2.ppt
上传人:天马****23 上传时间:2024-09-12 格式:PPT 页数:36 大小:139KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

人工智能-第2章-知识表示和推理(2.ppt

人工智能-第2章-知识表示和推理(2.ppt

预览

免费试读已结束,剩余 26 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

人工智能2.7.1知识获取互联网上的信息源形式多样,既有结构化的数据库中的数据,又有半结构化的HTML页面,还有无结构的文本和图片等数据。对于存储在传统数据库系统中的结构化数据,从中发现知识的技术称为数据挖掘。针对互联网上的半结构化数据和文本数据,Web挖掘、文本挖掘以及自然语言处理等技术则发挥了较大的作用。1数据挖掘根据上面对广义数据挖掘的定义,一个典型的数据挖掘系统应当包括从基础数据存储到用户界面的各个部分,其主要成分如下:·数据库、数据仓库、或其他信息库:一个或一组数据库、数据仓库、或其他类型的信息库,是数据清理和集成步骤处理的数据对象。·数据库或数据仓库服务器:负责根据用户的数据挖掘请求来提取相关数据。·知识库:用于指导搜索,或评估结果模式兴趣度的领域知识。它可能包括概念分层、用户知识、兴趣度约束或阈值以及元数据等。·数据挖掘引擎:数据挖掘系统基本的部分,由一组功能模块组成,用于特征、关联、分类、聚类分析、演变和偏差分析。·模式评估模块:该模块通常使用兴趣度度量,并与挖掘模块交互,以便将搜索聚焦在有趣的模式上。它可能使用兴趣度阈值过滤所发现的模式。模式评估模块也可以与挖掘模块集成在一起,这依赖于数据挖掘方法的具体实现。·图形用户界面:该模块负责用户与系统之间的交互,允许用户指定数据挖掘查询或任务,提供信息帮助搜索聚焦,以及根据数据挖掘的中间结果进行探索式数据挖掘等。此外,该模块还允许用户浏览数据库和数据仓库模式,评估挖掘的模式,和以不同的形式对模式进行可视化。数据挖掘任务可以在多种类型的数据存储和数据库系统上进行,它一般可以分为两类:描述和预测。描述性挖掘任务试图刻画数据库中数据的一般特性,而预测性挖掘任务根据当前数据进行推导,以进行预测。2Web挖掘(2)Web结构挖掘Web结构挖掘是从WWW的组织结构和链接关系中推导知识。由于文档之间的互连,能够提供除文档内容之外的有用信息。利用这些信息,可以对页面进行排序,发现重要的页面。(3)Web使用记录的挖掘Web使用记录挖掘的主要目标是从Web的访问记录中抽取感兴趣的模式。WWW中的每个服务器都保留了访问日志,记录了关于用户访问和交互的信息。分析这些数据可以帮助理解用户的行为,从而改进站点的结构,或为用户提供个性化的服务。3文本挖掘将数据挖掘的技术应用到文本处理的领域进行文本挖掘是一个重要的研究课题,目前受到关注的问题如下:(1)基于关键字的关联分析基于关键字的关联分析的目标是找出经常一起出现的关键字或词汇之间的关联或相互关系。一组经常连续出现或紧密相关的关键字可形成一个词或词组,关联挖掘可以找出复合关联,即领域相关的词或词组。利用这种词和词组的识别,可以进行更高层次的关联分析,找出词或关键字间的关联。2.7.2知识组织传统的知识表达有如下缺点:孤立、脆弱、解决的是小问题,研究者提出SemanticWeb来解决以上的问题(见图)。SemanticWeb的语言标准是XML、XMLSchema、RDF和RDFSchema,本体基础是DAML和OIL。SemanticWeb的构造过程如下:(l)XML定义了树结构的串性语法,使应用程序可以直接访问语义数据;(2)RDF定义了句法约定及简单数据模型,用于表达机读数据语义;(3)RDFS引入更丰富的表达形式和基本的本体建模原语(类、子类、自属性、域、区间);(4)以RDF为起点,构造完善的基于Web的本体语言OIL。2.7.3知识应用将智能信息检索划分为三个层面:输入层处理层输出层输入层是用户表述信息需求的过程,涉及到文本分类、查询扩展和用户兴趣建模。信息检索系统的用户按其信息需求的明确程度可以粗略划分为两类:浏览型用户和查找型用户。前者没有明确的检索意图,而需要在系统的导航下触发,因此需要了解系统内在信息的结构模式,比如分类体系;后者则一般可以提供比较具体的查询语句或关键词,但由于自然语言描述的随意性,需要系统进一步明确其查询目标,进行语义排歧或查询扩展。2.8小结逻辑表示方法不足:(1)效率低:形式推理能够使计算机在不知道句子指派的情况下得到有效的结论,它把推理演算和知识的含义截然分开,抛弃了表达内容中所包含的语义信息,往往使推理的过程太冗长,效率低。(2)灵活性差:不便于表达启发式知识和不精确的知识。本章还介绍了知识表示的其他方法——产生式系统、框架、语义网络和面向对象表示,前三种知识表示都是以一阶逻辑表示为基础的,它们都可以转变为等价的一阶逻辑表示。所以逻辑是知识表示的基本手段,构成了人工智能研究的基础。框架系统和语义网络是人工智能中最常用的两种结构化知识表示方法,而面向对象的表示方法是很有发展前途的结构化知识表示方法。THEEND