如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
基于决策能力的属性约简模型的综述报告属性约简是数据挖掘中的一个重要问题,目的是通过删除无关属性或者合并相关属性,将原数据集中的属性数目迅速缩小,同时保留关键信息,从而降低计算复杂度,提高决策准确率。属性约简在模式识别、数据分类、信息检索等领域都有着广泛应用。决策能力是评价属性重要性的一个重要指标,因此基于决策能力的属性约简模型也受到了广泛研究。本文将对基于决策能力的属性约简模型进行综述,并介绍一些相关的研究成果。一、基本概念属性约简是指将原数据集的属性数目缩小,但又尽可能地保留原数据集的信息,同时使得决策过程更为简化和准确。属性约简中涉及到的基本概念有:(1)决策规则:对判定对象的决策性说明,包括条件部分和结论部分。例如:若年龄大于等于60岁且血压高,则患冠心病。(2)属性:指事物的某种特征;属性集合是用于描述待分类对象的属性集合,一般由属性和属性值两部分组成。例如:{年龄,性别,血压}。(3)属性约简:在属性集合中,选出最少的属性集合,使其对分类精度的影响等同于原属性集合,同时保留决策规则等关键信息。(4)约简盖度:是指一个属性集合中包含其他属性集合的最小数目,即能够约简的最多次数。二、基于决策能力的属性约简模型基于决策能力的属性约简模型是一种以决策能力为衡量标准的属性约简算法。这类算法基于决策表的决策规则,通过对决策表的分析和处理,计算属性之间的相关性,然后根据决策能力的大小选择最优属性子集,从而实现属性约简的目的。基本步骤如下:(1)利用决策表生成一组决策规则;(2)计算属性与决策规则之间的相对重要性;(3)按照重要性排序选择最优属性子集,并进行属性约简;(4)验证属性子集的正确性和效果。三、相关研究成果1.基于信息增益的属性约简算法信息增益是用来衡量属性对信息熵的贡献程度的一个指标。基于信息增益的属性约简算法根据计算出来的信息增益来度量属性的关键性质,从而进行属性的选择和约简。这种算法计算简单,计算量小,且结果可靠性高。但它不能处理复合属性和不连续的属性。2.基于覆盖和适宜度的属性约简算法覆盖是指属性集合对实例的刻画能力,适宜度是指属性集合对于判断目标的正确度与完整性的反映能力。这种算法主要涉及到两个重要的问题:如何选择具有代表性的样本来评价属性集合的性能;如何构建评价模型和算法来实现有效的属性约简。3.基于启发式算法的属性约简启发式算法是指通过对空间进行搜索,找到相对最适合的解来解决问题。这种算法能够快速找到最优解,但需要选择适当的搜索策略和启发函数,否则可能会导致局部最优或者无法收敛。基于启发式算法的属性约简方法主要包括遗传算法、模拟退火算法、粒子群算法等。四、总结本文对基于决策能力的属性约简模型进行了综述,介绍了属性约简的基本概念和基于决策能力的属性约简算法。不同的算法适用于不同类型的数据集,因此在选择算法时需要根据实际情况进行选择。未来,需要进一步深入研究和开发新的属性约简算法和工具,以满足大数据时代的需求。