(完整word版)模式识别考试.doc
上传人:猫巷****奕声 上传时间:2024-09-10 格式:DOC 页数:8 大小:163KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

(完整word版)模式识别考试.doc

(完整word版)模式识别考试.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

简答题1.什么是模式与模式识别模式识别:模式识别是研究用计算机来实现人类模式识别能力的一门学科。模式:模式是一些供模仿用的、完美无缺的标本。2.模式识别系统的组成信息获取,预处理,特征提取和选取,分类器设计,分类决策3.什么是后验概率?系统在某个具体的模式样本X条件下位于某种类型的概率。、4.确定线性分类器的主要步骤采集训练样本,构成训练样本集。样本应该具有典型性确定一个准则J=J(w,x),能反映分类器性能,且存在权值w*使得分类器性能最优设计求解w的最优算法,得到解向量w*5.样本集推断总体概率分布的方法?参数估计监督参数估计:样本所属类别及类条件总体概率密度函数的形式已知,某些参数未知非监督参数估计:已知总体概率密度函数形式但未知样本类别,要推断某些参数非参数估计:已知样本类别,未知总体概率密度函数形式,要求直接推断概率密度函数本身6.近邻法的主要思想作为一种分段线性判别函数的极端情况,将各类中全部样本都作为代表点,这样的决策方法就是近邻法的基本思想。7.什么是K近邻法?他是最近邻法的推广,取未知样本x的k个近邻,看这k个近邻中多数属于哪一类,就把x归为哪一类。8.监督学习和非监督学习的区别监督学习的用途明确,就是对样本进行分类。训练样本集给出不同类别的实例,从这些实例中找出区分不同类样本的方法,划定决策面非监督学习的用途更广泛,用来分析数据的内在规律,如聚类分析,主分量分析,数据拟合等等9.什么是误差平法和准则对于一个给定的聚类,均值向量是最能代表聚类中所有样本的一个向量,也称其为聚类中心。一个好的聚类方法应能使集合中的所有向量与这个均值向量的误差的长度平方和最小。10.分级聚类算法有两种基本思路聚合法:把所有样本各自看为一类,逐级聚合成一类。基本思路是根据类间相似性大小逐级聚合,每级只把相似性最大的两类聚合成一类,最终把所有样本聚合为一类。分解法:把所有样本看做一类,逐级分解为每个样本一类。11.特征抽取和选择的区别在一定意义上特征抽取和特征选择都是要达到特征降维的目的,只是所实现的途径不同。特征抽取是通过变换的方法组合原始高维特征,获得一组低维的新特征,而特征选择是根据专家的经验知识或根据某种评价准则来挑选出那些对分类最有影响力的特征,并未形成新的特征。12.最优搜索算法最优搜索算法:至今能得到最优解的唯一快速算法是“分支定界”算法。属于自上而下的算法,具有回溯功能。算法核心是通过合理组合搜索过程,避免一些重复计算。关键是利用了判据的单调性。13.统计学习理论的核心问题经验风险最小化原则下统计学习一致性的条件在这些条件下关于统计学习方法推广性的界的结论在这些界的基础上建立的小样本归纳推理原则实现这些新的原则的实际方法14.什么是支持向量机?在统计学习理论基础上发展出的识别方法,在解决小样本、非线性及高维模式识别问题中表现出其优势。问答题描述贝叶斯公式及其主要作用。两个事物X与w联合出现的概率称为联合概率。利用该公式可以计算后验概率。利用最大似然估计方法对单变量正态分布函数来估计其均值μ和方差σ2。请详细写出感知器训练算法步骤。设训练样本集X={x1,x2,…,xn},其中xk属于wi或者wj,且xk的类别是已知的。为了确定加权向量w*,执行下面的训练算法给定初始值:置k=0,权向量w(k)为任意值,可选常数0<c≤1输入样本xm∈{x1,x2,…,xn},计算判决函数值g(xm)=wT(k)xm按如下规则修改权向量若xm∈wi,且g(xm)≤0,则w(k+1)=w(k)+cxm若xm∈wj,且g(xm)>0,则w(k+1)=w(k)-cxm令k=k+1,返回第二步,直到w对所有样本稳定不变,结束请详细写出Fisher算法实现步骤。在两类问题中,设分别属于wi与wj的样本数为n1与n2,n=n1+n2令yk=wTxk(k=1,2,…,n),由子集X1与X2映射后的两个子集为Y1与Y2。使Y1与Y2最容易区分开的w方向正好是分类超平面的法线方向。定义Fisher准则函数。使得JF最大的解w*就是最佳解向量以上工作是将d维空间的样本映射到了一维样本集,这个一维空间的方向是相对于Fisher准则为最好的。我们还需要解决分类问题。将d维分类问题转化为一维分类问题后,只需要确定一个阈值点,将投影点与阈值点比较,就可以做出决策。什么是两分剪辑近邻法与压缩近邻法。将原始样本随机分为两个集合:预测集T和参考集R,来自预测集和参考集的样本分别完成考试和参考任务,相互独立。对预测集T中的所有样本,利用参考集采用近邻法对其进行分类决策,如果决策结果与实