现代测试技术语音识别技术学习PPT教案.pptx
上传人:王子****青蛙 上传时间:2024-09-13 格式:PPTX 页数:52 大小:3.4MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

现代测试技术语音识别技术学习PPT教案.pptx

现代测试技术语音识别技术学习PPT教案.pptx

预览

免费试读已结束,剩余 42 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

现代测试技术第五章语音识别技术第一节引言一、关于声音声音文件获取声音二、语音通信计算机模拟人类交流信息的过程:第二节语音识别技术概述一、语音识别技术从广义上讲,语音识别也包括了对说话人的识别,其主要内容是提取语音信号中有关个人特征的信息、即语音的个性特征(如:音律特性等),在这里专指有意义、有内容的识别。语音识别所涉及的学科领域:信号处理、物理学(声学)、模式匹配、通信及信息理论、语言语音学、生理学、计算机科学(研究软硬件算法以便更有效地实现用于识别系统中的各种方法)、心理学等。二、语音识别的重要性三、语音识别的基本原理·构词规则·同音字判决·语法语义·背景知识语音识别基本原理中的相关概念三、语音识别技术分类四、语音识别应用举例嵌入式语音识别语音对话娃娃语音声控机器人五、语音识别技术现实难度六、语音识别的应用第三节声纹识别技术生物识别技术优势生物识别技术比较一、声纹识别技术定义语音分析谱包络参数语音信息通过滤波器组输出,以合适的速率对滤波器输出抽样,并将它们作为声纹识别特征。基于发声器官如声门、声道和鼻腔的生理结构而提取的参数:基音轮廓、共振峰频率带宽及其轨迹;线性预测系数(与声道参数模型相符合):如线性预测系数、自相关系数、反射系数、对数面积比、线性预测残差及其组合等参数;反映听觉特性的参数;如美倒谱系数、感知线性预测等;通过对不同特征参量的组合来提高实际系统的性能。何谓成功的声纹识别系统声纹识别与语音识别的不同声纹识别的分类UBM(UniversalBackgroundModel),通用背景模型GMM(GaussianMixtureModel),高斯混合模型背景噪音(环境噪音)信道差异(固定电话,手机,麦克风)身体差异,语速快慢,时间间隔FAR(FalseAcceptRate),错误接受率;FRR(FalseRejectRate),错误拒绝率。EER(EqualErrorRate),等错误率;即FAR=FRR时的错误率。多说话人识别,分割二、声纹识别方法5.3声纹识别技术三、声纹识别经典模型一个M阶高斯混合模型的概率密度函数是由M个高斯概率密度函数加权求和得到,如下:其中M是混合模型的阶数,X是一个D维随机向量;wi是混合权重,满足:bi(X)是子分布,每个子分布是D维的联合高斯概率分布,表示为:是均值向量,是协方差矩阵。完整的高斯混合模型由参数——均值向量、协方差矩阵和混合权重共同描述。因此,一个模型可表示为如下一个三元组:GMM计算结构UBM也是一个GMM,只是这个GMM需要用大量的不同说话人的语音数据经过训练来表示说话人无关的特征分布,这种特征是大多数说话人的共性特征。GMM-UBM声纹识别系统5.3声纹识别技术基于声纹识别技术的电话语音远程考勤系统二、语音通信从广义上讲,语音识别也包括了对说话人的识别,其主要内容是提取语音信号中有关个人特征的信息、即语音的个性特征(如:音律特性等),在这里专指有意义、有内容的识别。语音识别所涉及的学科领域:信号处理、物理学(声学)、模式匹配、通信及信息理论、语言语音学、生理学、计算机科学(研究软硬件算法以便更有效地实现用于识别系统中的各种方法)、心理学等。·构词规则·同音字判决·语法语义·背景知识四、语音识别应用举例四、语音识别应用举例三、声纹识别经典模型三、声纹识别经典模型