如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
鼾声与语音的时频区分特征学号:07125053姓名:陈宇专业:电子信息工程指导老师:侯丽敏Page2本次演示的结构安排课题准备设计思路系统的过程实现实验结果和总结出现的问题的探讨12345Page31.1课题的背景与意义课题背景研究意义鼾声是一种异常的呼吸音,由病变或睡眠姿势不对所引起。由于鼾声与许多疾病息息相关,在呼吸暂停综合征(OSAHS)等疾病的诊断上有着重要作用。针对现有鼾声诊断由于其他语音信号干扰造成的不足,人们越来越多的先通过语音信号处理录音再用计算机辅助分析。本次毕业设计提出运用matlab的语音端点检测技术,最大程度的区分出说话声,排除其在鼾声提取过程中的干扰,为鼾声的准确分析提供有效的技术支持。Page41.2课题研究现状和思考频域参数方法近年来,随着人工智能的兴起,也可以通过支持向量机等模式识别的方式实现鼾声与说话声的精确区分。时域参数方法通过声学特征的自然成因差异来实现二者的区分。语音信号的识别经过前人在鼾声的时域特征上的分析,总结出了其在时域特征上的规律,我们可以通过这些使时域方法实现进一步的设计与应用。思考Page52设计思路录音样本大样本分析小样本分析预处理实验结果统计语音信号提取时域分析频域分析本次设计主要运用鼾声和说话声在时域中持续时间的不同来实现时域方法上的准确区分。Page63系统的过程实现每段大样本时间为10分钟;每段小样本时间为5s-10s录音样本通常为整晚睡眠录音,一般持续7-8小时matlab软件限制,正常情况下不能超过30分钟的音频读取分割所用软件:goldwave录音样本的选取与分割录音样本的选取与分割Page73.2小样本分析11zz预加重提升信号的高频部分,使其频谱变的平坦保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。加窗分帧语音信号具有短时平稳特性采用汉明窗、汉宁窗、矩形窗等,汉明窗低通特性较好分帧虽然可以采用连续分段的方法,但一般要采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性.帧移帧长的比值一般取为0~1/2帧长的选择:帧长为200,帧移100Page83.3语音信号提取端点检测参数常用参数为短时能量及短时过零率,方法为双门限法本次课题仅对声音信号进行研究,对端点检测精度要求不高,仅用短时能量进行端点检测端点检测过后,语音信号需大于短时能量的某一门限方能进行提取选取无声段的语音信号进行短时能量统计,选取合适的门限值。门限值最后为0.01。Page90.00E+002.00E-044.00E-046.00E-048.00E-041.00E-031.20E-031.40E-031.60E-031.80E-0312345678910无声段短时能量Page10语音提取算法流程Page113.4时域区分方案选定时域区分通常依靠声音的语音学规律和特征从已有的研究成果看鼾声呼气段和吸气段通常持续3s。一般的鼾声检测若只检测到吸气段,吸气段通常持续2s。根据此规律确定鼾声和说话声的区分特征Page123.5具体方案设计完成连续语音提取单一连续语音时长介于1-2.5s为鼾声三个具体判定参数的选取第一个为鼾声和说话声的平均时长,记为average,定义公式为:第二个为鼾声和说话声持续时间处于1s-2s之间的声音与总时长的比率,记为cm,定义公式为:第三个为鼾声和说话声持续时间处于1s-2s的连续帧个数占总帧数的比率,记为cm1,定义公式为:nusumtavsumttcmnufnutcm1其中av为单一语音持续时间为1s-2s长度的平均值,sumt为单一语音持续时间1s-2s长度的和,nu为单一语音的总个数其中t为处于1s-2s的单一语音持续时间的总长其中,nut为处于1s-2s的连续时长的帧个数,nuf为总帧数。Page13三个参数各自的统计结果平均时间00.511.522.51591317212529333741454