基于实值离散GABOR变换的维纳滤波语音增强方法.doc
上传人:sy****28 上传时间:2024-09-10 格式:DOC 页数:2 大小:30KB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

基于实值离散GABOR变换的维纳滤波语音增强方法.doc

基于实值离散GABOR变换的维纳滤波语音增强方法.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

锦州男科医院www.205mn.comayd摘要:提出了一个新的基于实值离散Gabor变换的维纳滤波语音增强方法,采用高斯窗作为综合窗,利用已有的快速实值离散Gabor变换将语音变换到时频域,然后在联合时频域,采用维纳滤波进行纯净语音的最小均方误差下的最优估计,先验信噪比采用“直接判决”算法,在得到语音增强信号的估计分量后,利用实值离散Gabor逆变换将其还原输出。实验结果表明,在分段信噪比和语音质量评价方面均与经典的维纳滤波方法相比均有提高。中国论文网关键词:实值离散Gabor变换;噪声估计;维纳滤波;语音增强中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)17-4231-04SpeechEnhacementApproachBasedonReal-valueDiscreteGaborTransformandSpectralSubtractionZHANGMan,ZHOUJian(MOEKeyLaboratoryofIntelligenceComputingandSignalProcessing,AnhuiUniversity,Hefei230039,China)Abstract:Inthispaper,weporposeanovelspeeehenhancementmethodbasedonReal-valueDiscreteGaborTransform,noisyspeechistransformedtothejointtime-frequencybyfastReal-valueDiscreteGaborTransforminwhichtheGaussinisusedasthetransformkernelfunction,OptimalpurespeechsignalestimationundertheminimummeansquareerrorbasedonWienerfilter,aprioriSNRgotbydeci?sion-directedalgorithm,thecleanspeechisgotbyinversetransformbyReal-valueDiscreteGaborTransform.ExprimentalresultsshowthatthismethodenhancesthesegSNRandimprovesthespeechqualitycompareotherclassicalalogorithmofwienerfilter.Keywords:mReal-valueDiscreteGaborTransform;noiseestimate;Wienerfilter;speechenhacement现实世界中,语音信号很难避免受到各种噪声源的污染,语音增强的一个主要目的就是从带噪信号中尽可能的恢复出纯净语音信号。语音增强技术在语音识别、语音编码和人机语音交互等语音处理领域中发挥着重要作用。基于短时谱估计的语音增强算法由于充分利用了在频域中语音和噪声之间的特征区别和短时(一般认为20ms内)的语音和噪声之间较小的相关性这两点优点,使得基于短时谱估计的语音增强算法在单声道语音增强算法中最常见,其中常见的短时谱算法中常见的有谱减法、维纳滤波法和最小均方误差法等,维纳滤波方法对应的是时域平稳信号的最小均方误差估计,传统维纳滤波处理后的语音一般会残余较多的类似的白噪声,维纳滤波方法的计算会涉及到先验和后验信噪比的计算问题,文献[1-2]中在计算先验性噪比中采用了“直接判决”算法,文献[3]对该此种方法进行了改进。然而,在各种经典和改进的维纳滤波算法中需要将语音从时域变换到频域时,均采用短时加窗傅里叶变换,该文基于以下原因,采用实值离散Gabor变换(RDGT)作为信号分析和处理的工具:第一,与短时傅里叶相比,RDGT由于采用高斯窗函数而具有时频带宽最小的特性,相比短时傅里叶的其他窗函数(如汉明窗)对语音信号分析更加细腻,更易区分语音谱和噪声谱;其次,维纳滤波语音增强要求语音符合在较小窗时间内是平稳信号这一假设,但语音信号本质是非平稳信号,许多文献表明RDGT[4-5]与短时傅里叶相比更适合处理非平稳信号;另外,基于学者陶亮等人的研究[6-9],该文可以通过在RDGT中通过对抽样率参数进行控制而确定最优语音增强效果;最后,在增强后的信号重建时,该文利用RDGT当前最快的算法并行格型快速算法[9]可快速重构语音信号,算法复杂度与短时傅里叶相比更小,且失真度更小(相关实验表明均方误差为10-14数量级)。该文首先描述实值离散Gabor变换的基本理论,然后介绍结合实值离散Gabor变换与维纳滤波方法在联合时频域进行语音增强,最后为了验证该文提出的算法的有效性,