语音编码基础知识.ppt
上传人:王子****青蛙 上传时间:2024-09-14 格式:PPT 页数:121 大小:4.6MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

语音编码基础知识.ppt

语音编码基础知识.ppt

预览

免费试读已结束,剩余 111 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

语音编码(speechcoding)√概述编码、传输、存储和译码是语音数字传输和数字存储的必要过程。随着语音通信技术的发展,压缩语音信号的传输带宽,降低信道的传输速率,一直是人们追求的目标。语音编码在实现这一目标的过程中担当重要的角色。语音编码就是使表达语音信号的比特数目最小。数字传输系统模型语音编码应用实例(IP电话)二、编码速率(信息容量)大家有疑问的,可以询问和交流三、编码的分类2.参数编码(声源编码parametriccoding):根据语音信号产生的数学模型,通过对语音信号特征参数的提取后进行编码(将特征参数变换成数字代码进行传输)。在接收端将特征参数,结合数学模型,恢复语音,力图使重建语音保持尽可能高的可懂度,重建语音信号的波形同原始语音信号的波形可能会有相当大的区别。如线性预测(LPC)编码类。编码速率低,2.4-1.2kb/s,自然度低,对环境噪声敏感。3.混合编码(Hybridcoding):将波形编码与参数编码相结合,在2.4-1.2kb/s速率上能够得到高质量的合成语音。规则码激励长时预测编码RPE—LPT即为混合编码技术。混合编码包括若干语音特征参量又包括部分波形编码信息,以达到波形编码的高质量和参量编码的低速率的优点。四、已经标准化的语音编码指定组织:国际电信联盟ITU-T,http://www.itu.int(5)RPE-LTP:长时预测的规则脉冲激励的线性预测Regular-PulseExcitedLPCwithaLong-TermPredictor√语音信号压缩编码的原理及其评价系统一、语音压缩的基本依据2.存在的频域冗余度:(1)非均匀的长时功率谱密度(2)短时功率谱密度女声英文a的功率谱3.人的听觉感知机理(1)人类的听觉特性具有掩蔽效应(2)人耳对不同频段声音的敏感程度不同(3)人耳对语音相位不敏感4.语音编码的极限速率语音中最基本的元素是音素,大约有128~256个,如果按通常的说话速度,每秒平均发出10个音素,则信息率为:I=[log2(256)10]bps=80bps把发音看成是以语音速率来传送,则语音编码的极限速率为80bps,从数字化标准的编码速率64kbps,到极限速率80bps,之间的距离,对于理论研究和实践有着极大的吸引力。二、语音编码的关键技术D为基音周期,长时预测系数{bi}的个数取1(q=r=0)或3(q=r=1)。D、{bi}从语音信号中直接提取。语音信号通过长时预测,得出基音周期、增益(振幅大小)。3.感觉加权滤波器输入语音x(n)三、语音压缩系统的性能指标和评测方法编码延时2.语音压缩系统的性能指标和评测方法评价指标:清晰度或可懂度、音质。前者是指语音是否容易听清楚;后者指语音听起来有多自然。(1)可懂度评价DRT:DiagnosticRhymerTest(2)音质评价:MOS:MeanOpinionScore平均意见得分和DAM:DiagnosticAcceptabilityMeasure判断满意度得分。MOS得分为五级:优、良、可、差和坏。满分为5分,相当调频广播质量;4分以上是长途电话网标准;3.5分为通信标准;3.0分仍有较好的可懂度,保持自然度;2.5分只维持可懂度,是战术通信标准。(1)波形失真度,用信噪比来度量(2)频谱失真测量(3)谱包络失真测量语音信号的波形编码均匀量化时,无论大的输入信号还是小的输入信号一律采用相同的量化间隔,为了适应大的输入信号,同时又要满足精度要求,就需要增加样本的位数。=2V/L=2V/2R,但是对话音信号来说,大信号出现的机会并不多,增加的样本数就没有充分利用。因此采用非均匀量化。其基本思想是:大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔。在满足精度要求的情况下用较少的位数来表示。译码时,采用相同的规则。也可视为将信号进行非线性变换后再作均匀量化,如对信号进行对数压缩,微弱的信号被放大,强的信号被压缩。译码时,指数扩张。现在的非均匀量化中,一般采用两种压缩扩张非均匀量化方法。采样后信号幅度和量化数据之间有两种对应关系,一种称为u律压扩(companding)算法,另一种称为A律压扩算法。u律压扩主要用于北美和日本等地区的电话通信中。A律压扩主要用在欧洲和中国的地区的电话通信中。我国的PCM30/32路基群也采用A律13折线压缩特性。μ律15折线主要用于美国、加拿大和日本等国的PCM24路基群中。CCITT建议G.711规定上述两种折线近似压缩律为国际标准,且在国际间数字系统相互连接时,要以A律为标准。因此这里重点介绍A律13折线。FA(x)A律压扩编码对输入动态范围为(-5v,+5v),用A律压扩编码,有:I=8kHz*8bit=64kbit/s实际中,麦克风采