语音编码基础知识-第一文库 | 海量文档资源下载与分享平台

免费试读已结束，剩余 111 页请下载文档后查看

10 金币

下载此文档

/ 121

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

语音编码（speechcoding）√概述编码、传输、存储和译码是语音数字传输和数字存储的必要过程。随着语音通信技术的发展，压缩语音信号的传输带宽，降低信道的传输速率，一直是人们追求的目标。语音编码在实现这一目标的过程中担当重要的角色。语音编码就是使表达语音信号的比特数目最小。数字传输系统模型语音编码应用实例（IP电话）二、编码速率（信息容量）大家有疑问的，可以询问和交流三、编码的分类2.参数编码（声源编码parametriccoding）：根据语音信号产生的数学模型，通过对语音信号特征参数的提取后进行编码（将特征参数变换成数字代码进行传输）。在接收端将特征参数，结合数学模型，恢复语音，力图使重建语音保持尽可能高的可懂度，重建语音信号的波形同原始语音信号的波形可能会有相当大的区别。如线性预测（LPC）编码类。编码速率低，2.4-1.2kb/s，自然度低，对环境噪声敏感。3.混合编码(Hybridcoding)：将波形编码与参数编码相结合，在2.4-1.2kb/s速率上能够得到高质量的合成语音。规则码激励长时预测编码RPE—LPT即为混合编码技术。混合编码包括若干语音特征参量又包括部分波形编码信息，以达到波形编码的高质量和参量编码的低速率的优点。四、已经标准化的语音编码指定组织：国际电信联盟ITU-T，http://www.itu.int(5)RPE-LTP：长时预测的规则脉冲激励的线性预测Regular-PulseExcitedLPCwithaLong-TermPredictor√语音信号压缩编码的原理及其评价系统一、语音压缩的基本依据2.存在的频域冗余度：（1）非均匀的长时功率谱密度（2）短时功率谱密度女声英文a的功率谱3.人的听觉感知机理（1）人类的听觉特性具有掩蔽效应（2）人耳对不同频段声音的敏感程度不同（3）人耳对语音相位不敏感4.语音编码的极限速率语音中最基本的元素是音素，大约有128～256个，如果按通常的说话速度，每秒平均发出10个音素，则信息率为：I=[log2(256)10]bps=80bps把发音看成是以语音速率来传送，则语音编码的极限速率为80bps,从数字化标准的编码速率64kbps，到极限速率80bps，之间的距离，对于理论研究和实践有着极大的吸引力。二、语音编码的关键技术D为基音周期，长时预测系数{bi}的个数取1（q=r=0）或3(q=r=1)。D、{bi}从语音信号中直接提取。语音信号通过长时预测，得出基音周期、增益（振幅大小）。3.感觉加权滤波器输入语音x(n)三、语音压缩系统的性能指标和评测方法编码延时2.语音压缩系统的性能指标和评测方法评价指标：清晰度或可懂度、音质。前者是指语音是否容易听清楚；后者指语音听起来有多自然。（1）可懂度评价DRT：DiagnosticRhymerTest（2）音质评价：MOS：MeanOpinionScore平均意见得分和DAM：DiagnosticAcceptabilityMeasure判断满意度得分。MOS得分为五级:优、良、可、差和坏。满分为5分，相当调频广播质量；4分以上是长途电话网标准；3.5分为通信标准；3.0分仍有较好的可懂度，保持自然度；2.5分只维持可懂度，是战术通信标准。（1）波形失真度，用信噪比来度量（2）频谱失真测量（3）谱包络失真测量语音信号的波形编码均匀量化时，无论大的输入信号还是小的输入信号一律采用相同的量化间隔，为了适应大的输入信号，同时又要满足精度要求，就需要增加样本的位数。=2V/L=2V/2R，但是对话音信号来说，大信号出现的机会并不多，增加的样本数就没有充分利用。因此采用非均匀量化。其基本思想是：大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔。在满足精度要求的情况下用较少的位数来表示。译码时，采用相同的规则。也可视为将信号进行非线性变换后再作均匀量化，如对信号进行对数压缩，微弱的信号被放大，强的信号被压缩。译码时，指数扩张。现在的非均匀量化中，一般采用两种压缩扩张非均匀量化方法。采样后信号幅度和量化数据之间有两种对应关系，一种称为u律压扩（companding）算法，另一种称为A律压扩算法。u律压扩主要用于北美和日本等地区的电话通信中。A律压扩主要用在欧洲和中国的地区的电话通信中。我国的PCM30/32路基群也采用A律13折线压缩特性。μ律15折线主要用于美国、加拿大和日本等国的PCM24路基群中。CCITT建议G.711规定上述两种折线近似压缩律为国际标准，且在国际间数字系统相互连接时，要以A律为标准。因此这里重点介绍A律13折线。FA(x)A律压扩编码对输入动态范围为（-5v,+5v），用A律压扩编码，有：I=8kHz*8bit=64kbit/s实际中，麦克风采