多媒体通信原理第2章.ppt
上传人:qw****27 上传时间:2024-09-12 格式:PPT 页数:113 大小:1.5MB 金币:15 举报 版权申诉
预览加载中,请您耐心等待几秒...

多媒体通信原理第2章.ppt

多媒体通信原理第2章.ppt

预览

免费试读已结束,剩余 103 页请下载文档后查看

15 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

多媒体技术第2章本章主要内容2.1音频信号音频信号音频信号通常声音的声强通常声音的分类音频信号的数字化音频信号的数字化音频信号的数字化音频信号的数字化音频信号的数字化音频信号压缩编码的可行性与分类音频信号压缩编码的可行性与分类音频信号压缩编码的可行性与分类音频信号压缩编码的可行性与分类声音类别与数据率声音类别与数据率声音类别与数据率声音质量的度量声音质量的度量2.5数字音乐的文件格式VOC文件是Creative公司波形音频文件格式,也是声霸卡(soundblaster)使用的音频文件格式。每个VOC文件由文件头块(headerblock)和音频数据块(datablock)组成。文件头包含一个标识、版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据、静音、标记、ASCII码文件,重复的结束,重复以及终止标志,扩展块等。现说明VOC格式音频文件的文件头如下:00H~13H字节:文件类型说明。前19个字节包含下面的正文:CreativeVoiceFile。最后是EOF字节(1AH)14H~15H字节:其值为001AH16H~17H字节:文件的版本号。小数点后面的部分在前。如本号为1.10,则这两个字节内的值为010AH。18H~19H字节:是一个识别码。由这个代码可以检验其文件是否真正的VOC文件。其值是16H和17H单元中所存文件版本号的反码再加上1234H。例如,版本号为1.10,010AH的反码是FEF5H,则这个代码为:FEF5H+1234H=1129H。MIDI文件利用指令或者消息来描述音乐事件,而不是描述音乐的波形信号文件的扩展名2.5音频信号的特点(2)基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原因品的特性。常用的音频参数有共振峰、线性预测系数、滤波器组等。这种编码技术的优点是数据率低,但还原信号的质量较差,清晰度低。将上述两种编码算法很好地结合起来,采用混合编码的方法。这样就能在较低的码率上得到较高的音质。如码本激励线性预测(CELP)、多脉冲激励线性预测编码(MPLPC)等。(4)编码算法:编码的作用其一是采用一定的格式来纪录数字数据,其二是采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率。压缩算法包括有损压缩和无损压缩;有损压缩指解压后数据不能完全复原,要丢失一部分信息。压缩编码的基本指标之一就是压缩比,它通常小于1。压缩越多,信息丢失越多、信号还原后失真越大。根据不同的应用,应该选用不同的压缩编码算法。音频数据压缩比可用下式表示:音频的波形编码脉冲编码调制脉冲编码调制PCM(PulseCodeModulation)是一种模数转换的最基本编码方法,CD-DA就是采用的这种编码方式。这是一种最通用的无压缩编码。特点是保真度高,解码速度快,但编码后的数据量大。在数字音频表示中,采用二进制编码是方便的,全部数据由一组二进制编码表示。上述这种简单地把语音经模/数转换得到数字表示方法示意的是一种瞬时均匀量化器。它采用的编码方法称作脉冲编码调制PCM)。在MPC中就是用这种方法存储未压缩的音频数据。在量化中,将量化表示成自适应差分脉冲调制编码(ADPCM)子带编码的音频压缩变换编码的音频压缩分析—合成(混合)编码音频编码技术的新发展2.小波变换音频编码小波是一簇有限能量的基函数。由于它具有伸缩、平移和放大功能,可以对信号进行多尺度分析,对信号实现既在时域又在频域的高度局部化。而小波变换系数具有固有的时间信息和频率信息,特别是对时域中能量集中的信号(如脉冲),在某种程度上将产生变换系数的集中。故非常适合于处理非平稳过程的信号。如宽带音频信号、图像信号。近几年来,将小波变换用于高质量宽带音频编码技术的研究已发表了大量文章。针对宽带音频编码的关键问题,研究内容主要集中在以下几方面:1临界频带滤波器组的逼近及离散小波包的优化。将每一帧信号分解为29个小波子带,且子带应近似于临界频带,以便充分利用掩蔽效应。2小波分解与现有编码技术的结合,以改进压缩编码特性。如与多脉冲LPC,变换编码等的结合。基于小波变换的系统设计,充分应用小波变换的优越性,其主要内容有:小波基的选择,自适应小波编码,以及掩蔽模型与小波量化的关系等。音频信号的特点从人与计算机交互的角度来看音频信号相应的处理如下:(1)人与计算机通信(计算机接收音频信号)音频获取:语音识别与理解(2)计算机与人通信(计算机输出音频)音频合成:包括音乐合成和语音合成声音定位:包括立体声模拟;音频/视频同步,目的是让计算机产生真实感声音。(3)人-计算机-人通信音频信息压缩编码技术标准体系G.7XX系列音频信号压缩编码标准G.7XX系列音频信号压缩编码标准MPEG-