多媒体通信课件第2章.doc
上传人:sy****28 上传时间:2024-09-14 格式:DOC 页数:14 大小:24KB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

多媒体通信课件第2章.doc

多媒体通信课件第2章.doc

预览

免费试读已结束,剩余 4 页请下载文档后查看

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第2章多媒体信息编码第2章多媒体信息编码2.1引言2.2基本编码方法2.3图像编码标准2.4语音编码标准第2章多媒体信息编码2.1引言表2.1连续媒体数据类型特征举例媒体嘈?语音质量音频?CD质量音频?MPEG-2编码视频NTSC质量视?HDTV质量视频数据速率说明64kb/s?1.4Mb/s?1个信道,8kHz条样速率,8位量化?2个信道,44.1kHz条样速率,16位量化?640*480像素/帧,24位/像素,30帧/秒?1280*720像素/帧,24位/像素,30帧/秒3.36Mb/s?640*480像素/帧,24位/像素,30帧/秒?216Mb/s?648Mb/s第2章多媒体信息编码数据压缩处理一般由两个过程组成:一是编码过程,即对原始数据进行编码压缩,以便存储和传输;二是解码过程,即对压缩的数据进行解压,恢复成可用的数据。根据解压后数据的保真度,数据压缩技术可分为无损压缩编码和有损压缩编码两大类。?无损压缩编码是指解码后的数据与原始数据完全相同,无任何偏差。这种编码通常基于信息熵原理,常用的编码有哈夫曼编码、算术编码、行程编码等。它的压缩能力与所处理数据的类型有关,压缩比通常比较低,一般在2∶1~5∶1。主要用于要求数据无损压缩存储和传输的场合,如传真机、文本文件传输等。第2章多媒体信息编码有损压缩编码是指解码后的数据与原始数据相比有一定的偏差,但仍可保持一定的视听质量和效果。它主要利用人的视、听觉特性,在保持一定保真度下对数据进行压缩,其压缩比可达100∶1。压缩比愈高,其解压缩后的视、音频质量就愈低。这种编码方法有很多种,如基于线性预测原理的预测编码、基于正交变换原理的正交变换编码、基于向量量化原理的向量量化编码、基于分层处理的分层编码以及基于频带分割原理的子带编码等。主要用于对音频和视频数据的压缩。第2章多媒体信息编码多媒体信息编码技术主要侧重于有损压缩编码的研究。经过多年的研究与开发,已经出台了一系列有关的国际标准。其中,最著名的是国际标准组织(ISO)制定的JPEG和MPEG。JPEG是静止图像的压缩标准,其压缩比可达40∶1。MPEG(MPEG-1、MPEG-2及MPEG-4)是动态图像的压缩标准,采用MPEG-2标准对NTSC质量视频进行压缩后,网络带宽需求可降低到3.36Mb/s。其它的标准还有国际电信联合会(ITU)制定的用于可视电话、会议电视的H.261和H.263;用于音频的G.711、G.721、G.728等。第2章多媒体信息编码2.2基本编码方法2.2.1行程编码行程编码是一种简单的无损压缩编码方法,它通过压缩原始数据中相同的字节序列实现数据压缩。在图像和声音数据中可能包含大量的相同字节连续重复的序列,通过行程编码可以将这些,重复字节压缩掉,取而代之的是一个更加紧密的字节序列。例如,一个原始数据字符串为RTTTTTTTTABBCDGHJK,采用行程编码后的字符串为R#8TABBCDGHJK,这里用#8T替换掉8个T字符,符号“#”是特殊标识符,用于表示行程编码。如果原始数据字符串也包含了“#”符号,则必须用两个“#”符号替换掉原始数据字符串中的“#”符号。第2章多媒体信息编码2.2.2哈夫曼编码哈夫曼(Huffman)编码是一种无损压缩编码方法,它根据信源符号出现的概率大小进行排序,出现的概率大的符号分配短码,反之分配长码。在分配代码过程中,需要建立一个n阶二叉树,其编码过程如下:?①对信源符号按其出现的概率进行递减排序;?②将两个最小的概率相加,其和作为新符号的概率;?③重复①和②,直到概率之和达到1为止;?④每次合并消息时,将被合并的消息赋予1和0或者0和1;?⑤寻找从每个信源符号到概率为1处的路径,记录下路径上的1和0;⑥从树根节点到叶子节点,对每个信源符号列出0、1序列。第2章多媒体信息编码例如,A、B、C、D四个字符出现的概率分别为:P(A)=3/4;?P(B)=1/8;P(C)=?1/16;P(D)=1/16,?按照上述编码过程将生成如图2.1所示的二叉树,获得的编码结果是:H(A)=1;H(B)=01;H(C)=001;H(D)=000,该结果存放在哈夫曼表中。图2.1哈夫曼编码生成的二叉树第2章多媒体信息编码2.2.3离散余弦变换编码变换编码主要有离散傅立叶变换(DFT)编码、离散余弦变换(DCT)编码等。其中,DCT编码方法被普遍使用,在JPEG、MPEG和H.261等标准中都采用了DCT编码。由于声音信号只有一个时间维,因此音频信号压缩采用一维DCT编码,而图像压缩必须考虑水平和垂直两个方向,因此图像压缩则采用二维DCT编码。?第2章多媒体信息编码DCT编码方法是对一个8×8图像块灰度样本数据