欢迎来到通信人在线![用户登录] [免费注册]

关于多媒体信息的压缩

浏览:3587  来源:通信人在线  日期:2006-12-15
 

在现今的电子信息技术领域,正发生着一场有长远影响的数字化革命。由于数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。

1、数据为何要压缩

数据压缩,通俗地说,就是用最少的数码来表示信号。其作用在于:一是能较快地传输各种信号,如传真、Modem通信等;二是在现有的通信干线并行开通更多的多媒体业务,如各种增值业务;三是紧缩数据存储容量,如CD-ROMVCDDVD等;四是降低发信机功率,这对于多媒体移动通信系统尤为重要。由此看来,通信时间、传输带宽、存储空间甚至发射能量,都可能成为数据压缩的对象。

2、数据为何能被压缩

首先,数据中间常存在一些多余成分,既冗余度。如在一份计算机文件中,某些符号会重复出现、某些符号比其他符号出现得更频繁、某些字符总是在各数据块中可预见的位置上出现等,这些冗余部分便可在数据编码中除去或减少。冗余度压缩是一个可逆过程,因此叫做无失真压缩,或称保持型编码。其次,数据中间尤其是相邻的数据之间,常存在着相关性。如图片中常常有色彩均匀的背影,电视信号的相邻两帧之间可能只有少量的变化影物是不同的,声音信号有时具有一定的规律性和周期性等等。因此,有可能利用某些变换来尽可能地去掉这些相关性。但这种变换有时会带来不可恢复的损失和误差,因此叫做不可逆压缩,或称有失真编码、嫡压缩等。此外,人们在欣赏音像节目时,由于耳、目对信号的时间变化和幅度变化的感受能力都有一定的极限,如人眼对影视节目有视觉暂留效应,人眼或人耳对低于某一极限的幅度变化已无法感知等,故可将信号中这部分感觉不出的分量压缩掉或“掩蔽掉”。这种压缩方法同样是一种不可逆压缩。

对于数据压缩技术而言,最基本的要求就是要尽量降低数字化的在码事,同时仍保持一定的信号质量。不难想象,数据压缩的方法应该是很多的,但本质上不外乎上述完全可逆的冗余度压缩和实际上不可逆的嫡压缩两类。冗余度压缩常用于磁盘文件、数据通信和气象卫星云图等不允许在压缩过程中有丝毫损失的场合中,但它的压缩比通常只有几倍,远远不能满足数字视听应用的要求。在实际的数字视听设备中,差不多都采用压缩比更高但实际有损的嫡压缩技术。

只要作为最终用户的人觉察不出或能够容忍这些失真,就允许对数字音像信号进一步压缩以换取更高的编码效率。嫡压缩主要有特征抽取和量化两种方法,指纹的模式识别是前者的典型例子,后者则是一种更通用的嫡压缩技术。

3、数字音、视频的压缩标准

1)数字音频压缩技术标准分为电话语音压缩、调幅广播语音压缩和调频广播及CD音质的宽带音频压缩3种。

1)电话(200Hz~3.4kHz)语音压缩,主要有国际电信联盟(ITU)的G.71164kbit/sG.72132kbit/s)、G.72816kbit/s)和G.7298kbit/s)的建议等,用于数字电话通信。

2)调幅广播(50Hz~7kHz)语音压缩,采用ITUG.72264kbit/s)建议,用于优质语音、音乐、音频会议和视频会议等。

3)调频广播(20Hz~15kHz)及CD音质(20Hz~20KHz)的宽带音频压缩,主要采用MPEG-12、双杜比AC-3等建议,用于CDMDMPCVCDDVDHDTV电影配音等。

2)视频压缩技术标准主要有:

1ITU H.261建议,用于ISDN信道的PC电视电话、桌面视频会议和音像邮件等通信终端。

2MPEG-1视频压缩标准,用于 VCDMPCPC/TV一体机、交互电视IPTV和视频点播VOD

3MPEG-2/ITU H.262视频标准,主要用于数字存储。视频广播和通信,如HDTVCATVDVDVOD和电影点播MOD等。

4ITU H.263建议,用于网上的可视电话、移动多媒体终端、多媒体可视图文、遥感、电子邮件、电子报纸和交互式计算机成像等。

5MPEG-4 ITU H.264低码率多媒体通信标准。

4、数据压缩的实现

在各种数据类型中,最难实现的是数字视频的实时压缩,因为视频信号尤其是HDTV信号所占据的带宽甚宽,实时压缩需要很高的处理速度。现在,视频解码以及音频的编码、解码多依赖于专用芯片或数字信号处理器(DSP)来完成,并已有许多厂商推出了音视合一的单片MPEG-1MPEG-2解码器。我国在发展数据压缩技术过程中,则充分利用了软件人才优势。在软件实现方面,由于PC主机的处理能力正在飞速提高,直接利用主CPU编程实现各种视听压缩和解码算法对于桌面系统及家用多媒体将越来越有吸引力。1996年上半年,Intel向全球软件界发布了它的微处理器媒体扩展(MMX)技术。这种技术主要是在PentiumPentium Pro芯片中增加了864位寄存器和57条功能强大的新指令,以提高多媒体和通信应用程序中某些计算密集的循环速度。MMX采用单指令多数据(SIMD)技术并行处理多个信号采样值,可使不同的应用程序性能成倍提高。如:视频压缩可提高1.5倍,图像处理可提高40倍,音频处理可提高3.7倍,语音识别可提高1.7倍,三维动画可提高20倍。

© 2004-2024 通信人在线 版权所有 备案号:粤ICP备06113876号 网站技术:做网站