浅谈数字图像编码技术
【关键词】 浅谈
1 引言
数字图像处理又称为机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。早期图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。常见的图像处理有图像数字化、图像编码、图像增强、图像复原、图像分割与图像分析等。图像编码是对图像信息进行编码,可以压缩图像的信息量,以便满足传输与存储的要求。本研究主要介绍了图像编码的基本原理和技术方法。
一幅二维数字图像可以由一个二维亮度函数通过采样和量化后而得到的一个二维数组表示。这样一个二维数组的数据量通常很大,从而对存储、处理和传输都带来了许多问题,提出了许多新的要求。为此人们试图采用对图像新的表达方法以减少表示一幅图像需要的数据量,这就是图像编码所要解决的主要问题。压缩数据量的主要方法是消除冗余数据,从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集。这个转换要在图像进行存储、处理和传输之前进行,然后将压缩了的图像解压缩以重建原始图像,即通常所称的图像编码和图像解码。
图1给出了一个通用的图像编码系统模型,这个模型主要包括2个通过信道级连接的结构模块:编码器和解码器。当一幅输入图像送入编码器后,编码器根据输入数据进行信源编码产生一组信号,这组信号在进一步被信道编码器编码后进入信道。通过信道传输后的码被送入信道解码器和信源解码器,解码器重建输入的图像。一般来说,输出图是输入图的精确复制,那么系统是无失真的或者信息保持型的;否则,称系统是信息损失的。
信源编码器的作用是减少或消除输入图像中的编码冗余、像素间冗余及心理视觉冗余。尽管信源编码器的结构与具体应用和对保真度的要求有关,但一般情况下信源编码器包括顺序的3个独立操作,而对应的信源解码器包含反序的2个独立操作(图2)。在信源编码器中,映射器将输入数据变换以减少表达图像的数据,这与具体编码技术有关。量化器根据给定的保真度准则减少映射器输出的精确度。这个操作可以减少心理冗余,但不可翻转。符号编码器产生表达量化器输出的码本,并根据码本输出。符号编码器编码为了减少冗余,这个操作是可以反转的。
当信道是有噪声的或者容易产生误差时,信道编码器和信道解码器对这个编解码过程是非常重要的。由于信源编码器的输出数据一般只有很少的冗余,所以他们对传输噪声很敏感。信道编码器通过把可控制的冗余加入信源编码器后的码字以减少信道噪声的影响。
2 传统编码方法
传统的编码方法可以分成两大类,预测编码方法(对应空域方法)和变换编码方法(对应频域编码方法)。预测编码方法的优点是:算法一般较简单,易于用硬件实现;缺点是:压缩比不够大,承受误码的能力较差。由于它采用的最小均方误差准则不能反映人眼的视觉心理特性,近年来已较少单独采用,而是与其他方法混合使用。另外,由于DPCM编码系统会引起斜率过载、界线繁忙、颗粒噪声和轮廓噪声,在使用中应加以考虑。变换编码方法的优点是:压缩比高、承受误码能力强;缺点是:算法较复杂。
3 编码方法
31 第二代图像编码方法
第二代图像编码方法[2]是针对传统编码方法中没有考虑人眼对轮廓、边缘的特殊敏感性和方向感知特性而提出的。它认为传统的第一代编码技术以信息论和数字信号处理技术为理论基础,出发点是消除图像数据的统计冗余信息,包括信息熵冗余、空间冗余和时间冗余。其编码压缩图像数据的能力已接近极限,压缩比难以提高。第二代图像编码方法充分利用人眼视觉系统的生理和心理视觉冗余特性以及信源的各种性质以期获得高压缩比,这类方法一般要对图像进行预处理,将图像数据根据视觉敏感性进行分割。
按处理方法的不同,第二代图像编码方法可分为两种典型的编码技术[3]:一种是基于分裂合并的方法,先将图像分为纹理和边缘轮廓,然后各自采用不同的方法编码;另一种是基于各向异性滤波器的方法,先对图像进行方向性滤波,得到不同方向的图像信息,再根据人眼的方向敏感性对各个通道采用特定的方法单独编码。
32 分形图像编码
分形图像编码是在分形几何理论的基础上起来的一种编码方法。分形理论是欧氏几何相关理论的扩展,是研究不规则图形和混沌运动的一门新。它描述了界物体的自相似性,这种自相似性可以是确定的,也可以是统计意义上的。这一理论基础决定了它只有对具备明显自相似性或统计自相似性的图像,例如海岸线、云彩、大树等才有较高的编码效率。而一般图像不具有这一特性,因此编码效率与图像性质学特性有关,而且分形图像编码方法实质上是通过消除图像的几何冗余来压缩数据的,根本没有考虑人眼视觉特性的作用。
33 基于模型的图像编码
基于模型的图像编码技术[4]是近几年发展起来的一种很有前途的编码方法。它利用了计算机视觉和计算机图形学中的方法和理论,其基本出发点是在编、解码两端分别建立起相同的模型,针对输入的图像提取模型参数,或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模,一般要求对输入图像要有某些先验知识。
基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息,并以模型参数的形式表示它们,因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题,例如:①模型法需要先验知识,不适合一般的应用;②对不同的应用所建模型是不一样的;③在线框模型中控制点的个数不易确定,还未找到有效的方法能根据图像内容来选取;④由于利用模型法压缩后复原图像的大部分是用图形学的方法产生的,因此看起来不够自然;⑤传统的误差评估准则不适合用于对模型编码的评价。
34 神经图像编码
在图像编码的各种方法中,除信息保持型编码方法外,其余所有方法始终没有解决好如何充分利用人的视觉特性这个问题,神经网络图像编码[5]试图在此有所突破,现在直接用于图像压缩的神经网络主要有BP网络和自组织映射神经网络。采用BP网络实现数据压缩好比是强迫数据通过细腰型网络的瓶颈,并期望在网络的瓶颈处能获得较紧凑的数据表示。
图3给出了BP网络进行数据压缩的原理,这是一nmn型三层BP神经网络。输入层有n个神经元,通过BP训练算法,在网络的学习过程中调整网络的权重,使训练集图像的重建误差E=‖X-Z‖2均值达到最小(X为输入层样本集,Z为输出层样本集),或者说,使重建图像在均方误差意义上尽可能地相似于原始图像。训练后的神经网络便可用来进行图像压缩,隐层神经元矢量Y为压缩结果。
自组织映射神经中的神经元可以自动地根据外部刺激的兴奋点来调整自己在由外界信号决定的参数空间中的位置。以一种双层神经网络为例:其中输入层神经元(x1,x2,x3,…xn)简单地反映着外部刺激,在输出层中,M个神经元排布成二维网络,其中每个神经元j接收两类输入:来自输入层神经元i的输入xi(权重为Wij)和来自输出层神经元的固定权重。对每一个外界输入矢量X=(x1,x2,x3…,xn),只有一个同该输入的距离d1=f(X,Wj),Wj=(W1j,W2j,W3j,…Wnj)为最小的神经元j才被激发。其中,距离函数f(X,Wj)反映了在某一准则(一般为平方误差准则)下,矢量X与Wj之间的距离。在网络的训练中我们只需要提供输入矢量X,通过调整从公共的外部输入到每个神经元j的连接权重Wj,权重矢量将逐渐指向输入矢量空间的聚类。从而实现了输入空间的维数压缩,完成了类似于矢量量化的功能。
35 小波图像编码
一维连续小波变换可看成原始信号和一组不同尺度的小波带通滤波器的滤波运算,从而可把信号分解到一系列频带上进行分析处理。将其离散化后即为离散小波变换。
小波变换图像编码压缩[6]的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像的大部分能量,即包含图像的基本特性。它在图像重构算法中起主导作用,对重建图像的质量有很大影响,因此这部分信号应精确保留。
高频子图像的系数分布符合广义高斯分布,对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性,根据对人眼视觉系统的研究可知,人眼视觉灵敏度具有明显的低通特性,而且对不同方向上的敏感度也不一样,尤其是对倾斜方向的刺激不太敏感,如人眼对对角线方向子图像系数误差敏感度较低,因此可对对角线方向子图像进行粗量化高压缩。
小波变换后的能量主要集中在低频系数分量,而其他高频系数分量大多为零值,这为高倍率压缩提供了可能。通过选择合适的具有平滑特性小波基,就可消除重建图像中出现的方块效应,减小量化噪声,获得较好的重建图像质量。
小波变换图像编码压缩方法可分为如下两大类:基于传统的图像编码方法和基于分形理论的小波变换图像编码方法。
基于传统的图像编码方法[7]包括:零树小波编码、基于塔式网络矢量量化的小波变换编码、基于LBG算法的小波变换编码、基于标量量化的小波变换编码等。
由于不同分辨率级子图像之间存在着相似性,因此,利用此相似性,可提高压缩比[8]。J.M.Shapiro采用零树自嵌套编码方法,对小波分解系数进行压缩,在PSNR=27.54dB的情况下,获得压缩比为128∶1。这是最著名的一种小波变换图像编码压缩方法。该方法的优点是:与传统的DCT编码相比,它既可以克服方块效应,又可以在低比特率下获得较好的图像主观质量。缺点是:由于它对各子带采用相同的门限量化,因此不能充分利用人眼的视觉特性,限制了图像压缩比的进一步提高。对此,A.Said等人提出了改进算法。
针对分形图像编码尚存在的缺点,如编码算法的耗时、图像不一定具有严格的分形结构而无法达到预期的高压缩比、高压缩倍率时的方块效应等,有人提出了基于小波变换的分形编码[9]。它具有以下特点:①采用平滑小波可去除传统分形变换中存在的方块效应;②小波表示使图像的四叉树分割十分自然;③可将零树算法看成是该算法的一个特例。图像经过金字塔形离散小波变换后的系数在小波域内可组成分层树状数据结构小波树。这些跨越不同分辨率的小波树之间存在一定的相似性,可通过分形变换来描述。基于小波变换的分形压缩过程就是一个由分层树状结构的顶部开始一层层地向下预测其余系统的过程,而这个由上至下、由粗至细的预测过程是通过分形编码来实现的。
基于小波变换的图像编码压缩的特点是[10]:压缩比高、压缩速度快,压缩后能保持信号与图像的特征不变,且在传递过程中就可以抗干扰。从现在的研究结果可看到,该方法已获得了较好的编码效果,是图像压缩技术研究的热点之一,也是十分有前途的一种方法。
4 结束语
本研究介绍了图像编码的基本原理,传统的图像编码方法和几种比较新的编码方法。第二代图像编码将视觉特性引入到图像编码技术,分形图像编码是以分形几何理论为基础,基于模型的图像编码是利用了机视觉和计算机图形学中的理论,而小波变换图像编码则引入了小波分析理论。尽管它们理论基础不同,但它们均在不同情况下不同程度地提高了编码质量。相比之下,小波变换图像编码是一种性能更佳的图像编码方法,仅从去除冗余信息的角度而言,它的性能就远远优于其他几种编码方法。另外,将小波变换与其他的新型编码方法结合,也是小波图像编码方法的重要研究方向。
1 万建伟,黄埔堪,周良柱,梁甸农图像编码技术的系统工程与技术,1996,5:31~38
2 张雪松,倪国强,周立伟,金伟其图像编码技术发展综述光学技术,1997,3:37~41
3 曹宁,吴琰,冯晔模型基方法在图像编码中的应用与改进河海大学学报,1997,25(6):97~102
4 陈红丽几种新型的图像编码技术淮北煤师院学报,2001,22(2):28~30
5 吴谨图像编码与小波变换图像编码武汉科技大学学报(自然版),2000,23(3):289~292
6 陈雷霆,吉家成,傅志中,梁福成小波图像编码与JPEG图像编码的比较研究计算机应用,2000,20(增刊):273~277
7 唐良瑞小波图像编码技术的研究北方大学学报,2001,13(3):9~13
8 刘辰昀,谭赫良,彭小燕,仲卫丽基于小波变换的图像编码湖南大学学报(自然科学版),2002,29(3):54~60
9 陈加忠,周敬利,余胜生,顾健图像编码中的重要区域相关性研究及应用计算机学报,2001,24(3):326~330