图像压缩

本章首先介绍图像压缩编码的基本概念包括数据压缩的可能性、数据冗余、压缩比、压缩算法、失真性等,信息论基础包括信源空间、信息度量等内容;随后介绍图像压缩编码包括无损压缩、有损压缩,主要的无损压缩编码有哈夫曼编码、算术编码、行程编码,主要的有损压缩编码包括预测编码、频率域方法等;最后介绍图像压缩编码主要国际标准:静止图像压缩编码标准-JPEG相关内容。
展开查看详情

1.信号与图像处理基础 中国科技大学 自动化系 曹 洋 Image Compression

2.图像压缩编码 数据压缩与信息论基础 图像压缩与编码基本概念 信息论基础 图像压缩编码 无损压缩 有损压缩 图像压缩编码主要国际标准 静止图像压缩编码标准 - JPEG

3. 一 . 图像压缩与编码基本概念 为什么要进行图像压缩 图像数据压缩的可能性 数据冗余 图像压缩的目的 图像数据压缩技术的重要指标 图像数据压缩的应用领域 图像编码中的保真度准则 信息论基础 图像压缩模型

4.1. 为什么要进行图像压缩? 数字图像通常要求很大的比特数,这给图像的传输和存储带来相当大的困难。要占用很多的资源,花很高的费用 。 如 一幅 512*512 的灰度图象的比特数 为 512*512*8= 256k 再 如一部 90 分钟的彩色电影,每秒放映 24 帧。把它数字化,每帧 512*512 象素,每象素的 R 、 G 、 B 三分量分别占 8 bit ,总比特数为 9 0*60*24*3*512*512*8bit= 97,200M 。

5.2. 图像数据压缩的可能性 一般原始图像中存在很大的冗余度。 用户通常允许图像失真。 当信道的分辨率不及原始图像的分辨率时,降低输入的原始图像的分辨率对输出图像分辨率影响不大。 用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息。提取有用的信息,使必须传输和存储的图像数据大大减少。

6. 设: n 1 和 n 2 是在两个表达相同信息的数据集中,所携带的单位信息量。 压缩率 : —— 描述压缩算法性能 C R = n 1 / n 2 其中, n 1 是压缩前的数据量, n 2 是压缩后的数据量 相对数据冗余 : R D = 1 – 1/C R 例: C R =20; R D = 19/20 描述信源的数据是信息量(信源熵)和信息冗余量之和。 3. 数据冗余 1 )数据冗余的基本概念

7.A. 编码冗余: 2 )常见的数据冗余 在数字图像压缩中,常有 3 种基本的数据冗余:编码冗余、像素间的冗余以及心理视觉冗余 为表达图像数据需要用一系列符号,用这些符号根据一定的规则来表达图像就是对 图像编码 。 对每个信息或事件所赋的符号序列称为 码字 ,而每个码字里的符号个数称为 码字的长度 。 3. 数据冗余

8.设定义在 [0,1] 区间的离散随机变量 s k 代表图像的灰度值,每个 s k 以概率 p s ( s k ) 出现 P s ( s k )= n k /n k=0,1,2,…,L-1 其中 L 为灰度级数, n k 是第 k 个灰度级出现的次数, n 是图像中像素总个数。设用来表示 s k 的每个数值的比特数是 ,那么为表示每个像素所需的平均比特数就是 编码所用的符号构成的集合称为 码本 。 3. 数据冗余

9.等长码:对于一个消息集合中的不同消息,用相同长度的不同码字表示, 编解码简单,编码效率不高 。 变长码:与等长码相对应,对于一个消息集合中的不同消息,也可以用不同长度的码字表示, 编码效率高,编码解码复杂。 3. 数据冗余

10.例:如果用 8 位表示该图像的像素,我们就说该图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。 如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。 3. 数据冗余

11.B. 像素冗余: 由于任何给定的像素值,原理上都可以通过它的邻居预测到,单个像素携带的信息相对是小的。 对于一个图像,很多单个像素对视觉的贡献是冗余的。这是建立在对邻居值预测的基础上。 原始图像越有规则,各像素之间的相关性越强,它可能压缩的数据就越多。 例:原图像数据: 234 223 231 238 235 压缩后数据: 234 11 -8 -7 3 3. 数据冗余

12.相同的目标 相同的直方图 像素间 的相关性不同 3. 数据冗余

13.类似还有: 图像彩色光谱空间的冗余; 视频图像信号在时间上的冗余; 3. 数据冗余

14. 一些信息在一般视觉处理中比其它信息的相对重要程度要小,这种信息就被称为视觉心理冗余。 视觉 心理冗余: 33K 15K 3. 数据冗余

15.4. 图像压缩的目的 图像数据压缩的目的是在满足一定图像质量 条件下,用尽可能少的比特数来表示原始图像, 以提高图像传输的效率和减少图像存储的容量。 在信息论中称为信源编码。 图像从结构上大体上可分为两大类,一类是具有一定图形特征的结构,另一类是具有一定概率统计特性的结构。 基于不同的图像结构特性,应采用不同的压缩编码方法。

16.5. 图像数据压缩技术的重要指标 ( 1 ) 压缩比 :图像压缩前后所需的信息存储量之比,压缩比越大越好。 ( 2 ) 压缩算法 :利用不同的编码方式,实现对图像的数据压缩。 ( 3 ) 失真性 :压缩前后图像存在的误差大小。

17. 全面评价一种编码方法的优劣,除了看它的 编码效率 、 实时性 和 失真度 以外,还要看它的 设备复杂程度 ,是否 经济与实用 。 常采用混合编码的方案,以求在性能和经济上取得折衷。 随着计算方法的发展,使许多高效而又比较复杂的编码方法在工程上有实现的可能。 5. 图像数据压缩技术的重要指标

18.6. 图像编码中的保真度准则 图像信号在编码和传输过程中会产生误差, 尤其是在有损压缩编码中,产生的误差应在 允许的范围之内。在这种情况下,保真度准 则可以用来衡量编码方法或系统质量的优劣。 通常,这种衡量的尺度可分为 客观保真度准 则 和 主观保真度准则 。

19. 通常使用的客观保真度准则有输入图像和输出图像的 均方根误差 ;输入图像和输出图像的 均方根信噪比 两种。 均方根误差 : 设输入图像是由 N×N 个像素组成,令其为 f (x ,y) ,其中 x ,y=0,1,2,…,N-1 。这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像,这里令重建图像为 g (x ,y) 。它同样包含 N×N 个像素,并且 x ,y=0,1,2,…,N-1 。 (1) 客观保真度准则 6. 图像编码中的保真度准则

20.在 0,1,2,…,N-1 范围内 x,y 的任意值,输入像素和对应的输出图像之间的误差可用下式表示: 而包含 N×N 像素的图像之均方误差为 : 由式可得到均方根误差为 6. 图像编码中的保真度准则

21. 如果把输入、输出图像间的误差看作是噪声,那么,重建图像 g(x,y) 可由下式表示: 在这种情况下,另一个客观保真度准则 —— 重建图像的均方信噪比如下式表示: 6. 图像编码中的保真度准则

22.图像处理 的结果 , 大多是给人观看,由研究人员来解释的,因此,图像质量的好坏,既与图像本身的客观质量有关,也与视觉系统的特性有关。 有时候 ,客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则,这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。 (2) 主观保真度准则 6. 图像编码中的保真度准则

23.评分 评价 说明 1 优秀的 优秀的具有极高质量的图像 2 好的 是可供观赏的高质量的图像,干扰并不令人讨厌 3 可通过的 图像质量可以接受,干扰不讨厌 4 边缘的 图像质量较低,希望能加以改善,干扰有些讨厌 5 劣等的 图像质量很差,尚能观看,干扰显著地令人讨厌 6 不能用 图像质量非常之差,无法观看 表 6.1 电视图像质量评价尺度 6. 图像编码中的保真度准则

24.7. 信息论 (一)、信源空间概述 1 、信息:事物运动状态或存在方式的不确定性的描述; 2 、信源空间:随机符号及其出现概率的空间; 3 、信源的分类: ( 1 )连续信源 — 离散信源 — 混合信源; ( 2 )无记忆信源 — 有记忆信源(相关信源) — 有限长度记忆信源( Markov 信源)

25.(二)、信息的度量 1 、信息公理 ( 1 )信息由 不确定性程度 进行度量; 确定事件的信息量为零。 ( 2 )不确定性程度越高信息量越大; ( 3 )相互独立性与信息量可加性; 独立事件的联合信息等于两个独立事件的信息总和。 满足上述公理的函数为: 7. 信息论

26.2 、离散无记忆信源( DNMS )的信息量度量: ( 1 )信源符号 的自信息量定义为: (a) 非负性; (b) 信息量的单位: 底为 2 时 —— 单位为:比特( bit ) 底为 e 时 —— 单位为:奈特( Nat ) 底为 10 时 —— 单位为:哈特 7. 信息论

27.( 2 )、信源平均自信息量(信息熵) 离散无记忆信源 A 的平均自信息量(信息熵)定义为: 7. 信息论

28.例 : 设 8 个随机变量具有同等概率为 1 / 8 ,计算信息熵 H 。 解 : H=8 *[-1/8*(log 2 (1/8))=8*[-1/8*(-3)]=3 7. 信息论 图像熵指该图像的平均信息量,即表示图像中各个灰度级比特数的统计平均值,等概率事件的熵最大。

29.预测编码 图像编码 无损压缩编码 有损压缩编码 哈夫曼编码 行程编码 算术编码 频率域方法 其他编码方法 二 . 常用的图像压缩编码方法