参考书 数据压缩导论(第4版)Page 66
2. 利用程序huff_enc和huff_dec进行以下操作(在每种情况下,利用由被压缩图像生成的码本)。
(a)对Sena、Sensin和Omaha图像时行编码。
(b)编写一段程序,得到相邻之差,然后利用huffman对差值图像进行编码。
给出以上每一次实验得出的文件大小,并解释其差别。
答:
(a)对Sena、Sensin和Omaha图像时行编码。
文件名(压缩前) | 大小 | 文件名(压缩后) | 大小 | 压缩比 |
SENA | 64kb | sena.huff | 57kb | 89.0% |
SINAN | 64kb | sinan.huff | 61kb | 95.3% |
OMAHA | 64kb | omaha.huff | 58kb | 90.6% |
4.一个信源从符号集A={a1,a2,a3,a4,a5}中选择字母,概率为P(a1)=0.15,P(a2)=0.04,P(a3)=0.26,P(a4)=0.05,P(a5)=0.50。
(a)计算这个信源的熵。
(b)求这个信源的霍夫曼编码。
(c)求(b)中代码的平均长度及其冗余度。
答:
1.H(X)=H(0.15,0.04,0.26,0.05,0.5)= 2.368 (bit)
2.首先按概率的降序排列
{a5,a3,a1,a4,a2}
把最低的两个归为新的信源符号 概率相加
从根节点不断往下依次分配0,1
顺序如下:a2 a4最先归为新信源符号a1' p=0.09
a1' a1再归为新信源符号a2' p=0.24
a2' a3归为新的信源符号a3' p=0.5
只剩a3' a5 结束
分配如下:给a5 编码0 a3'编码1
a3 0 a2' 1
a1 0 a1' 1
a4 0 a2 1
故信源的霍夫曼编码如下:a5 0; a3 10;a1 110;a4 1110;a2 1111;
3.平均码长L=1*0.5+2*0.26+3*0.15+4*0.05+4*0.04=1.83(bit)
冗余度r=Hmax(x)-H(X)=logm=H(X)=1.83-0.548=1.282
5.一个符号集A={a1,a2,a3,a4},其概率为P(a1)=0.1,P(a2)=0.3,P(a3)=0.25,P(a4)=0.35,使用以下过程找出一种霍夫曼码:
(a)本章概述的第一种过程;
(b)最小方差过程。
解释这两种霍夫曼码的区别。
答:
(a)霍夫曼码为:
a1: 110
a2: 10
a3: 111
a4: 0
平均码长L=0.1*3+0.3*2+0.25*3+0.35*1=2
(b)最小方差过程。
答:第二过程霍夫曼码为:
a4 00
a2 01
a3 10
a1 11
参考书《数据压缩导论(第4版)》Page 30
6、在本书配套的数据集中有几个图像和语音文件。
(a)编写一段程序,计算其中一些图像和语音文件的一阶熵;
(b)选择一些图像文件,并计算其二阶熵。试解释一阶熵与二阶熵之间的差别;
(c)对于(b)中所用的图像文件,计算其相邻像素之差的熵。试解释你的发现。