1、 教材习题1-1,1-2,1-6
1-6 数据压缩技术是如何分类的?
数据压缩技术是按照数据的性质来划分的,数据的性质分为可逆和不可逆两大类。所以数据压缩技术就分为可逆压缩和不可逆压缩。其中可逆压缩也叫无失真,无差错编码或无噪声编码,不可逆压缩就是有失真编码。
1-2 数据压缩的另一个基本问题是“为什么进行压缩”,对此你又是怎么理解的?
我的理解是:电脑存储的数据是大量的,占有很多的内存,若我们不进行数据压缩,就会消耗我们很多时间和精力,所以我们必须对数据进行压缩。
1-1 数据压缩的一个基本问题是“我们压缩什么”,对此你是怎么理解的?
我的理解是:电脑中存储的数据都是占用大内存的,大容量的。对此若我们要使用这些数据,那就得消耗我们的很多的精力和时间,所以为了方便我们使用数据,所以我们就对这些数据进行压缩,这些数据包括文字,图片,图形,视频,音频等等的一系列数据。
2、 参考书《数据压缩导论(第4版)》Page 8 1.4
1 用你的计算机上的压缩工具来压缩不同的原文件,研究源文件的大小和类型对于压缩文件与原文件大小之比的影响?
在我的计算机上的图片原文件大小是606 KB (620,888 字节),占用的空间是608 KB (622,592 字节),压缩后的大小是604 KB (618,982 字节)。原文件与压缩后的文件大小之比是1.0033.影响是压缩后的文件比原文件小,这占用内存相对较小,节省空间资源。
2 我们能否用冗余度来做出定量论述?
不能,要是删除的是关键字,就不能检索出该字的相关信息。
3、 参考书《数据压缩导论(第4版)》Page 30
3, 5, 7(a
3 给定符号集A={a1,a2,a3,a4},求以下条件的一阶熵
a. H=2bit
b. H=0.5+0.5+0.375+0.375=1.75bit
c. H=0.5+0.5+0.375+0.367=1.742bit
5.考虑一下序列
a 根据题目的意思,总的字母数是84个,其中A有21个,T有23个,G有16个,C有24.所以p(A)=1/4,p(T)=23/84,p(G)=4/21,p(C)=2/7
所以一阶熵H=0.5+0.51+0.46+0.52=1.99bit
7
a
#include <stdio.h> #include<stdlib.h> #include <windows.h> int main() { int m,n; for(m=0;m<100;m++) { for(n=0;n<4;n++) { putchar(rand()%2?65+rand()%26:97+rand()%26); } Sleep(2000); putchar(' '); } return 0; }