实验一 建立统计压缩方法理论模型
一、实验要求
1、 用你的计算机上的压缩工具来压缩不同文件。研究原文件的大小和类型对于压缩文件与原文件大小之比的影响。
2、 从一本通俗杂志中摘录几段文字,并删除所有不会影响理解的文字,实现压缩。例如,在"this is the dog that belong to my friend” 中,删除 is 、the、that和to之后,仍然能传递相同的意思。用被删除的单词数与原文本的总单词数之比来衡量文本中的冗余度。用一本技术期刊中的文字来重复这一实验。对于摘自不同来源的文字,我们能否就其冗余度做出定量论述?
3、 编写一段程序,从包括26个字母的符号集{a,b,...,z}中随机选择字母,组成100个四字母单词,这些单词中有多少是有意义的?
二、实验内容
(这里具体描述相对实验要求的内容细节)
1、实验基本思路/实验平台,含软硬件
(如:你使用的是何种工具等等内容)
2、实验准备知识
(该实验中涉及到的知识点)
3、实验的具体实现
(针对实验要求,具体描述实验的步骤或流程。本实验中第三题请附流程图和程序代码。)
三、实验结果及分析
(这里给出实验结果,并分析产出该结果的原因和得到的结论或启示。)
实验报告:
实验报告 |
姓名:罗丹 学号:130705010059 专业:数字媒体技术 |
一、实验目的 1.使用压缩工具压缩不同文件,研究原文件的大小和类型对于压缩文件与原文件大小之比的影响。 2.研究冗余度。 |
二、实验内容 1.实验基本思路/实验平台,含软硬件 (1)用计算机上的压缩工具来压缩不同文件。研究原文件的大小和类型对于压缩文件与原文件大小之比的影响。 (2)从一本通俗杂志中摘录几段文字,并删除所有不会影响理解的文字,实现压缩。例如,在"this is the dog that belong to my friend” 中,删除 is 、the、that和to之后,仍然能传递相同的意思。用被删除的单词数与原文本的总单词数之比来衡量文本中的冗余度。用一本技术期刊中的文字来重复这一实验。对于摘自不同来源的文字,就其冗余度做出定量论述。 (3)编写一段程序,从包括26个字母的符号集{a,b,...,z}中随机选择字母,组成100个四字母单词,探索这些单词中有多少是有意义的。 2.实验准备知识 (1)对冗余度等基础概念的理解 (2) 3、实验的具体实现(对内容1中设计题设进行具体实现) (1) (2) (3)程序: #include<stdio.h> 运行结果:
|
三、实验结果及分析 1.观察内容3中(1)得出结论: 文件进行压缩过后比例明显发生了变化,其中压缩比大概是4:1。其次压缩过后传送速度明显会加快,提高了速度减少了空间占比。 2.观察内容3中(2)得出结论: 冗余度是指从安全角度考虑多余的一个量,这个量就是为了保障仪器、设备或某项工作在非正常情况下也能正常运转,通俗的讲是数据的重复度。而冗余度小。数据间的关系采用多链表结构,根据实际测试结果,在响应速度规定的范围内可最大限度地减少各种文件的冗余度。 3.观察内容3中(3)得出结论:
|