Atitit.复合文档的格式 标准化格式
1. Docfile
paip.docfile二进制复合文档
前言Docfile
Docfile是二进制复合文档,打开文件可看到文件头签名..类似于文件夹存储的方式来存储文档…如以前的DOC文件夹,OLE文档等..
2. Iso Cdf cd file
3. Zip
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 汉字名:艾龙, EMAIL:1466519819@qq.com
转载请注明来源: http://www.cnblogs.com/attilax/
4. Ooxml
OOXML是由微软公司为Office 2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准开放文档格式和中国文档标准“标文通”(外语简称:UOF)。于2006年12月成为ECMA标准。
·
互操作性。Office Open XML格式是以工业标准的XML为核心的,Microsoft Office应用程序与企业业务系统之间的数据交换得到了简化。无需访问Office应用程序,解决方案就可以更改Office文档当中的信息,或者使用标准的处理XML的工具和技术来创建文档。新的格式允许您构建文档的存档,而无需使用Office的代码。
·
·
健壮性。Office Open XML格式被设计为比二进制格式更加健壮,而且因此可以帮助降低由于文件损坏所带来的信息丢失的风险。即使在Office外面对于文档的修改和创建也不会对文档造成过多的损坏,因此使用新的文件格式,Office应用程序被设计为使用增强的可靠性来恢复文档。随着越来越多的文档穿梭与电子邮件的附加或可移动的存储设备之间,网络或存储设备的损坏增加了文档损坏的可能性。
·
新的文件格式通过将文档在文件包中进行分段单独的存储,增强了数据恢复的能力。这将大大的节省企业用于恢复数据丢失所花费的大量资金和时间。当一个文件组件损坏时,文件中的剩余部分还可以在应用程序中打开。例如,如果一幅图表被损坏了,这也并不能阻止客户打开文档中的其它部分,当然不包括图表。另外,Office应用程序可以检测这些问题,并且在打开文档的时候尝试修复它,恢复文档正确的数据结构。
·
高效性。Office Open XML格式使用ZIP和压缩技术来存储文档。这种新格式的一个巨大的优势就在于它的文件大小非常小 - 最大的压缩比可以达到原来二进制文件的百分之75。这是使用XML和ZIP技术结合进行文件存储的一大优势。因为XML是一个基于文本的格式,所以压缩的比率非常的好,而且ZIP容器支持内容的压缩,所以用户可以大大的减小文件的尺寸。文件压缩的类型提供了潜在的成本节约,因为它减少了存储文件所需的磁盘容量,并且减少了通过电子邮件、网络和Web进行文件传输所需的带宽。
·
5. Odf :OpenDocument Format
开放文档格式(外文名:OpenDocument Format,外语简称:ODF)是一种规范,基于XML(标准通用标记语言的子集)的文件格式,因应试算表、图表、演示稿和文字处理文件等电子文件而设置。它的规格原本由太阳微系统开发,标准则由结构化信息标准促进组织OASIS所开发。存在一个自由兼开放的OASIS标准,以ISO/IEC国际标准发布──ISO/IEC 26300:2006 Open Document Format for Office Applications(OpenDocument)v1.0。
开放文档格式提供一个取代私有专利文件格式的一个方案,使得组织或个人不会因为文件格式而被厂商套牢(外文名:Vendor lock-in)。
5.1.1. 本质
odf文档是基于xml语言的纯文本文档。odf格式的文本文档的扩展名常见为*.odt。一个odt文档实质上是一个打包的文件,并且通常都经过了zip格式的压缩。我们完全可以用现有的任意一款压缩软件将odt文件解压,查看其里面的内容就会发现其本质。一个odt文件解压后会得到一个与原文件名相同的文件夹,该文件夹里面一般会含有以下子文件夹与文件:
6. 参考
atitit.压缩算法 ZLib ,gzip ,zip 最佳实践 java .net php - attilax的专栏 - 博客频道 - CSDN.NET.htm
Atitit. 解压缩zip文件 的实现最佳实践 java c# .net php - attilax的专栏 - 博客频道 - CSDN.NET.htm
ooxml_百度百科.htm