XML文件编码问题

XML文件编码问题
这两天的过程中的一个项目，以解决编码格式ANSI的xml当文件。我遇到了一些问题。下面的例子现在将总结分析过程。

通过win7记事本或notepad++创建一个xml文件test_source：
```
<?
xml version="1.0" encoding="utf-16"?>
<note>
	<name>coffeecat</name>
	<chn>"測试"</chn>
</note>
```
能够看到在xml文件的第一行。声明编码格式为utf-16。也就是unicode，使用IE浏览器打开test_source失败。

通过Ultra Edit将上述已创建的xml另存为test_ue，在保存时，显式的设置编码为utf-16。通过浏览器却能直接打开，这是为什么？

在网上查阅了一些资料，问题可能出在xml文件头中声明的字符编码与实际保存文件的编码格式不符。

验证：

使用Ultra Edit将test_source和test_ue打开，并切换为十六进制编辑模式：

test_source:

test_ue:

当中前两位标示出了文件实际存储格式的不同，以3C 3F开头的文件为ANSI格式存储的文件，而以FF FE开头的文件是Unicode little endian格式存储的。

结论：

要成功使用IE浏览器打开xml文件，一定要确保xml文件的格式声明与实际存储格式一致，建议在编辑xml文件时，尽量使用Ultra Edit等专业的工具进行。假设不能确定文件期望的保存格式，能够将xml中的格式声明部分（encoding="utf-16"）删掉。这样xml文件也能够在IE浏览器中打开。（能够临时解决这个问题。但不建议，可能引起的问题未知）

额外的：

在工作中，碰到了须要解析一份ANSI编码格式的xml文件，如上述的test_source.xml。当中包括了中文字符。为了不影响解析的功能，无法通过Ultra Edit将其编码格式改动为Unicode。可是项目须要这份xml文件能够随时通过IE浏览器查看。该怎么办呢？

问题还是出在xml文件的格式声明上，既然实际文件为ANSI，与声明中的encoding="utf-16“不符，那么应该将声明的编码格式改为与ANSI一致的就可以。既然要与包括中文的ANSI编码格式相符，自然想到了汉子编码字符集GB2312，将encoding="utf-16“改动为encoding="gb2312“，就可以使用IE浏览器打开xml文件了。
或者使用除了包括中文字符还包括繁体、日、韩文字字符的更全面的字符集GBK。

參考资料:

http://tjmljw.iteye.com/blog/1500370

http://ljhzzyx.blog.163.com/blog/static/3838031220129701845443/

http://blog.csdn.net/chaijunkun/article/details/4654397
相关阅读:
理解OpenShift（5）：从 Docker Volume 到 OpenShift Persistent Volume
理解OpenShift（4）：用户及权限管理
 理解OpenShift（3）：网络之 SDN
理解OpenShift（2）：网络之 DNS（域名服务）
理解OpenShift（1）：网络之 Router 和 Route
HTML盒子模型
 架构系统的雪崩理解
 C++11 lambda表达式学习
 C++11 std::shared_ptr总结与使用
 Kafka学习笔记
原文地址：https://www.cnblogs.com/bhlsheji/p/5046119.html