Xml作为一个非常重要的纯文本格式已经进入了编程的很多领域,作为一个面向应用层面的c#也一样在很多领域离不开Xml。
但是,c#在很多方面对Xml做了写封装,以至于很多操作Xml的代码,都不需要手动去写。例如,c#写WebService这种需要大量操作Xml的服务,除了极其个别的情况下,基本看不到任何操作Xml的代码。这是c#的一个优势,但是,最近发现正是这样一些c#的优势,导致了新一代c#程序员的能力退化。因为90%的情况下,不需要手动操作Xml,所以,年轻的c#程序员也觉得没必要为了这10%的情况,而去学如何手工读写Xml。真不知道,ms提供了这么简便的工具,是ms做的善事还是作的孽。。。
好吧,废话就不说了,转入主题。
1.如何用Xml Dom的方式读取Xml
Xml Dom方式是最原始的一种操作Xml的途径,从.net Framework 1.0开始就开始支持Dom方式。
1.1如何以Dom方式加载Xml
要读取Xml首先要加载Xml,加载的方式有两种,一种是从流或类似的Reader加载,例如:
当然还可以从字符串加载:
1.1读取无namespace的Xml
Xml已经准备好了,下面就开始读取这个Xml。现在希望读取data节下面的所有item中的text,那么就可以:
看看运行结果:
但是,这样写的问题有很多,例如在data节点中有非item的节点,这样访问,也就被无差别的把非item项也写出来了。例如把如果数据改成这样:
这样,在data节里面,除了4个item,还有一个other,这个other是不需要的,必须被排除掉,如果直接用第一中ChildNodes去访问的话,会得到这样的结果:
显然“!@#”也被选择出来了,这可不是我们所期望的,
所以,改用XPath的方式访问:
其运行结果为:
很好的other项排除在需要的节点外,这才是我们真正想要的结果:)
1.2读取有namespace的Xml
和c#一样Xml也有namespace,并且namespace在Xml中的作用巨大,也许你并未感受到namespace的作用,但是,你可能已经不得不面对那些有namespace的Xml了。
好吧,我们先加载一个有namespace的xml:
这里,我们准备了一个namespace——urn:vwxyzh,并且把这个namespace缩写成v。举个例子来说,v:data就是urn:vwxyzh这个namespace下面的data。
现在再用原来的XPath去跑一下:
Oh, no!一个也没有选择出来,为什么会这样哪?
因为原来的/data/item中的data节是没有namespace的data,和urn:vwxyzh的data不是一回事,所以,这个XPath根本定为不到任何节点。
必须要修改部分代码才能达到我们的目的,先来看看Select方法有哪些重载吧:
第一个重载,就是之前使用的那个,第二个重载,需要额外提供一个XmlNamespaceManager实例,一看名字就知道,这个实例是用于管理Xml的Namespace的。再查看一下这个类的成员:
可以发现,创建这个实例需要一个XmlNameTable,谁能提供这个XmlNameTable的实例哪?XmlDocument本身就提供了这个XmlNameTable:
这样,我们就可以修改为:
先创建一个Manager的实例,然后使用AddNamespace方法,把“v”设置为“urn:vwxyzh”的缩写。然后修改XPath,把data修改成v:data,item修改成v:item,就可以了,现在来看一下运行结果:
Yeah!这就是我们所需要的。