C#中如何使用 XmlReader 读取XML文件_C#教程_脚本之家 (jb51.net)
XmlReader通过向前读取文档并识别读取到的元素,为我们提供了一种消耗资源最少的方式来解析XML数据。很多时候我们都是利用XmlReader来对XML文件的数据有效性进行验证(使用XmlReader实例的Read()方法依次读取所有节点,以此判断是否与符合指定的模式)。使用这种非缓存、只读、只向前的方式,每次读取只将很少的数据放入内存,对内存的占用量较小,对于读取内容较大的XML文件不失为一种最佳的选择。
让我们看看XmlReader类读取XML文件的步骤:
1、使用XmlReader类的Create()工厂方法创建该类的一个实例,并将被读取的XML文件名作为参数传入方法;
2、建立一个反复调用Read()方法的循环。这个方法从文件的第一个节点开始,然后读取所有余下的节点,但每次调用只读取一个节点。如果存在一个节点可被读取则返回True,而当到达文件最后时则返回False;
3、在这个循环中,将检查XmlReader实例的属性和方法,以获得关于当前节点的信息(节点的类型、名称、数据等)。不断执行循环直到Read()返回False;
下面首先看一个示例:
Employees.xml文件:
<?xml version='1.0'?> <employees> <employee id="1"> <name> <firstName>Nancy</firstName> <lastName>Davolio</lastName> </name> <city>Seattle</city> <state>WA</state> <zipCode>98122</zipCode> </employee> <employee id="2"> <name> <firstName>Andrew</firstName> <lastName>Fuller</lastName> </name> <city>Tacoma</city> <state>WA</state> <zipCode>98401</zipCode> </employee> </employees>
aspx代码:
<%@ Page Language="C#" %>
<%@ Import Namespace="System.Xml" %>
<script runat="server">
void Page_Load(object sender, EventArgs e)
{
//Location of XML file
string xmlFilePath = Server.MapPath("~/Employees.xml");
try
{
using (XmlReader reader = XmlReader.Create(xmlFilePath))
{
string result;
while (reader.Read())
{
//Process only the elements
if (reader.NodeType == XmlNodeType.Element)
{
result = "";
for (int count = 1; count <= reader.Depth; count++)
{
result += "===";
}
result += "=> " + reader.Name + "<br/>";
lblResult.Text += result;
}
}
}
}
catch (Exception ex)
{
lblResult.Text = "An Exception occurred: " + ex.Message;
}
}
</script>
<html xmlns="http://www.w3.org/1999/xhtml" >
<head runat="server">
<title>Reading an XML File using XmlReader</title>
</head>
<body>
<form id="form1" runat="server">
<div>
<asp:label id="lblResult" runat="server" />
</div>
</form>
</body>
</html>
输出结果:
=> employees
====> employee
=======> name
==========> firstName
==========> lastName
=======> city
=======> state
=======> zipCode
====> employee
=======> name
==========> firstName
==========> lastName
=======> city
=======> state
=======> zipCode
下面让我们看看XmlReader类的属性和方法:
属 性 |
说 明 |
AttributeCount |
返回当前节点的属性个数 |
Depth |
返回当前节点的深度,用于判断指定的节点是否具有子节点 |
EOF |
判断读取器是否位于流的末端 |
HasAttribute |
返回指示当前节点是否具有属性的布尔值 |
HasValue |
返回指示当前节点是否具有值的布尔值 |
IsEmptyElement |
判断当前节点是否是一个空元素 |
LocalName |
返回当前节点的本地名称 |
Name |
返回当前节点的限定名称 |
NamespaceURI |
返回当前节点的命名空间URI |
NodeType |
以XmlNodeType枚举的形式返回当前节点的节点类型 |
Prefix |
返回与当前节点相关的命名空间前缀 |
ReadState |
以ReadState枚举的形式返回读取器的当前状态 |
Settings |
返回用于创建XmlReader实例的XmlReaderSettings对象 |
Value |
返回当前节点的值 |
ValueType |
获得当前节点的CLR类型 |
XmlReader类的重要方法:
方 法 |
说 明 |
Close |
通过将ReadState枚举设置为Closed来关闭Xmlreader对象 |
Create |
创建XmlReader对象的实例并将其返回给调用程序 |
GetAttribute |
获得属性的值 |
IsStartElement |
指示当前节点是否是开始标签 |
MoveToAttribute |
移动读取器到指定的属性 |
MoveToContent |
如果当前节点不是内容节点,则移动读取器至下一个内容节点 |
MoveToElement |
移动读取器至包含当前属性的元素;用于列举属性以及想切换至包含所有这些属性的元素 |
MoveToFirstAttribute |
移动读取器至当前节点的第一个属性 |
MoveToNextAttribute |
移动读取器至当前节点的下一个属性 |
Read |
从流中读取下一个节点 |
ReadContentAs |
读取提供类型的对象的内容 |
ReadElementContentAs |
读取当前元素并返回指定类型对象的内容 |
ReadEndElement |
移动读取器越过当前结束标签并移动到下一个节点 |
ReadInnerXml |
以字符串的形式读取包括标记在内的当前节点所有内容 |
ReadOutXml |
读取包括当前节点标记和子节点在内的节点的内容 |
ReadToDescendant |
移动读取器至下一个匹配子孙元素的节点 |
ReadToFollowing |
不断读取直至找到指定的元素 |
ReadToNextSlibing |
移动读取器至下一个匹配兄弟元素的节点 |
ReadValueChunk |
允许读取嵌入在XML文档中的大型文本流 |
XmlNodeType枚举的成员:
成 员 |
说 明 |
Attribute |
属性 |
CDATA |
CDATA区域 |
Comment |
XML注释 |
Document |
文档对象,表示XML树的根 |
DocumentFragment |
文档片断 |
DocumentType |
文档类型声明 |
Element,EndElement |
开始元素和结束元素 |
Entity,EndEntity |
开始实体声明和结束实体声明 |
EntityReference |
实体引用(如<) |
None |
有没有读取节点而查询节点类型时使用 |
Notation |
DTD中的符号条目 |
ProcessingInstruction |
XML处理指令 |
SignificantWhitespace |
在混合内容模型文档中的空白,或者设置了xml:space=preserve时使用 |
Text |
元素的文本内容 |
Whitespace |
标记之间的空白 |
XmlDeclaration |
在文档顶部的XML声明 |
XmlReaderSettings类的重要属性:
属 性 |
说 明 |
CheckCharacters |
允许你获得或者设置用于指示是否执行字符检查的值 |
ConformanceLevel |
获得或设置XmlReader对象的符合要求 |
IgnoreComment |
允许你获得或设置用于指示是否忽略注释的值 |
IgnoreProcessingInstruction |
指定是否忽略处理指令 |
IgnoreWhitespace |
指定是否忽略无意义的空格 |
ProhibitDtd |
指定是否允许DTD处理 |
Schemas |
指定在执行XML验证时使用的XmlSchemaSet |
ValidationFlags |
获得或者设置用于指定模式验证设置的值 |
ValidationType |
获得或者设置用于指定所执行的验证类型的值 |
XmlResolver |
设置用于访问外部文档的XmlReslover |
通过XmlReaderSettings类,你可以指定一系列由XmlReader对象支持的功能,为此,只需将XmlReaderSettings作为参数传入XmlReader的Create()方法中即可。如下所示:
<script runat="server">
void Page_Load(object sender, EventArgs e)
{
string xmlFilePath = Server.Mappath("~/Employees.xml");
//Create the XmlReaderSettings object and set appropriate properties
XmlReaderSettings settings = new XmlReaderSettings();
settings.IgnoreComments = true;
settings.IgnoreWhitespace = true;
try
{
//Get reference to the XmlReader object
using (XmlReader reader = XmlReader.Create(xmlFilePath, settings))
{
string result;
while (reader.Read())
{
//Process only the elements
if (reader.NodeType == XmlNodeType.Element)
{
//Reset the variable for a new element
result = "";
for (int count = 1; count <= reader.Depth; count++)
{
result += "===";
}
result += "=> " + reader.Name + "<br/>";
lblResult.Text += result;
}
}
}
}
catch (Exception ex)
{
lblResult.Text = "An Exception occurred: " + ex.Message;
}
}
</script>
总结下来,我们可以使用XmlReader类以非缓存、只读、只向前的方式读取XML文件,这种方法占用内存少,推荐大家使用。