C#中如何使用 XmlReader 读取XML文件

摘要：XmlReader通过向前读取文档并识别读取到的元素，为我们提供了一种消耗资源最少的方式来解析XML数据。很多时候我们都是利用XmlRead...

XmlReader通过向前读取文档并识别读取到的元素，为我们提供了一种消耗资源最少的方式来解析XML数据。很多时候我们都是利用XmlReader来对XML文件的数据有效性进行验证（使用XmlReader实例的Read()方法依次读取所有节点，以此判断是否与符合指定的模式）。使用这种非缓存、只读、只向前的方式，每次读取只将很少的数据放入内存，对内存的占用量较小，对于读取内容较大的XML文件不失为一种最佳的选择。

让我们看看XmlReader类读取XML文件的步骤：

1、使用XmlReader类的Create()工厂方法创建该类的一个实例，并将被读取的XML文件名作为参数传入方法；

2、建立一个反复调用Read()方法的循环。这个方法从文件的第一个节点开始，然后读取所有余下的节点，但每次调用只读取一个节点。如果存在一个节点可被读取则返回True，而当到达文件最后时则返回False；

3、在这个循环中，将检查XmlReader实例的属性和方法，以获得关于当前节点的信息（节点的类型、名称、数据等）。不断执行循环直到Read()返回False；

下面首先看一个示例：

Employees.xml文件：

<?xml version='1.0'?> <employees> <employee id="1"> <name> <firstName>Nancy</firstName> <lastName>Davolio</lastName> </name> <city>Seattle</city> <state>WA</state> <zipCode>98122</zipCode> </employee> <employee id="2"> <name> <firstName>Andrew</firstName> <lastName>Fuller</lastName> </name> <city>Tacoma</city> <state>WA</state> <zipCode>98401</zipCode> </employee> </employees>

aspx代码：

<%@ Page Language="C#" %> <%@ Import Namespace="System.Xml" %> <script runat="server"> void Page_Load(object sender, EventArgs e) { //Location of XML file string xmlFilePath = Server.MapPath("~/Employees.xml"); try { using (XmlReader reader = XmlReader.Create(xmlFilePath)) { string result; while (reader.Read()) { //Process only the elements if (reader.NodeType == XmlNodeType.Element) { result = ""; for (int count = 1; count <= reader.Depth; count++) { result += "==="; } result += "=> " + reader.Name + "<br/>"; lblResult.Text += result; } } } } catch (Exception ex) { lblResult.Text = "An Exception occurred: " + ex.Message; } } </script> <html xmlns="http://www.w3.org/1999/xhtml" > <head runat="server"> <title>Reading an XML File using XmlReader</title> </head> <body> <form id="form1" runat="server"> <div> <asp:label id="lblResult" runat="server" /> </div> </form> </body> </html>

输出结果：

=> employees

====> employee

=======> name

==========> firstName

==========> lastName

=======> city

=======> state

=======> zipCode

====> employee

=======> name

==========> firstName

==========> lastName

=======> city

=======> state

=======> zipCode

下面让我们看看XmlReader类的属性和方法：

属性说明

AttributeCount	返回当前节点的属性个数
Depth	返回当前节点的深度，用于判断指定的节点是否具有子节点
EOF	判断读取器是否位于流的末端
HasAttribute	返回指示当前节点是否具有属性的布尔值
HasValue	返回指示当前节点是否具有值的布尔值
IsEmptyElement	判断当前节点是否是一个空元素
LocalName	返回当前节点的本地名称
Name	返回当前节点的限定名称
NamespaceURI	返回当前节点的命名空间URI
NodeType	以XmlNodeType枚举的形式返回当前节点的节点类型
Prefix	返回与当前节点相关的命名空间前缀
ReadState	以ReadState枚举的形式返回读取器的当前状态
Settings	返回用于创建XmlReader实例的XmlReaderSettings对象
Value	返回当前节点的值
ValueType	获得当前节点的CLR类型

XmlReader类的重要方法：

方法说明

Close	通过将ReadState枚举设置为Closed来关闭Xmlreader对象
Create	创建XmlReader对象的实例并将其返回给调用程序
GetAttribute	获得属性的值
IsStartElement	指示当前节点是否是开始标签
MoveToAttribute	移动读取器到指定的属性
MoveToContent	如果当前节点不是内容节点，则移动读取器至下一个内容节点
MoveToElement	移动读取器至包含当前属性的元素；用于列举属性以及想切换至包含所有这些属性的元素
MoveToFirstAttribute	移动读取器至当前节点的第一个属性
MoveToNextAttribute	移动读取器至当前节点的下一个属性
Read	从流中读取下一个节点
ReadContentAs	读取提供类型的对象的内容
ReadElementContentAs	读取当前元素并返回指定类型对象的内容
ReadEndElement	移动读取器越过当前结束标签并移动到下一个节点
ReadInnerXml	以字符串的形式读取包括标记在内的当前节点所有内容
ReadOutXml	读取包括当前节点标记和子节点在内的节点的内容
ReadToDescendant	移动读取器至下一个匹配子孙元素的节点
ReadToFollowing	不断读取直至找到指定的元素
ReadToNextSlibing	移动读取器至下一个匹配兄弟元素的节点
ReadValueChunk	允许读取嵌入在XML文档中的大型文本流

XmlNodeType枚举的成员：

成员说明

Attribute	属性
CDATA	CDATA区域
Comment	XML注释
Document	文档对象，表示XML树的根
DocumentFragment	文档片断
DocumentType	文档类型声明
Element,EndElement	开始元素和结束元素
Entity,EndEntity	开始实体声明和结束实体声明
EntityReference	实体引用（如<）
None	有没有读取节点而查询节点类型时使用
Notation	DTD中的符号条目
ProcessingInstruction	XML处理指令
SignificantWhitespace	在混合内容模型文档中的空白，或者设置了xml:space=preserve时使用
Text	元素的文本内容
Whitespace	标记之间的空白
XmlDeclaration	在文档顶部的XML声明

XmlReaderSettings类的重要属性：

属性说明

CheckCharacters	允许你获得或者设置用于指示是否执行字符检查的值
ConformanceLevel	获得或设置XmlReader对象的符合要求
IgnoreComment	允许你获得或设置用于指示是否忽略注释的值
IgnoreProcessingInstruction	指定是否忽略处理指令
IgnoreWhitespace	指定是否忽略无意义的空格
ProhibitDtd	指定是否允许DTD处理
Schemas	指定在执行XML验证时使用的XmlSchemaSet
ValidationFlags	获得或者设置用于指定模式验证设置的值
ValidationType	获得或者设置用于指定所执行的验证类型的值
XmlResolver	设置用于访问外部文档的XmlReslover

通过XmlReaderSettings类，你可以指定一系列由XmlReader对象支持的功能，为此，只需将XmlReaderSettings作为参数传入XmlReader的Create()方法中即可。如下所示：

总结下来，我们可以使用XmlReader类以非缓存、只读、只向前的方式读取XML文件，这种方法占用内存少，推荐大家使用。