什么是XPath
XPath(可扩展路径)是给XSL转换[XSLT]和XPointer[XPointer]的共享功能提供一个共用的句法及语义的结果。XPath的主要的目是用于对XML文档元件寻址。在支持这个主要目的的同时,它也为字符串,数字和布尔的操作提供了基本手段。XPath使用简明的、非XML句法以便於在URIs和XML属性值以内使用XPath,XPath对XML文档的抽象的、逻辑的结构而非它的表面句法进行操作,XPath的名字源于它在URL中用作对XML文档的层次的结构进行导航一个路径标志。
除了用做寻址外,XPath也被设计成以便它有能被用于匹配的一个自然的子集(测试一个节点是否匹配一个模式);XSLT中描述了XPath在这方面的使用。
XPath将一个XML文档建模成为一棵节点树,有不同类型的节点,包括元素节点,属性节点和正文节点。XPath定义了一种方法来计算每类的节点的字串值。一些节点的类型也有名字。XPath充分支持XML命名空间[XMLNames]。这样,节点的名字被建模成由一个局城部分和可能为空的命名空间URI组成的对;这被称为扩展名。
XPath返回的类型
1:节点集合(无序的、无重复的节点集合)
2:布尔(真或假)
3:数字(一个浮点数字)
4:字符串(UCS字符的顺序)
地址路径
地址路径是Xpath用于定位的一条语句,基本的语法如下:
/选择XML文档的根结点
/*选择根结点的所有子节点,
*匹配任意子节点
/x选择根结点的所有x元素
//book选择根结点的所有后代节点中的book元素
//@id选择含有id属性的子节点
para[1]选择上下文节点的第一个para孩子
//vendor[@id='id1_2']/book选择符合“属性id='id1_2'”的所有book元素
/bib/vendor/book[year>2002]选择符合“元素year>'2002'”的所有book元素
text()选择上下文节点的所有的正文节点孩子
@name选择上下文节点的name属性
@*选择上下文节点的所有的属性
*/para选择上下文节点的所有的para孙子
/doc/chapter[5]/section[2]选择doc的第五个chapter的第二个section
.//para选择上下文节点的para元素子孙
para[@type="warning"]选择的上下文节点的所有的有属性type且值为warning的para孩子
chapter[title="Introduction"]选择上下文节点的chapter孩子如果它有一个或多个title孩子且字串值为Introduction
employee[@secretaryand@assistant]选择上下文节点的所有既有secretary属性又有assistant属性的employee孩子
chpater[title]选择的上下文节点中有一个或一个以上title孩子的chpater孩子
1:child是缺省轴。例如,地址路径div/para是child:iv/child::para的缩写。
2:属性也有缩写形式:attribute::能被缩写成@。例如,地址路径para[@type="warning"]为child::para[attribute::type="warning"]的缩写,也就是选择有type属性且属性值为warning的para孩子。
3://是/descendant-or-self::node()/的缩写。例如,//para是/descendant-or-self::node()/child::para的缩写,因此选择文档中所有的para元素(即使para元素是文档元素,也会被//para所选择,因为文档元素是根节点的孩子);div//para是div/descendant-or-self::node()/child::para的缩写,因此将选择div孩子的所有para子孙
核心函数库
节点集合函数
last()返回一个数字,该数字等于从表达式求值上下文中的上下文大小
position()函数返回一个数字,该数字等於从表达式求值上下文中的上下文位置
count(node-set)函数返回在参数node-set中节点的个数
id(object)通过元素的唯一的ID选择他们
local-name(node-set?)返回一个节点的扩展名的局域部分
namespace-uri(node-set?)返回依照文档顺序参数节点集合中的第一个节点的扩展名的命名空间URI,除了元素节点和属性节点外函数namespace-uri返回的字符串将为空
name(node-set?)返回一个字符串,字符串包含一个QName,它代表依照文档顺序参数节点集合中的第一个节点的扩展名,除了元素节点和属性节点外,由name函数返回的字符串将与local-name函数返回的字符串一样
字符串函数
string(object?)函数将对象转换成字符.
concat(string,string,string*)函数返回它的参数的联结
starts-with(string,string)如果第一个字符串参数以第二个字符串参数起头,starts-with函数返回真,否则,返回假
contains(string,string)如果第一个字符串参数包含第二个字符串参数,contains函数返回真,否则,返回假
substring-before(string,string)函数返回第一个字符串参数在第二个参数首次出现之前的子字符串,或者,如果第一个字符串参数不包含第二个字符串参数则返回空字符串。例如,substring-before("1999/04/01","/")返回1999
substring-before(string,string)函数返回第一个字符串参数在第二个参数首次出现之前的子字符串,或者,如果第一个字符串参数不包含第二个字符串参数则返回空字符串。例如,substring-before("1999/04/01","/")返回1999
substring(string,number,number?)函数返回第一个字符串参数从第二个参数所指定的位置开始,以第三个参数为长度的子字符串。例如,substring("12345",2,3)返回"234"。如果没有第三个参数,则返回从第二个参数所指定的位置开始直到结束。例如,substring("12345",2)返回"2345"
string-length(string?)返回字符串中字符的个数
normalize-space(string?)函数返回空白符规范化后的参数字符串,该规范化是清除领头及结尾的空白字以及用一个空白符替换连续的空白符
translate(string,string,string)函数返回第一个参数的字符串,其中有在第二个参数中出现的字符都被在第三个参数中相对应位置的字符所替换。例如,translate("bar","abc","ABC")返回字符串BAr。如果,第二个参数里的字符在第三个参数的相对应位置没有字符(因为第二个参数里的字符串比第三个参数的字符串长),那么,第一个参数里的那个字符将被移去。例如,translate("--aaa--","abc-","ABC")返回"AAA"。如果在第二个参数里的字符出现超过一次,那么,第一次的出现决定替换的字符。如果第三个参数里的字符串比第二个参数的字符串长,那么,多余的字符将被忽略
布尔函数
boolean(object)
not(boolean)
true()
false()
lang(string)
数字函数
number(object?)函数参数依下列各项转换成数字
sum(node-set)对於在参数节点集合的每个节点,sum函数返回节点字串值转换成数字后的和
floor(number)函数返回不大於参数的整数的最大数(最接近于正无穷大)
ceiling(number)函数返回不小於参数的整数的最小数(最接近于负无穷大)
round(number)函数返回最接近于参数的整数。如果有两个这样的数字,那么,返回最接近于正无穷大的那个。如果参数是NaN,那么返回NaN。如果参数是正无穷大,那么返回正无穷大。如果参数是负无穷大,那么返回负无穷大。如果参数是正零,那么返回正零。如果参数是负零,那么返回负零。如果参数小於零,但大於或等於-0.5,那么返回负零。
参照规范
XMLSeeSeehttp://www.w3.org/TR/1998/REC-xml-19980210
XMLNameshttp://www.w3.org/TR/REC-xml-names
XSLTSeehttp://www.w3.org/TR/xslt
部分参照XML路径语言(XPath)版本1.0