一、正则表达式概述
二、正则表达式在VBScript中的应用
三、正则表达式在VavaScript中的应用
四、示例
五、总结
一、正则表达式概述
如果原来没有使用过正则表达式,那么可能对这个术语和概念会不太熟悉。不过,它们并不是您想象的那么新奇。
请回想一下在硬盘上是如何查找文件的。您肯定会使用?和*字符来帮助查找您正寻找的文件。?字符匹配文件名中的单个字符,而*则匹配一个或多个字符。一个如'data?.dat'的模式可以找到下述文件:data1.dat、data2.dat等等。如果使用*字符代替?字符,则将扩大找到的文件数量。'data*.dat'可以匹配下述所有文件名:data.dat、data1.dat、data12.dat等等,尽管这种搜索文件的方法肯定很有用,但也十分有限。?和*通配符的有限能力可以使你对正则表达式能做什么有一个概念,不过正则表达式的功能更强大,也更灵活。
在我们编写ASP程序时,经常会判断一个字符串的有效性,如;一个串是否是数字、是否是有效的Email地址等等。如果不使用正则表达式,那么判断的程序会很长,并且容易出错,如果使用正则表达式,这些判断就是一件很轻松的工作了。后面我们将介绍如何判断数字和Email地址的有效性。
在典型的搜索和替换操作中,必须提供要查找的确切文字。这种技术对于静态文本中的简单搜索和替换任务可能足够了,但是由于它缺乏灵活性,因此在搜索动态文本时就有困难了,甚至是不可能的。
使用正则表达式,能完成些什么事情呢?
测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证。
替换文本。可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字。
根据模式匹配从字符串中提取一个子字符串。可以用来在文本或输入字段中查找特定文字。
例如,如果需要搜索整个web站点来删除某些过时的材料并替换某些HTML格式化标记,则可以使用正则表达式对每个文件进行测试,看在该文件中是否存在所要查找的材料或HTML格式化标记。用这个方法,就可以将受影响的文件范围缩小到包含要删除或更改的材料的那些文件。然后可以使用正则表达式来删除过时的材料,最后,可以再次使用正则表达式来查找并替换那些需要替换的标记。
那么,正则表达式语法的语法是如何呢?
一个正则表达式就是由普通字符(例如字符a到z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
这里有一些可能会遇到的正则表达式示例:
/^[t]*$/"^[t]*$"匹配一个空白行。
/d{2}-d{5}/"d{2}-d{5}"验证一个ID号码是否由一个2位数字,一个连字符以及一个5位数字组成。
/<(.*)>.*</1>/"<(.*)>.*</1>"匹配一个HTML标记。
二、正则表达式在VBScript中的应用
VBScript使用RegExp对象、Matches集合以及Match对象提供正则表达式支持功能。我们还是先看一个例子。
<%
FunctionRegExpTest(patrn,strng)
?DimregEx,Match,Matches'建立变量。
?SetregEx=NewRegExp'建立正则表达式。
?regEx.Pattern=patrn'设置模式。
?regEx.IgnoreCase=True'设置是否区分字符大小写。
?regEx.Global=True'设置全局可用性。
?SetMatches=regEx.Execute(strng)'执行搜索。
?ForEachMatchinMatches'遍历匹配集合。
??RetStr=RetStr&"Matchfoundatposition"
??RetStr=RetStr&Match.FirstIndex&".Matchvalueis'"
??RetStr=RetStr&Match.value&"'."&"<BR>"
?Next
?RegExpTest=RetStr
EndFunction
response.writeRegExpTest("[ij]s.","IS1Js2IS3is4")
%>
在这个例子中,我们查找字符串中有无is或者js这两个词,忽略大小写。运行的结果如下:
Matchfoundatposition0.Matchvalueis'IS1'.
Matchfoundatposition4.Matchvalueis'Js2'.
Matchfoundatposition8.Matchvalueis'IS3'.
Matchfoundatposition12.Matchvalueis'is4'.
??下面我们就介绍这三个对象和集合。
??1、RegExp对象是最重要的一个对象,它有几个属性,其中:
○Global属性,设置或返回一个Boolean值,该值指明在整个搜索字符串时模式是全部匹配还是只匹配第一个。如果搜索应用于整个字符串,Global属性的值为True,否则其值为False。默认的设置为False。
○IgnoreCase属性,设置或返回一个Boolean值,指明模式搜索是否区分大小写。如果搜索是区分大小写的,则IgnoreCase属性为False;否则为True。缺省值为False。
○Pattern属性,设置或返回被搜索的正则表达式模式。必选项。总是一个RegExp对象变量。
??2、Match对象
匹配搜索的结果是存放在Match对象中,提供了对正则表达式匹配的只读属性的访问。Match对象只能通过RegExp对象的Execute方法来创建,该方法实际上返回了Match对象的集合。所有的Match对象属性都是只读的。在执行正则表达式时,可能产生零个或多个Match对象。每个Match对象提供了被正则表达式搜索找到的字符串的访问、字符串的长度,以及找到匹配的索引位置等。
○FirstIndex属性,返回在搜索字符串中匹配的位置。FirstIndex属性使用从零起算的偏移量,该偏移量是相对于搜索字符串的起始位置而言的。换言之,字符串中的第一个字符被标识为字符0
○Length属性,返回在字符串搜索中找到的匹配的长度。
○value属性,返回在一个搜索字符串中找到的匹配的值或文本。
3、Matches集合
正则表达式Match对象的集合。Matches集合中包含若干独立的Match对象,只能使用RegExp对象的Execute方法来创建之。与独立的Match对象属性相同,Matches`集合的一个属性是只读的。在执行正则表达式时,可能产生零个或多个Match对象。每个Match对象都提供了与正则表达式匹配的字符串的访问入口、字符串的长度,以及标识匹配位置的索引。
学习了这三个对象和集合,如何应用于字符串的判断和替换呢?regExp对象的三个方法正好解决了这个问题,它们是Replace方法、Test方法和Execute方法。
1、Replace方法
替换在正则表达式查找中找到的文本。我们还是先看个例子:下面的例子说明了Replace方法的用法。
<%
FunctionReplaceTest(patrn,replStr)
?DimregEx,str1??????????????????'建立变量。
?str1="Thequickbrownfoxjumpedoverthelazydog."
?SetregEx=NewRegExp???????????'建立正则表达式。
?regEx.Pattern=patrn??????????????'设置模式。
?regEx.IgnoreCase=True???????????'设置是否区分大小写。
?ReplaceTest=regEx.Replace(str1,replStr)??'作替换。
EndFunction
Response.writeReplaceTest("fox","cat")&"<BR>"??????'将'fox'替换为'cat'。
Response.writeReplaceTest("(S+)(s+)(S+)","$3$2$1")????'交换词对.
%>
2、Test方法
对指定的字符串执行一个正则表达式搜索,并返回一个Boolean值指示是否找到匹配的模式。正则表达式搜索的实际模式是通过RegExp对象的Pattern属性来设置的。RegExp.Global属性对Test方法没有影响。
如果找到了匹配的模式,Test方法返回True;否则返回False。下面的代码说明了Test方法的用法。
<%
FunctionRegExpTest(patrn,strng)
?DimregEx,retVal????????'建立变量。
?SetregEx=NewRegExp????'建立正则表达式。
?regEx.Pattern=patrn????????'设置模式。
?regEx.IgnoreCase=False????'设置是否区分大小写。
?retVal=regEx.Test(strng)????'执行搜索测试。
?IfretValThen
??RegExpTest="找到一个或多个匹配。"
?Else
??RegExpTest="未找到匹配。"
?EndIf
EndFunction
Response.writeRegExpTest("is.","IS1is2IS3is4")
%>
3、Execute方法
对指定的字符串执行正则表达式搜索。正则表达式搜索的设计模式是通过RegExp对象的Pattern来设置的。
Execute方法返回一个Matches集合,其中包含了在string中找到的每一个匹配的Match对象。如果未找到匹配,Execute将返回空的Matches集合。
三、javascript中正则表达式的使用
在javascript1.2版以后,javascript也支持正则表达式。
1、replace
replace在一个字符串中通过正则表达式查找替换相应的内容。replace并不改变原来的字符串,只是重新生成了一个新的字符串。如果需要执行全局查找或忽略大小写,那么在正则表达式的最后添加g和i。
例:
<SCRIPT>
re=/apples/gi;
str="Applesareround,andapplesarejuicy.";
newstr=str.replace(re,"oranges");
document.write(newstr)
</SCRIPT>
结果是:"orangesareround,andorangesarejuicy."
例:
<SCRIPT>
str="TwasthenightbeforeXmas...";
newstr=str.replace(/xmas/i,"Christmas");
document.write(newstr)
</SCRIPT>
结果是:"TwasthenightbeforeChristmas..."
例:
<SCRIPT>
re=/(w+)s(w+)/;str="JohnSmith";
newstr=str.replace(re,"$2,$1");
document.write(newstr)
</SCRIPT>
结果是:"Smith,John".
2、search
??search通过正则表达式查找相应的字符串,只是判断有无匹配的字符串。如果查找成功,search返回匹配串的位置,否则返回-1。
search(regexp)
<SCRIPT>
functiontestinput(re,str){
?if(str.search(re)!=-1)
???midstring="contains";
?else
???midstring="doesnotcontain";
?document.write(str+midstring+re.source);
}
testinput(/^[1-9]/i,"123")
</SCRIPT>
3、match
match方法执行全局查找,查找结果存放在一个数组里。
例一:
<SCRIPT>
str="Formoreinformation,seeChapter3.4.5.1";
re=/(chapterd+(.d)*)/i;
found=str.match(re);
document.write(found);
</SCRIPT>
显示结果:Chapter3.4.5.1,Chapter3.4.5.1,.1
例二:
<SCRIPT>
str="abcDdcba";
newArray=str.match(/d/gi);
document.write(newArray);
</SCRIPT>
显示结果D,d.
四、示例
1、判断数字的正确性
<%@Language=VBScript%>
<scriptlanguage="javascript"runat="server">
???functionisNumeric(strNumber){
???????return(strNumber.search(/^(-|+)?d+(.d+)?$/)!=-1);
???}
???functionisUnsignedNumeric(strNumber){
???????return(strNumber.search(/^d+(.d+)?$/)!=-1);
???}
???functionisInteger(strInteger){
???????return(strInteger.search(/^(-|+)?d+$/)!=-1);
???}
???functionisUnsignedInteger(strInteger){
???????return(strInteger.search(/^d+$/)!=-1);
???}
</script>
<HTML>
???<BODY>
???????<b>判断数字的正确性</b>
<%
DimstrTemp
strTemp=CStr(Request.Form("inputstring"))
IfstrTemp=""ThenstrTemp="0"
%>
<TABLEBORDER="1"CELLPADDING="4"CELLSPACING="2">
???<TR>
???????<TDALIGN="right"><B>原始字符串</B></TD>
???????<TD><%=strTemp%></TD>
???</TR>
???<TR>
???????<TDALIGN="right"><B>数字</B></TD>
???????<TD><%=isNumeric(strTemp)%></TD>
???</TR>
???<TR>
???????<TDALIGN="right"><B>非负数字</B></TD>
???????<TD><%=isUnsignedNumeric(strTemp)%></TD>
???</TR>
???<TR>
???????<TDALIGN="right"><B>整数</B></TD>
???????<TD><%=isInteger(strTemp)%></TD>
???</TR>
???<TR>
???????<TDALIGN="right"><B>非负整数()</B></TD>
???????<TD><%=isUnsignedInteger(strTemp)%></TD>
???</TR>
</TABLE>
<FORMACTION="<%=Request.ServerVariables("SCRIPT_NAME")%>"METHOD="post">
???请输入一个数字:<BR>
???<INPUTTYPE="text"NAME="inputstring"SIZE="50"></INPUT><BR>
???<INPUTTYPE="submit"value="提交"></INPUT><BR>
</FORM>
</BODY>
</HTML>
2、判断Email地址的正确性
<%
Functionisemail(strng)
???isemail=false
???DimregEx,Match
???SetregEx=NewRegExp
???regEx.Pattern="^w+((-w+)|(.w+))*@[A-Za-z0-9]+((.|-)[A-Za-z0-9]+)*.[A-Za-z0-9]+$"
???regEx.IgnoreCase=True
???SetMatch=regEx.Execute(strng)
ifmatch.countthenisemail=true
EndFunction
%>
五、总结
上面我们介绍了正则表达式的基本概念,以及在VBScript和javascript中如何使用正则表达式,同时,通过一些实例让大家有了感性的认识。正则表达式的应用范围很广,能为大家解决很多实际中的问题。本文介绍的内容只是一些初步的知识,还有很多语法规则需要大家继续学习,在实践中发现问题,解决问题。