Javascript之正则表达式基础

来源:岁月联盟 编辑:exp 时间:2012-10-20

RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。
1、RegExp 对象的创建
直接量语法:
/pattern/attributes
创建 RegExp 对象的语法:
new RegExp(pattern, attributes);
注:
参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。
参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。

返回值:
一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。
如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。

抛出:
SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。
TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。
2、修饰符
i    执行对大小写不敏感的匹配。
g    执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
m    执行多行匹配。
以i为例:
var reg = new RegExp("regexp","i");
或:
var reg = /regexp/i;
3、方括号[]
方括号用于查找某个范围内的字符:
[abc]                  查找方括号之间的任何字符。//var patt1=/[a-h]/g;匹配所有a到h的字符
[^abc]               查找任何不在方括号之间的字符。
[0-9]                  查找任何从 0 至 9 的数字。
[a-z]                  查找任何从小写 a 到小写 z 的字符。
[A-Z]                  查找任何从大写 A 到大写 Z 的字符。
[a-Z]                  查找任何从小写 a 到大写 Z 的字符。
[adgk]                 查找给定集合内的任何字符。
[^adgk]                查找给定集合外的任何字符。
[red|blue|green]       查找任何指定的选项。
4、元字符
元字符(Metacharacter)是拥有特殊含义的字符:
.         查找单个字符,除了换行和行结束符。
/w        查找单词字符。
/W        查找非单词字符。
/d        查找数字。
/D        查找非数字字符。
/s        查找空白字符。
/S        查找非空白字符。
/b        查找位于单词的开头或结尾的匹配。
/B        查找不处在单词的开头或结尾的匹配。
/0        查找 NUL 字符。
/n        查找换行符。
/f        查找换页符。
/r        查找回车符。
/t        查找制表符。
/v        查找垂直制表符。
/xxx      查找以八进制数 xxx 规定的字符。
/xdd      查找以十六进制数 dd 规定的字符。
/uxxxx    查找以十六进制数 xxxx 规定的 Unicode 字符。
5、量词
n+        匹配任何包含至少一个 n 的字符串。
n*        匹配任何包含零个或多个 n 的字符串。
n?        匹配任何包含零个或一个 n 的字符串。
n{X}      匹配包含 X 个 n 的序列的字符串。
n{X,Y}    匹配包含 X 或 Y 个 n 的序列的字符串。
n{X,}     匹配包含至少 X 个 n 的序列的字符串。
n$        匹配任何结尾为 n 的字符串。
^n        匹配任何开头为 n 的字符串。
?=n       匹配任何其后紧接指定字符串 n 的字符串。
?!n       匹配任何其后没有紧接指定字符串 n 的字符串。
6、RegExp 对象属性
global        RegExp 对象是否具有标志 g。
ignoreCase    RegExp 对象是否具有标志 i。
lastIndex     一个整数,标示开始下一次匹配的字符位置。
multiline     RegExp 对象是否具有标志 m。
source        正则表达式的源文本。
7、compile() 方法用于在脚本执行过程中编译正则表达式。
RegExpObject.compile(regexp,modifier)
regexp 正则表达式。
modifier 规定匹配的类型。"g" 用于全局匹配,"i" 用于区分大小写,"gi" 用于全局区分大小写的匹配。
例:
var str="Every man in the world! Every woman on earth!";

patt=/man/g;
str2=str.replace(patt,"person");
document.write(str2+"<br />");

patt=/(wo)?man/g;
patt.compile(patt);
str2=str.replace(patt,"person");
document.write(str2);

输出:
Every person in the world! Every woperson on earth!
Every person in the world! Every person on earth!
8、test() 方法用于检测一个字符串是否匹配某个模式.
RegExpObject.test(string)
string 必需。要检测的字符串。
返回值
如果字符串 string 中含有与 RegExpObject 匹配的文本,则返回 true,否则返回 false。

例:
var str = "Visit W3School";
var patt1 = new RegExp("W3School");

var result = patt1.test(str);

document.write("Result: " + result);

输出:
Result: true

---------支持正则表达式的 String 对象的方法
search   检索与正则表达式相匹配的值。
match    找到一个或多个正则表达式的匹配。
replace  替换与正则表达式匹配的子串。
split    把字符串分割为字符串数组。