本部分主要承接上篇(),继续总结正则表达式的获取控制部分。
获取控制
正则表达式元字符是包含特殊含义的字符。它们有一些特殊功能,可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。
字符类:单个字符和数字
元字符/元符号 | 匹配情况 |
. | 匹配除换行符外的任意字符 |
[a-z0-9] | 匹配括号中的字符集中的任意字符 |
[^a-z0-9] | 匹配任意不在括号中的字符集中的字符 |
\d | 匹配数字 |
\D | 匹配非数字,同[^0-9]相同(\d的反义) |
\w | 匹配字母和数字及_中任意一个字符 |
\W | 匹配非字母和数字及_中任意一个字符(\w的反 义) |
字符类:空白字符
元字符/元符号 | 匹配情况 |
\0 | 匹配null字符 |
\b | 匹配空格字符 |
\f | 匹配进纸字符 |
\n | 匹配换行符 |
\r | 匹配回车字符 |
\t | 匹配制表符 |
\s | 匹配空白字符、空格、制表符和换行符 |
\S | 匹配非空白字符 |
字符类:锚字符
元字符/元符号 | 匹配情况 |
^ | 行首匹配(从最开头开始匹配) |
$ | 行尾匹配 |
\A | 只有匹配字符串开始处 |
\b | 匹配单词边界,词在[]内时无效 |
\B | 匹配非单词边界 |
\G | 匹配当前搜索的开始位置 |
\Z | 匹配字符串结束处或行尾 |
\z | 只匹配字符串结束处 |
字符类:重复字符
元字符/元符号 | 匹配情况 |
x? | 匹配0个或1个x |
x* | 匹配0个或任意多个x |
x+ | 匹配至少一个x |
(xyz)+ | 匹配至少一个(xyz) |
x{m,n} | 匹配最少m个、最多n个x(注:{m}表示必须m个;{m,}表示m个或m个以上) |
字符类:替代字符
元字符/元符号 | 匹配情况 |
this|where|logo | 匹配this或where或logo中任意一个 |
字符类:记录字符
元字符/元符号 | 匹配情况 |
(string) | 用于反向引用的分组 |
\1或$1 | 匹配第一个分组中的内容 |
\2或$2 | 匹配第二个分组中的内容 |
\3或$3 | 匹配第三个分组中的内容 |
/*使用点元字符*/
var pattern = /g..gle/; //.匹配一个任意字符
var str = 'google';
alert(pattern.test(str));
/*重复匹配*/
var pattern = /g.*gle/; //.匹配0个一个或多个
var str = 'google'; //*,?,+,{n,m}
alert(pattern.test(str));
/*使用字符类匹配*/
var pattern = /g[a-zA-Z_]*gle/; //[a-z]*表示任意个a-z中的字符
var str = 'google';
alert(pattern.test(str));
var pattern = /g[^0-9]*gle/; //[^0-9]*表示任意个非0-9的字符
var str = 'google';
alert(pattern.test(str));
var pattern = /[a-z][A-Z]+/; //[A-Z]+表示A-Z一次或多次
var str = 'gOOGLE';
alert(pattern.test(str));
/*使用元符号匹配*/
var pattern = /g\w*gle/; //\w*匹配任意多个所有字母数字_
var str = 'google';
alert(pattern.test(str));
var pattern = /google\d*/; //\d*匹配任意多个数字
var str = 'google444';
alert(pattern.test(str));
var pattern = /\D{7,}/; //\D{7,}匹配至少7个非数字
var str = 'google8';
alert(pattern.test(str));
/*使用锚元字符匹配*/
var pattern = /^google$/; //^从开头匹配,$从结尾开始匹配,开头结尾必须都是google
var str = 'google';
alert(pattern.test(str));
var pattern = /goo\sgle/; //\s可以匹配到空格
var str = 'goo gle';
alert(pattern.test(str)); //true
var pattern = /google\b/; //\b可以匹配是否到了边界
var str = 'google';
alert(pattern.test(str));
/*使用或模式匹配*/
var pattern = /google|baidu|bing/; //匹配三种其中一种字符串
var str = 'google';
alert(pattern.test(str)); //true
/*使用分组模式匹配*/
var pattern = /(google){4,8}/; //匹配分组里的字符串4-8次(分组相当于一个字符)
var str = 'googlegoogle';
alert(pattern.test(str)); //false
var pattern = /8(.*)8/; //获取8..8之间的任意字符
var str = 'This is 8google8';
str.match(pattern);
alert(RegExp.$1); //得到第一个分组里的字符串内容(前提是运行一下),这儿是:google
var pattern = /8(.*)8/;
var str = 'This is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>'); //得到替换的字符串输出
document.write(result);
var pattern = /(.*)\s(.*)/;
var str = 'google baidu';
var result = str.replace(pattern, '$2 $1'); //将两个分组的值替换输出
document.write(result); //baidu google
贪婪问题:
贪 婪 | 惰 性 |
+ | +? |
? | ?? |
* | *? |
{n} | {n}? |
{n,} | {n,}? |
{n,m} | {n,m}? |
/*关于贪婪和惰性*/
var pattern = /[a-z]+?/; //?号关闭了贪婪匹配,只替换了第一个,否则用贪婪下面的都会变为xxx。。。。。
var str = 'abcdefjhijklmnopqrstuvwxyz';
var result = str.replace(pattern, 'xxx');
alert(result);
//禁止了贪婪,开启的全局(下面三段代码好好理解!)
var pattern = /8(.*)8/; //使用了贪婪
var str = '8google8 8google8 8google8'; //匹配到了google8 8google8 8google
document.write(str.replace(pattern, '<strong>$1</strong>')); //结果:<strong>google8 8google8 8google</strong>
var pattern = /8(.*?)8/g; //使用了惰性,开启全局
var str = '8google8 8google8 8google8';
document.write(str.replace(pattern, '<strong>$1</strong>'));
//这次结果正确了
//<strong>google</strong>
//<strong>google</strong>
//<strong>google</strong>
var pattern = /8([^8]*)8/g; //另一种禁止贪婪(屏蔽掉8)
var str = 'This is 8google8, That is 8google8, There is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>');
document.write(result);
/*使用exec返回数组*/
var pattern = /^[a-z]+\s[0-9]{4}$/i;
var str = 'google 2012';
alert(pattern.exec(str)); //返回整个字符串
var pattern = /^[a-z]+/i; //只匹配字母
var str = 'google 2012';
alert(pattern.exec(str)); //返回google
var pattern = /^([a-z]+)\s([0-9]{4})$/; //使用了分组
var str = 'google 2012';
var a = pattern.exec(str);
//alert(a.length); //3
//alert(a[0]); //a[0],返回匹配到的整个字符串google 2012
//alert(a[1]); //a[1],返回匹配到的第一个分组的字符串google
//alert(a[2]); //a[2],返回匹配到的第二个分组的字符串2012
var pattern = /(\d+)([a-z])/; //这个叫做捕获性分组,所有的分组都捕获返回
var str = '123abc';
var a = pattern.exec(str);
//a[0]返回123a
//a[1]返回123
//a[2]返回a
var pattern = /(\d+)(?:[a-z])/; //非捕获性分组,只要在不需要捕获返回的分组加上?:
var str = '123abc';
alert(pattern.exec(str));
/*使用分组嵌套*/
var pattern = /(a?(b?(c?)))/; //嵌套分组,从外往内获取
var str = 'abc';
alert(pattern.exec(str));
//第一步:a[0],整个匹配到的字符串abc
//第二步:a[1],匹配第一个分组(a?(b?(c?))), abc
//第三步:a[2],匹配第二个分组(b?(c?), bc
//第三步:a[3],匹配第三个分组(c?), c
/*使用前瞻捕获*/
var pattern = /(goo(?=gle))/; //goo后面必须跟着gle才能捕获goo
var str = 'google';
alert(pattern.exec(str)); //注意这儿返回的是goo
/*使用特殊字符匹配*/
var pattern = /\.\[\/b\]/; //特殊字符,用\符号转义即可
var str = '.[/b]';
alert(pattern.test(str));
/*使用换行模式*/
var pattern = /^\d+/mg; //启用了换行模式
var str = '1.baidu\n2.google\n3.bing';
var result = str.replace(pattern, '#');
alert(result);
For my lover, CC !
Thank you, Mr Lee !