正则表达式详解
正则表达式,又称正规表示法、常规表示法(英语:RegularExpression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
正则表达式可以干嘛?
1、数据有效性验证,可以对一个字符串进行测试,看该字符串是否符合某种规定。
2、替换文本,可以在文档中将指定的文字删除,或替换为其他文字。
3、根据字符串提取一个子字符串,用来在文本或输入字段中查找特定文字。
正则表达式语法
一个正则表达式是由普通字符(a-z)和特殊字符(元字符)组成的文字模式,该模式作为一个模版,将某个字符模式与所搜索的字符串进行匹配。
元字符
具有特殊意义的专用字符。
基本元字符
. 匹配除换行以外的任意字符,例如正则表达式r.t能够匹配“rat、rut、rt”,但是不能匹配root
[]匹配匹配一个出现在[]中的字符
| 或敏感词ab|cd|ed|df
()提高优先级a(bc)实现分组
限定元字符
* 重复零次或多次
+ 重复一次或多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或多次
{n,m}重复n到m次
首尾元字符
^匹配字符串开始例如正则表达式^when能够匹配到”wheninthe“的开始,但不能匹配到”whatandwheninthe“
$匹配字符串结束例如正则表达式food$能够匹配到“he's food”的末尾
简写形式
\b单词的开始或结束
\d匹配0-9的数字 \D非数字
\s任意的空白符包括tab和换行符\S大写非空白之外的所有字符
\w匹配字母、数字或下划线\W非字母、数字下划线
转义字符
如果想查找元字符本身的话,比如想查找.或者*就会出现问题,因为会解释成其他意思。这时就需要使用\来取消这些字符的特殊意义。
因此需要使用\.\*查找\本身应该写\\
在javascript中使用正则表达式
创建正则表达式
//字面值 varreg=/\d+/; //构造函数 varregx=newRegExp(\\d+);
匹配
if(reg.test("45646515")) { alert("OK"); } if(regx.test("sd")) { alert("ok") }
提取
varstr="853020304@qq.com"; varreg=/([a-zA-Z0-9]+)@([a-zA-Z0-9]+(\.[a-zA-Z0-9]+)+)/; varmatch=reg.exec(str); alert(match[0]);//853020304@qq.com匹配到的对象 alert(match[1]);//853020304[1][2]分别是各个组 alert(match[2]);//qq.com alert(match[3]);//.com
循环提取
varstr="12345"; varr=/\d\d/g;//gglobal全局匹配 varm=r.exec(str);//12 alert(m); m=r.exec(str);//34 alert(m); m=r.exec(str);//null没有了返回null alert(m); vararr=[]; varm=null; while((m=r.exec(str))!=null)//如果不等于null继续循环 { arr.push(m);//添加到数组 } alert(arr.length);//[0]=12[1]=34
替换
stringstr=<string>.replace(正则表达式或字符串,替换为某字符串); varstr="ab--c--d--e--f-g"; varresult=str.replace(/-+/g,',');//如果不写g则只替换第一个 alert(result);//ab,c,d,e,f,g vardate="2015年8月24日"; varresult=date.replace(/(\d+)年(\d+)月(\d+)日/,"$1-$2-$3"); alert(result);//2015-8-24
在c#中使用正则表达式
varregx="^[a-zA-Z0-9]{6,20}$"; if(!Regex.IsMatch("abcdef;sd123",regex) { //长度必须6-20,字母和数字 }
常用表达式
匹配身份证:\d{15}|\d{18}
匹配中国邮政编码:[1-9]\d{5}(?!\d)
匹配腾讯QQ号:[1-9][0-9]{4,}
匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配首尾空白字符的正则表达式:^\s*|\s*$
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*?/>
匹配中文字符的正则表达式:[\u4e00-\u9fa5]
限制网页表单里的文本框输入内容
只能输入中文:
<inputtype="text"onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"/>
只能输入数字:
<inputtype="text"onkeyup="value=value.replace(/[^\d]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"/>
只能输入数字和英文:
<inputtype="text"onkeyup="value=value.replace(/[\W]/g,'')"onbeforepaste="clipboardData.setData('text',clipboardData.getData('text).replace(/[^\d]/g,''))"/>
以上内容就是本文对正则表达式做的详解,希望大家喜欢