首页 > 网站 > WEB开发 > 正文

正则表达式

2024-04-27 15:12:33
字体:
来源:转载
供稿:网友

2016.12.8

正则表达式:

一、行定位符(^和)“”表示行的开始;“”表示行的结尾

二、单词定界符(/b、/B)

  单词分界符/b,表示要查找的字串为一个完整的单词。如:/btm/b

  还有一个大写的/B,意思和/b相反。它匹配的字串不能是一个完整的单词,而是其他单词或字串的一部分。如:/Btm/B

三、字符类([ ])

  正则表达式是区分大小写的,如果要忽略大小写可使用方括号表达式“[]”。只要匹配的字符出现在方括号内,即可表示匹配成功。 但要注意:一个方括号只能匹配一个字符。例如,要匹配的字串tm不区分大小写,那么该表达式应该写作如下格式:[Tt][Mm]

四、选择字符(|) 该字符可以理解为“或”,如上例也可以写成 (T|t)(M|m),该表达式的意思是以字母T或t开头,后面接一个字母M或m。

  使用“[]”和使用“|”的区别在于“[]”只能匹配单个字符,而“|”可以匹配任意长度的字串。如果不怕麻烦,上例还可以写为 :TM|tm|Tm|tM

五、连字符(-)

连字符可以表示字符的范围。 [a,b,c,d…A,B,C,D…] 可以写成 :[a-zA-Z]以写成 :[a-zA-Z]。

六、排除字符([^])

  正则表达式提供了“^”字符匹配不符合命名规则的变量。这个元字符在前面出现过,表示行的开始。而这里将会放到方括号中,表示排除的意思。

  例如:[^a-zA-Z],该表达式匹配的就是不以字母和下划线开头的变量名。

七、限定符(? * + {n,m})

八、点号字符(.)

  点字符(.)可以匹配出换行符外的任意一个字符。

  注意:是除了换行符外的、任意的一个字符。如匹配以s开头、t结尾、中间包含一个字母的单词。

  格式如下: ^s.t$,匹配的单词包括:sat、set、sit等。

  实例,一个单词第一个字母为r,第3个字母为s,最后一个字母为t。能匹配该单词的正则表达式为:^r.s.*t$

九、转义字符(/)

  正则表达式中的转移字符(/)是将特殊字符(如“.”、“?”、“/”等)变为普通的字符。 举一个ip地址的实例,用正则表达式匹配诸如127.0.0.1这样格式的IP地址。如果直接使用点字符,格式为:[0-9]{1,3}(.[0-9]{1,3}){3}

  这显然不对,因为“.”可以匹配一个任意字符。这时,不仅是127.0.0.1这样的IP,连127101011这样的字串也会被匹配出来。所以在使用“.”时,需要使用转义字符(/)。修改后上面 的正则表达式格式为: [0-9]{1,3}(.[0-9]{1,3}){3}

十、反斜线(/)   

十一、括号字符(())

  小括号字符的第一个作用就是可以改变限定符的作用范围,如“|”、“*”、“^”等。来看下面的一个表达式。

  (thir|four)th,这个表达式的意思是匹配单词thirth或fourth,如果不使用小括号,那么就变成了匹配单词thir和fourth了。

  小括号的第二个作用是分组,也就是子表达式。如(.[0-9]{1,3}){3},就是对分组(.[0-9]{1,3})进行重复操作。

十二、反向引用

十三、模式修饰符

  模式修饰符的作用是设定模式。也就是规定正则表达式应该如何解释和应用。

十四、基本应用:

校验基本日期格式的javaScript代码:

var reg = /^(/d{1,4})(-|//)(/d{1,2})/2(/d{1,2})$/; var r = fieldValue.match(reg); if(r==null)alert(‘Date format error!’);

1 . 校验密码强度

密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间。

^(?=./d)(?=.[a-z])(?=.*[A-Z]).{8,10}$ 2. 校验中文

字符串仅能是中文。

^[/u4e00-/u9fa5]{0,}$ 3. 由数字、26个英文字母或下划线组成的字符串

^/w+$ 4. 校验E-Mail 地址

同密码一样,下面是E-mail地址合规性的正则检查语句。

[/w!#$%&’+/=?^_{|}~-]+(?://.[//w!#$%&'*+/=?^_{|}~-]+)@(?:/w?/.)+/w? 5. 校验身份证号码

下面是身份证号码的正则校验。15 或 18位。

15位:

^[1-9]/d{7}((0/d)|(1[0-2]))(([0|1|2]/d)|3[0-1])/d{3}$ 18位:

^[1-9]/d{5}[1-9]/d{3}((0/d)|(1[0-2]))(([0|1|2]/d)|3[0-1])/d{3}([0-9]|X)$ 6. 校验日期

“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$ 7. 校验金额

金额校验,精确到2位小数。

^[0-9]+(.[0-9]{2})?$ 8. 校验手机号

下面是国内 13、15、18开头的手机号正则表达式。

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])/d{8}$ 9. 判断IE的版本

IE目前还没被完全取代,很多页面还是需要做版本兼容,下面是IE版本检查的表达式。

^.MSIE 5-8?(?!.*Trident//[5-9]/.0).$ 10. 校验IP-v4地址

IP4 正则语句。

/b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/b 11. 校验IP-v6地址

IP6 正则语句。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])/.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])/.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])) 12. 检查URL的前缀

应用开发中很多时候需要区分请求是HTTPS还是HTTP,通过下面的表达式可以取出一个url的前缀然后再逻辑判断。

if (!s.match(/^[a-zA-Z]+://///)) { s = ‘http://’ + s; } 13. 提取URL链接

下面的这个表达式可以筛选出一段文本中的URL。

^(f|ht){1}(tp|tps):////([/w-]+/.)+[/w-]+(//[/w- ./?%&=]*)? 14. 文件路径及扩展名校验

验证文件路径和扩展名

^([a-zA-Z]/:|//)[^//]+[^//:?”<>|]+/.txt(l)?$ 15. 提取Color Hex Codes

有时需要抽取网页中的颜色代码,可以使用下面的表达式。

/#([a-fA-F]|[0-9]){3,6} 16. 提取网页图片

假若你想提取网页中所有图片信息,可以利用下面的表达式。

/< [img][^/>][src] = [/”/’]{0,1}([^/”/’/ >]*) 17. 提取页面超链接

提取html中的超链接。

(


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表