正则表达式是一种描述字符串结果的语法规则,是一个特定的格式化模式,可以匹配、替换、截取匹配的字符串。常用的语言基本上都有正则表达式,如JavaScript、java等。其实,只有了解一种语言的正则使用,其他语言的正则使用起来,就相对简单些。好了,开始写正则了。
正则表达式在匹配字符串时,遵循以下2个基本原则:
1.最左原则:正则表达式总是从目标字符串的最左侧开始,依次匹配,直到匹配到符合表达式要求的部分,或直到匹配目标字符串的结束。
2.最长原则:对于匹配到的目标字符串,正则表达式总是会匹配到符合正则表达式要求的最长的部分;即贪婪模式
那怎么开始呢,首先从分隔符开始写起,常用包括 / ; #;~,用于表明一串正则的开始。如:‘/a.*a/’。当表达式有过多的转义字符时,建议优先使用#,如url;
$str = 'http://baidu.com';$pattern = '/http:////.*com/';//需要转义/preg_match($pattern,$str,$match);var_dump( $match);
$str = 'http://baidu.com';$pattern = '#http://.*com#';//不需要转义/preg_match($pattern,$str,$match);var_dump( $match);
知道开始和结尾的写法了,接下来就是中间的判断了。正则表达式是自左向右的顺序使用原子和元字符进行拼接。比如'<b>zxcv</b>',进行匹配时,‘/<b>.*<//b>/’,其中.*代表zxcv 。那么通用原子和元字符有哪些呢?
? /d匹配一个数字字符。等价于 [0-9]。
? /D匹配一个非数字字符。等价于 [^0-9]。
? /f匹配一个换页符。等价于 /x0c 和 /cL。
? /n匹配一个换行符。等价于 /x0a 和 /cJ。
? /r匹配一个回车符。等价于 /x0d 和 /cM。
? /s匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ /f/n/r/t/v]。
? /S匹配任何非空白字符。等价于 [^ /f/n/r/t/v]。
? /t匹配一个制表符。等价于 /x09 和 /cI。
? /v匹配一个垂直制表符。等价于 /x0b 和 /cK。
? /w匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
? /W匹配任何非单词字符。等价于 ‘[^A-Za-z0-9_]’。
? /xn匹配 n,其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,’/x41’ 匹配 “A”。’/x041’ 则等价于 ‘/x04’ & “1”。正则表达式中可以使用 ASCII 编码。
? /nm标识一个八进制转义值或一个向后引用。如果 /nm 之前至少有 nm 个获得子表达式,则 nm 为向后引用。如果 /nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的向后引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 ? /nm 将匹配八进制转义值 nm。
? /nml如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八进制转义值 nml。
? /un十六进制数字表示的 Unicode 字符。例如, /u00A9 匹配版权符号(?)。
? . 匹配除 “/n” 之外的任何单个字符
? ^ 匹配输入字符串的开始位置。在字符域[]中表示取反,如'[^/w]'等于'/w';而^/w表示以单词字符开头。
? $ 匹配输入字符串的结束位置。例'/w$'表示以单词字符结尾。
? ? 匹配前面的子表达式零次或一次 等价于 {0,1},例如,"do(es)?" 可以匹配 "do" 或 "does"。
? * 匹配前面的子表达式零次或多次,等价于{0,}。例如,zo* 能匹配 "z" 、 "zo"、'zoo'。
? + 匹配前面的子表达式一次或多次,等价于{1,}例如,'zo+' 能匹配 "zo" 以及 "zoo"。
? {n} n 为非负整数,匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 或‘Booob’,但是能匹配 "food" 中的两个 o。
? {n,} n 为非负整数。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
? {n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。
? [] 字符集合(字符域)。匹配所包含的任意一个字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。
? () 匹配 ()内的内容 并获取这一匹配。搭配/n(n为大于1的整数),‘http://baidu.com’若表达式:‘(/w+) (:)////.*/1’则匹配‘http://baidu.comhttp’,/1表示http。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
新闻热点
疑难解答