首页 > 开发 > PHP > 正文

PHP之正则表达式捕获组与非捕获组(详解)

2024-05-04 22:35:34
字体:
来源:转载
供稿:网友

在项目开发过程中正则表示经常会用到,可以说会正则表达式是每个程序员最基本的要求,初学者在刚接触正则表达式都感到很吃力。最近看到一位朋友的博客写的《PHP正则表达式》获益颇多,在章节对通配符以及捕获数据非常感兴趣。这两章节刚好也涉及到了正则表达式的捕获组和非捕获组的内容,以此来分析这方面的内容

  我们知道,在正则表达式下(x) 表示匹配'x'并记录匹配的值。这只是比较通俗的说法,甚至说这是不严谨的说法,只有()捕获组形式才会记录匹配的值。非捕获组则只匹配,不记录。

  捕获组:

  (pattern)

这种形式是我们见到最多的一种形式,匹配并返回捕获结果,可以嵌套,组号顺序从左到右依次排列‘。

代码如下:
$regex = '/(ab(c)+)+d(e)?/';   
$str = 'abccde';
$matches = array();
 
if(preg_match($regex, $str, $matches)){
    print_r($matches);
}

  匹配结果:

代码如下:
Array ( [0] => abccde [1] => abcc [2] => c [3] => e )
  (?P<name>pattern)

这种方式虽然看起来在构造正则表达式的时候略微复杂一点,但实质上与(pattern)一样。最大的优势体现在对结果处理上,程序员可以直接根据自己设置的<name>直接快速调用结果,而不用再去数需要的结果在第几个子组了。


代码如下:
$regex = '/(?P<group1>/w(?P<group2>/w))abc(?P<group3>/w)45/';

$str = 'fsabcd45';
$matches = array();
 
if(preg_match($regex, $str, $matches)){
    print_r($matches);
}
 
  匹配结果:

代码如下:
Array ( [0] => fsabcd45 [group1] => fs [1] => fs [group2] => s [2] => s [group3] => d [3] => d )
  /num

num是一个整数,是对捕获组的反向引用。  例如/2表示第二个子组匹配值,/表示第一个子组匹配值


代码如下:
$regex = '/(/w)(/w)/2/1/';   
$str = 'abba';
$matches = array();
 
if(preg_match($regex, $str, $matches)){
    print_r($matches);
}

  匹配结果:

代码如下:
Array ( [0] => abba [1] => a [2] => b )

注意,这里我疏忽了一个小细节,一开始我第一样代码是 $regex = “/(/w)(/w)/2/1/”;  结果返回无匹配结果,经过调试后,发现这里只能用' '。'与" 用法差别大家还是需要注意下。

  /k< name >


  了解了(?P<name>pattern)与/num,这个就不难理解了。/k< name >是对命名捕获组的反向引用。其中 name 是捕获组名。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表