首页 > 编程 > .NET > 正文

.NET正则表达式使用高级技巧之组的概念

2024-07-10 13:11:30
字体:
来源:转载
供稿:网友

最大的网站源码资源下载站,

  正则表达式中的组是很重要的一个概念,它是我们通向高级正则应用的的桥梁。

  组的概念

  一个正则表达式匹配结果可以分成多个部分,这就是组(group)的目的。能够灵活的使用组后,你会发现regex真是很方便,也很强大。

  先举个例子

public static void main()
{
 string s = "2005-2-21";
 regex reg = new regex(@"(?<y>/d{4})-(?<m>/d{1,2})-(?<d>/d{1,2})",regexoptions.compiled);
 match match = reg.match(s);
 int year = int.parse(match.groups["y"].value);
 int month = int.parse(match.groups["m"].value);
 int day = int .parse(match.groups["d"].value);
 datetime time = new datetime(year,month,day);
 console.writeline(time);
 console.readline();
}

  以上的例子通过组来实现分析一个字符串,并把其转化为一个datetime实例,当然,这个功能用datetime.parse方法就能很方便的实现。

  在这个例子中,我把一次match结果用(?<name>)的方式分成三个组"y","m","d"分别代表年、月、日。

  现在我们已经有了组的概念了,再来看如何分组,很简单的,除了上在的办法,我们可以用一对括号就定义出一个组,比如上例可以改成:

public static void main()
{
 string s = "2005-2-21";
 regex reg = new regex(@"(/d{4})-(/d{1,2})-(/d{1,2})",regexoptions.compiled);
 match match = reg.match(s);
 int year = int.parse(match.groups[1].value);
 int month = int.parse(match.groups[2].value);
 int day = int .parse(match.groups[3].value);
 datetime time = new datetime(year,month,day);
 console.writeline(time);
 console.readline();
}

  从上例可以看出,第一个括号对包涵的组被自动编号为1,后面的括号依次编号为2、3……

public static void main()
{
 string s = "2005-2-21";
 regex reg = new regex(@"(?<2>/d{4})-(?<1>/d{1,2})-(?<3>/d{1,2})",regexoptions.compiled);
 match match = reg.match(s);
 int year = int.parse(match.groups[2].value);
 int month = int.parse(match.groups[1].value);
 int day = int .parse(match.groups[3].value);
 datetime time = new datetime(year,month,day);
 console.writeline(time);
 console.readline();
}

  再看上例,我们用(?<数字>)的方式手工给每个括号对的组编号,(注意我定义1和2的位置时不是从左到右定义的)

  通过以上三例,我们知道了给regex定义group的三种办法以及相应的引用组匹配结果的方式。

  然后,关于组定义,还有两点请注意:

  1、因为括号用于定义组了,所以如果要匹配"("和")",请使用"/("和"/)"(关于所有特殊字符的定义,请查看相关regex expression帮助文档)。

  2、如果定义regex时,使用了explicitcapture选项,则第二个例子不会成功,因为此选项要求显式定义了编号或名字的组才捕获并保存结果,如果你没有定义explicitcapture选项,而有时又定义了类式于(a|b)这样的部分在表达式,而这个(a|b)你又并不想捕获结果,那么可以使用“不捕获的组”语法,即定义成(?:)的方式,针对于(a|b),你可以这样来定义以达到不捕获并保存它到group集合中的目的--(?:a|b)。
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表