正则表达式之捕获组非捕获组介绍--688IT编程网

正则表达式之捕获组⾮捕获组介绍

捕获组

语法：

字符描述⽰例(pattern)匹配pattern并捕获结果，⾃动设置组号。 (abc)+d

匹配abcd或者abcabcd (?<name>pattern)

或

(?'name'pattern)

匹配pattern并捕获结果，设置name为组名。

\num对捕获组的反向引⽤。其中 num 是⼀个正整数。(\w)(\w)\2\1

匹配abba

\k< name >或

\k' name '对命名捕获组的反向引⽤。其中 name 是捕获组名。(?<group>\w)abc\k<group>

匹配xabcx

使⽤⼩括号指定⼀个⼦表达式后，匹配这个⼦表达式的⽂本(也就是此分组捕获的内容)可以在表达式或其它程序中作进⼀步的处理。默认情况下，每个捕获组会⾃动拥有⼀个组号，规则是：从左向右，以分组的左括号为标志，第⼀个出现的分组的组号为1，第⼆个为2，以此类推。

例如：

(\d{4})-(\d{2}-(\d{2}))

1 1

3 32

以下是⽤程序处理捕获组的⽰例，对⼀个Url地址进⾏解析，并显⽰所有捕获组。

可以看到按顺序设置的捕获组号。

Regex.Match⽅法

复制代码代码如下:

using System.Text.RegularExpressions;

namespace Wuhong.Test

正则匹配哈希值{

class Program

{

static void Main(string[] args)

{

//⽬标字符串

string source = "reg-test-server:8080/download/file1.html# ";

/正则式

string regex = @"(\w+):\/\/([^/:]+)(:\d+)?([^# :]*)";

Regex regUrl = new Regex(regex);

//匹配正则表达式

Match m = regUrl.Match(source);

Console.WriteLine(m.Success);

if (m.Success)

{

//捕获组存放在Match.Groups集合中，索引值从1开始，索引0处为匹配的整个字符串值

//按“组号 : 捕获内容”的格式显⽰

for (int i = 0; i < m.Groups.Count; i++)

{

Console.WriteLine(string.Format("{0} : {1}", i, m.Groups[i]));

}

Console.ReadLine();

}

也可以⾃⼰指定⼦表达式的组名。这样在表达式或程序中可以直接引⽤组名，当然也可以继续使⽤组号。但如果正则表达式中同时存在普通捕获组和命名捕获组，那么捕获组的编号就要特别注意，编号的规则是先对普通捕获组进⾏编号，再对命名捕获组进⾏编号。

例如：

(\d{4})-(?<date>\d{2}-(\d{2}))

1 1 3

2 23

下⾯在程序中处理命名捕获组，显⽰混合规则⽣成的组号，并利⽤捕获组的内容对源字符串进⾏替换。

可以看到先对普通捕获组进⾏编号，再对命名捕获组编号。

Regex.Replace⽅法

复制代码代码如下:

using System.Text.RegularExpressions;

namespace Wuhong.Test

{

class Program

{

static void Main(string[] args)

{

//⽬标字符串

string source = "reg-test-server:8080/download/file1.html# ";

//正则式，对其中两个分组命名

string regex = @"(\w+):\/\/(?<server>[^/:]+)(?<port>:\d+)?([^# :]*)";

Regex regUrl = new Regex(regex);

//匹配正则表达式

Match m = regUrl.Match(source);

Console.WriteLine(m.Success);

if (m.Success)

{

//捕获组存放在Match.Groups集合中，索引值从1开始，索引0处为匹配的整个字符串值

//按“组号 : 捕获内容”的格式显⽰

for (int i = 0; i < m.Groups.Count; i++)

{

Console.WriteLine(string.Format("{0} : {1}", i, m.Groups[i]));

}

//替换字符串

//“$组号”引⽤捕获组的内容。

/需要特别注意的是“$组号”后不能跟数字形式的字符串，如果出现此情况，需要使⽤命名捕获组，引⽤格式“${组名}”

string replacement = string.Format("$1://{0}{1}$2", "new-reg-test-server", "");

string result = regUrl.Replace(source, replacement);

Console.WriteLine(result);

Console.ReadLine();

}

语法：

字符描述⽰例

(?:pattern)匹配pattern，但不捕获匹配结果。'industr(?:y|ies)

匹配'industry'或'industries'。

(?=pattern)零宽度正向预查，不捕获匹配结果。'Windows (?=95|98|NT|2000)'

匹配 "Windows2000" 中的 "Windows"

不匹配 "Windows3.1" 中的 "Windows"。

(?!pattern)零宽度负向预查，不捕获匹配结果。'Windows (?!95|98|NT|2000)'

匹配 "Windows3.1" 中的 "Windows"

不匹配 "Windows2000" 中的 "Windows"。

(?<=pattern)零宽度正向回查，不捕获匹配结果。'2000 (?<=Office|Word|Excel)'

匹配 " Office2000" 中的 "2000"

不匹配 "Windows2000" 中的 "2000"。

(?<!pattern)零宽度负向回查，不捕获匹配结果。'2000 (?<!Office|Word|Excel)'

匹配 " Windows2000" 中的 "2000"

不匹配 " Office2000" 中的 "2000"。

⾮捕获组只匹配结果，但不捕获结果，也不会分配组号，当然也不能在表达式和程序中做进⼀步处理。

⾸先(?:pattern)与(pattern)不同之处只是在于不捕获结果。

接下来的四个⾮捕获组⽤于匹配pattern（或者不匹配pattern）位置之前（或之后）的内容。匹配的结果不包括pattern。

例如：

(?<=<(\w+)>).*(?=<\/\1>)匹配不包含属性的简单HTML标签内的内容。如：<div>hello</div>之中的hello，匹配结果不包括前缀<div>和后缀</div>。

下⾯是程序中⾮捕获组的⽰例，⽤来提取邮编。

可以看到反向回查和反向预查都没有被捕获。

Regex.Matches⽅法

复制代码代码如下:

using System.Text.RegularExpressions;

namespace Wuhong.Test

{

class Program

{

static void Main(string[] args)

{

//⽬标字符串

string source = "有6组数字：010001，100，21000，310000，4100011，510002，把邮编挑出来。";

//正则式

string regex = @"(?<!\d)([1-9]\d{5})(?!\d)";

Regex regUrl = new Regex(regex);

//获取所有匹配

MatchCollection mList = regUrl.Matches(source);

for (int j = 0; j < mList.Count; j++)

{

//显⽰每个分组，可以看到每个分组都只有组号为1的项，反向回查和反向预查没有被捕获

for (int i = 0; i < mList[j].Groups.Count; i++)

{

Console.WriteLine(string.Format("{0} : {1} : {2}", j, i, mList[j].Groups[i]));

}

Console.ReadLine();

}

注释

语法：

字符描述⽰例

(?#comment)comment是注释，不对正则表达式的处

2[0-4]\d(?#200-249)|25[0-5](?#250-255)|1?\d\d?(?#0-199)理产⽣任何影响

匹配0-255的整数

这个不解释了。

688IT编程网

正则表达式之捕获组非捕获组介绍

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

正则表达式之捕获组非捕获组介绍

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式