正则表达式匹配非需要匹配的字符串(标题自己都绕晕了)--688IT编程网

正则表达式匹配⾮需要匹配的字符串（标题⾃⼰都绕晕了）

经常我们会遇到想出不包含某个字符串的⽂本，程序员最容易想到的是在正则表达式⾥使⽤，^(hede)来过滤”hede”字串，但这种写法是错误的。我们可以这样写：[^hede]，但这样的正则表达式完全是另外⼀个意思，它的意思是字符串⾥不能包含‘h'，‘e'，‘d'三个但字符。那什么样的正则表达式能过滤出不包含完整“hello”字串的信息呢？

事实上，说正则表达式⾥不⽀持逆向匹配并不是百分之百的正确。就像这个问题，我们就可以使⽤否定式查来模拟出逆向匹配，从⽽解决我们的问题：

复制代码代码如下:

^((?!hede).)*$

上⾯这个表达式就能过滤出不包含‘hede'字串的信息。我上⾯也说了，这种写法并不是正则表达式“擅长”的⽤法，但它是可以这样⽤的。

解释

⼀个字符串是由n个字符组成的。在每个字符之前和之后，都有⼀个空字符。这样，⼀个由n个字符组成的字符串就有n+1个空字符串。我们来看⼀下“ABhedeCD”这个字符串：

所有的e编号的位置都是空字符。表达式(?!hede).会往前查，看看前⾯是不是没有“hede”字串，如果没有(是其它字符)，那么.(点号)就会匹配这些其它字符。这种正则表达式的“查”也叫做“zero-width-assertions”(零宽度断⾔)，因为它不会捕获任何的字符，只是判断。

在上⾯的例⼦⾥，每个空字符都会检查其前⾯的字符串是否不是‘hede'，如果不是，这.(点号)就是匹配捕捉这个字符。表达式(?!hede).只执⾏⼀次，所以，我们将这个表达式⽤括号包裹成组(group)，然后⽤*(星号)修饰——匹配0次或多次：

复制代码代码如下:

((?!hede).)*。

你可以理解，正则表达式((?!hede).)*匹配字符串"ABhedeCD"的结果false，因为在e3位置，(?!hede)匹配不合格，它之前有"hede"字符串，也就是包含了指定的字符串。

在正则表达式⾥， ?! 是否定式向前查，它帮我们解决了字符串“不包含”匹配的问题。

以下是⼀些补充：

分享下php⽣成随机数的三种⽅法，⽣成1-10之间的不重复随机数，php⽣成不重复随机数的例⼦，需要的朋友参考下。

在hacker news上看到regex golf，⼏道很有趣的正则表达式的题，有的需要⽤到不匹配这种匹配，⽐如需要匹配不包含某个单词的串。

开始正题之前，先来看看正则表达式的语法：

[abc] a或b或c

. 任意单个字符

a? 零个或⼀个a

[^abc] 任意不是abc的字符

\s 空格

正则表达式任意内容a* 零个或多个a

[a-z] a-z的任意字符

\S ⾮空格

a+ ⼀个或多个a

[a-zA-Z] a-z或A-Z

\d 任意数字

a{n} 正好出现n次a

^ ⼀⾏开头

\D 任意⾮数字

a{n,} ⾄少出现n次a

$ ⼀⾏末尾

\w 任意字母数字或下划线

a{n,m} 出现n-m次a

(...) 括号⽤于分组

\W 任意⾮字母数字或下划线

a*? 零个或多个a(⾮贪婪)

(a|b) a或b

\b 单词边界

(a)...\1 引⽤分组

(?=a) 前⾯有a

(?!a) 前⾯没有a

\B ⾮单词边界

正则表达式中有(?=a)和(?!a)来表⽰我们是否需要匹配某个东西。

所以，有需要不匹配某样内容时，就可以⽤(?!a)了。⽐如要匹配不含hello的字符串就可以这样写。

^(?!.*hello)

这⾥.*⽤来表⽰hello之前可能有其他的字符，为什么还要加^呢，因为如果不加的话，可能匹配到h之后的这个位置上了。

现在就可以解决regex golf上的abba这道题了。

这道题是去匹配不含abba这种形式的单词，⽐如abba，anallagmatic就不应该匹配上。

正则表达式代码：

^(?!.*(.)(.)\2\1)

然后利⽤不匹配，还可以解决prime这道题，这道题匹配有素数个x的串，先看正则。

^(?!(xx+)\1+$)

(xx+)是匹配2个及2个以上的x，(xx+)\1+就是匹配重复出现2个及以上的串，所以(xx+)\1+就表⽰了那些⾮素数的串，那么素数串就是除去这些⾮素数串，即是以上的正则表达式了。

PS：关于正则，本站还提供了2款⾮常简便实⽤的正则测试⼯具供⼤家使⽤：

688IT编程网

正则表达式匹配非需要匹配的字符串(标题自己都绕晕了)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

正则表达式匹配非需要匹配的字符串(标题自己都绕晕了)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式