正则表达式^+$(){}[]作⽤
.-除换⾏符以外的所有字符。
^-字符串开头。
$ -字符串结尾。
-0次或1次匹配。
*-匹配0次或多次。
+-匹配1次或多次。
{}⼀般是⽤来匹配的长度。
{n}-匹配 n次。
{n,}-匹配 n次以上。正则表达式提取中文
{m,n}-最少 m 次,最多 n 次匹配。
()-为了提取匹配字符串的,表达式中有⼏个()就有⼏个相应的匹配字符串.可以理解为数学计算中的()
[]是定义匹配的字符范围。⽐如[a-zA-Z0-9]表⽰相应位置的字符要匹配英⽂字符和数字。
以哈。哈。哈。哈。哈。这种⼀个中⽂⼀个标点,且以中⽂结束的格式为例。
1. 中⽂字符是“[\u4e00-\u9fa5]”
2. 标点符号可以以[-,.?:;’"!`,。?:;‘’!/]这种⽅式匹配,将需要匹配的符号写进[]即可。
3. 将需要匹配的格式拆分为n个(中⽂+符号) + ⼀个中⽂。
4. [\u4e00-\u9fa5][-,.?:;’"!`,。?:;‘’!/]可以匹配"哈。" 这种模式。
5. ([\u4e00-\u9fa5][-,.?:;’"!`,。?:;‘’!/])+ 匹配n个"哈。"
6. (([\u4e00-\u9fa5][-,.?:;’"!`,。?:;‘’!/])+)[\u4e00-\u9fa5]匹配"哈。哈。哈。哈。哈。"
7. 需要注意我们只想匹配"哈。“这种模式,⽽不是"哈哈哈哈。”
8. 此时需要⽤到^与$ 两个符号,所以最终的结果为:
((^[\u4e00-\u9fa5]$[-,.?:;'"!`,。?:;‘’!\/])+)[\u4e00-\u9fa5]
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论