java匹配中⽂汉字的正则表达式正则表达式匹配中⽂先要了解中⽂的编码
代码如下复制代码
[u4E00-u9FA5]汉字?[uFE30-uFFA0]全⾓字符
[u4E00-u9FA5]汉字?[uFE30-uFFA0]全⾓字符
匹配中⽂字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
应⽤:计算字符串的长度(⼀个双字节字符长度计2,ASCII字符计1)
代码如下复制代码
String.prototype.len=function(){place([^x00-xff]/g,"aa").length;}
匹配空⾏的正则表达式:n[s| ]*r
匹配HTML标记的正则表达式:/<(.*)>.*</1>|<(.*) />/
匹配⾸尾空格的正则表达式:(^s*)|(s*$)
知道它了我们就好解决了
代码如下复制代码
public static void regxChinese(){
// 要匹配的字符串
String source = "<span title='5 星级酒店' class='dx dx5'>";
// 将上⾯要匹配的字符串转换成⼩写
// source = LowerCase();
// www.111cn 匹配的字符串的正则表达式
String reg_charset = "<span[^>]*?title='([0-9]*[\s|\S]*[u4E00-u9FA5]*)'[\s|\S]
*class='[a-z]*[\s|\S]*[a-z]*[0-9]*'";
Pattern p = Patternpile(reg_charset);
Matcher m = p.matcher(source);
while (m.find()) {
System.out.up(1));
}
}
public static void regxChinese(){
// 要匹配的字符串
String source = "<span title='5 星级酒店' class='dx dx5'>";
// 将上⾯要匹配的字符串转换成⼩写
// source = LowerCase();
/
/ 匹配的字符串的正则表达式
String reg_charset = "<span[^>]*?title='([0-9]*[\s|\S]*[u4E00-u9FA5]*)'[\s|\S]
*class='[a-z]*[\s|\S]*[a-z]*[0-9]*'";
Pattern p = Patternpile(reg_charset);
Matcher m = p.matcher(source);
while (m.find()) {
js中文正则表达式System.out.up(1));
}
}
Java的正则表达式是可以匹配中⽂字符的,同时,⽤中⽂字符来写表达式也是可以的
代码如下复制代码
String reg_charset = "<span[^>]*?title='([0-9]*[\s|\S]*星级酒店)'[\s|\S]*class='[a-z]*[\s|\S]
*[a-z]*[0-9]*'";
String reg_charset = "<span[^>]*?title='([0-9]*[\s|\S]*星级酒店)'[\s|\S]*class='[a-z]*
[\s|\S]*[a-z]*[0-9]*'";
⼀些常⽤的正则匹配规则
匹配中⽂字符的正则表达式: [u4e00-u9fa5]
评注:匹配中⽂还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^x00-xff]
评注:可以⽤来计算字符串的长度(⼀个双字节字符长度计2,ASCII字符计1)
匹配空⽩⾏的正则表达式:ns*r
评注:可以⽤来删除空⽩⾏
匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? />
评注:⽹上流传的版本太糟糕,上⾯这个也仅仅能匹配部分,对于复杂的嵌套标记依旧⽆能为⼒
匹配⾸尾空⽩字符的正则表达式:^s*|s*$
评注:可以⽤来删除⾏⾸⾏尾的空⽩字符(包括空格、制表符、换页符等等),⾮常有⽤的表达式
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
评注:表单验证时很实⽤
匹配⽹址URL的正则表达式:[a-zA-z]+://[^s]*
评注:⽹上流传的版本功能很有限,上⾯这个基本可以满⾜需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 评注:表单验证时很实⽤
匹配国内电话号码:d{3}-d{8}|d{4}-d{7}
评注:匹配形式如 0511-******* 或 021-********
匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始
匹配中国:[1-9]d{5}(?!d)
评注:中国为6位数字
匹配⾝份证:d{15}|d{18}
评注:中国的⾝份证为15位或18位
匹配ip地址:d+.d+.d+.d+
评注:提取ip地址时有⽤
更多详细内容请查看:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论