中⽂字符,全⾓字符的正则表达式
经过测试其中匹配双字节字符(包括汉字在内):[^\x00-\xff]⾮常好⽤推荐⼀下
两外推荐个⽹址
这个家伙收录的正则很多,呵呵
关键字:正则表达式模式匹配 Javascript
摘要:收集⼀些常⽤的正则表达式。
正则表达式⽤于字符串处理,表单验证等场合,实⽤⾼效,但⽤到时总是不太把握,以致往往要上⽹查⼀番。我将⼀些常⽤的表达式收藏在这⾥,作备忘之⽤。本贴随时会更新。
匹配中⽂字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
应⽤:计算字符串的长度(⼀个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){place([^\x00-\xff]/g,"aa").length;}
匹配空⾏的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配⾸尾空格的正则表达式:(^\s*)|(\s*$)
im = function()
{
place(/(^\s*)|(\s*$)/g, "");
}
利⽤正则表达式分解和转换IP地址:
下⾯是利⽤正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:
js中文正则表达式function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g  //匹配IP地址的正则表达式
st(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
不过上⾯的程序如果不⽤正则表达式,⽽直接⽤split函数来分解可能更简单,程序如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配⽹址URL的正则表达式:([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
利⽤正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见本贴回复]
var s="abacabefgeeii"
var place(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var place(re,"")
alert(s1+s2)  //结果为:abcefgi
我原来在CSDN上发贴寻求⼀个表达式来实现去除重复字符的⽅法,最终没有到,这是我能想到的最简单的实现⽅法。思路是使⽤后向引⽤取出包括重复的字符,再以重复的字符建⽴第⼆个表达式,取到不重复的字符,两者串连。这个⽅法对于字符顺序有要求的字符串可能不适⽤。
得⽤正则表达式从URL地址中提取⽂件名的javascript程序,如下结果为page1
s="www.9499/page1.htm"
place(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利⽤正则表达式限制⽹页表单⾥的⽂本框输⼊内容:
⽤正则表达式限制只能输⼊中⽂:onkeyup="place(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^\u4E00-\u9FA5]/g,''))"
⽤正则表达式限制只能输⼊全⾓字符: onkeyup="place(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^\uFF00-\uFFFF]/g,''))"
⽤正则表达式限制只能输⼊数字:onkeyup="place(/[^\d]/g,'')
"onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^\d]/g,''))"
⽤正则表达式限制只能输⼊数字和英⽂:onkeyup="place(/[\W]/g,'')
"onbeforepaste="clipboardData.setData('text',Data('text').replace(/[^\d]/g,''))"
应⽤:javascript中没有像vbscript那样的trim函数,我们就可以利⽤这个表达式来实现,如下:
判断⽇⽂的正则表达式
1. GBK (GB2312/GB18030)
\x00-\xff  GBK双字节编码范围
\x20-\x7f  ASCII
\xa1-\xff  中⽂
\x80-\xff  中⽂
2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中⽂)
\x3130-\x318F (韩⽂
\xAC00-\xD7A3 (韩⽂)
\u0800-\u4e00 (⽇⽂)
ps: 韩⽂是⼤于[\u9fa5]的字符

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。