常⽤汉字的UTF-8编码及编码范围
在防⽌恶意注册中,输⼊随即图⽚认证时可以⽤下⾯的常⽤字符集:(请使⽤IE浏览器打开)
\u7684\u4e00\u4e86\u662f\u6211\u4e0d\u5728\u4eba\u4eec\u6709\u6765\u4ed6\u8fd9\u4e0a\u7740\u4e2a\u573
编码范围
1. GBK (GB2312/GB18030)
x00-xff GBK双字节编码范围
x20-x7f ASCII
xa1-xff 中⽂
unicode汉字x80-xff 中⽂
2. UTF-8 (Unicode)
u4e00-u9fa5 (中⽂)
x3130-x318F (韩⽂)
xAC00-xD7A3 (韩⽂)
u0800-u4e00 (⽇⽂)
ps: 韩⽂是⼤于[u9fa5]的字符
正则例⼦(使⽤PHP):
preg_replace(“/([x80-xff])/”,”",$str); //GBK中匹配
preg_replace(“/([u4e00-u9fa5])/”,”",$str); //UTF8中匹配
另外⼀些:
有时候我们也会⽤到全⾓英⽂、特殊符号等
全⾓英⽂的UTF8是: uff21 – uff5a ,是从⼤写A开始到⼩写的z。
utf8中的 uff20是@
utf8中的 uff01到 uff09是我们美式键盘上shift + 从1到9键上的特殊符号。要注意的是因为@是 uff20,所以 uff02是双引号,同时6的……是两个符号的组合,所以也不存在,正题提前⼀位(也就是说ff06是&, ff09是))。
utf8中的全⾓数字是 uff10 – uff19 ,对应关系⾃然是 0 – 9。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论