常用汉字的UTF-8编码及编码范围--688IT编程网

常⽤汉字的UTF-8编码及编码范围

在防⽌恶意注册中，输⼊随即图⽚认证时可以⽤下⾯的常⽤字符集：（请使⽤IE浏览器打开）

\u7684\u4e00\u4e86\u662f\u6211\u4e0d\u5728\u4eba\u4eec\u6709\u6765\u4ed6\u8fd9\u4e0a\u7740\u4e2a\u573

编码范围

1. GBK (GB2312/GB18030)

x00-xff GBK双字节编码范围

x20-x7f ASCII

xa1-xff 中⽂

unicode汉字x80-xff 中⽂

2. UTF-8 (Unicode)

u4e00-u9fa5 (中⽂)

x3130-x318F (韩⽂)

xAC00-xD7A3 (韩⽂)

u0800-u4e00 (⽇⽂)

ps: 韩⽂是⼤于[u9fa5]的字符

正则例⼦（使⽤PHP）:

preg_replace(“/([x80-xff])/”,”",$str); //GBK中匹配

preg_replace(“/([u4e00-u9fa5])/”,”",$str); //UTF8中匹配

另外⼀些：

有时候我们也会⽤到全⾓英⽂、特殊符号等

全⾓英⽂的UTF8是: uff21 – uff5a ，是从⼤写A开始到⼩写的z。

utf8中的 uff20是@

utf8中的 uff01到 uff09是我们美式键盘上shift + 从1到9键上的特殊符号。要注意的是因为@是 uff20，所以 uff02是双引号，同时6的……是两个符号的组合，所以也不存在，正题提前⼀位（也就是说ff06是＆， ff09是））。

utf8中的全⾓数字是 uff10 – uff19 ，对应关系⾃然是　０ – ９。

发表评论

688IT编程网

常用汉字的UTF-8编码及编码范围

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

常用汉字的UTF-8编码及编码范围

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式