utf8-2005编码集字符定义表--688IT编程网

UTF-8编码集字符定义表

一、概述

1. 介绍UTF-8编码

UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，它可以用来表示Unicode标准的任意字符。UTF-8编码最早由肯·汤普逊和罗布·派克设计，并于1992年首次发布。它是目前互联网上使用最广泛的字符编码之一，同时也是许多操作系统和程序的默认字符编码。

2. UTF-8编码的特点

UTF-8编码采用变长编码方式，可以表示Unicode标准的所有字符，范围从U+xxx到U+10FFFF。它的编码长度可以是1-4个字节，使得它在存储和传输时能够更有效地利用空间。UTF-8编码还具有自解析和自同步的特性，能够避免由于编码错误导致的字符解析问题。

二、UTF-8编码规则

1. 编码规则

UTF-8编码规则如下：

- 对于U+xxx到U+xxxF（即0到127）的Unicode字符，使用1个字节来表示，此时UTF-8编码与ASCII编码兼容；

- 对于U+xxx到U+0007FF（即128到2047）的Unicode字符，使用2个字节来表示；

- 对于U+xxx到U+00D7FF和U+00E000到U+00FFFF的Unicode字符，使用3个字节来表示；

- 对于U+xxx到U+10FFFF的Unicode字符，使用4个字节来表示。

2. 解码规则

UTF-8解码时，根据第一个字节的高位连续“1”的个数来确定该Unicode字符的编码长度。根据相应的编码长度，获取后续字节的信息，然后将所有字节重新组合成Unicode字符。

三、UTF-8编码集字符定义表

1. ASCII字符

UTF-8编码与ASCII码兼容，因此ASCII字符的UTF-8编码与其ASCII码相同。

- ASCII字符包括数字0-9、大写字母A-Z、小写字母a-z以及一些特殊字符如空格、换行符等。

2. 非ASCII字符

对于U+0080到U+10FFFF范围内的Unicode字符，UTF-8采用特定的编码方式来表示。

- 2字节UTF-8编码示例：U+0123（ģ）的UTF-8编码为0xC4 0xA3；

- 3字节UTF-8编码示例：U+3BAF（㮯）的UTF-8编码为0xE3 0xAE 0xAF；

- 4字节UTF-8编码示例：U+1F609（

unix编码格式

« 上一篇

utf8编码范围

688IT编程网

utf8-2005编码集字符定义表

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

utf8-2005编码集字符定义表

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式