python中的unicode码是什么_Python中Unicode字符串--688IT编程网

python中的unicode码是什么_Python中Unicode字符串

字符串还有⼀个编码问题。

因为计算机只能处理数字，如果要处理⽂本，就必须先把⽂本转换为数字才能处理。最早的计算机在设计时采⽤8个⽐特(bit)作为⼀个字节(byte)，所以，⼀个字节能表⽰的最⼤的整数就是255(⼆进制11111111=⼗进制255)，0 - 255被⽤来表⽰⼤⼩写英⽂字母、数字和⼀些符号，这个编码表被称为ASCII编码，⽐如⼤写字母 A 的编码是65，⼩写字母 z 的编码是122。

如果要表⽰中⽂，显然⼀个字节是不够的，⾄少需要两个字节，⽽且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，⽤来把中⽂编进去。

类似的，⽇⽂和韩⽂等其他语⾔也有这个问题。为了统⼀所有⽂字的编码，Unicode应运⽽⽣。Unicode把所有语⾔都统⼀到⼀套编码⾥，这样就不会再有乱码问题了。

Unicode通常⽤两个字节表⽰⼀个字符，原有的英⽂编码从单字节变成双字节，只需要把⾼字节全部填为0就可以。

因为Python的诞⽣⽐Unicode标准发布的时间还要早，所以最早的Python只⽀持ASCII编码，普通的字符串'ABC'在Python内部都是ASCII编码的。

Python在后来添加了对Unicode的⽀持，以Unicode表⽰的字符串⽤u'...'表⽰，⽐如：

print u'中⽂'

数字转unicode编码中⽂

注意: 不加 u ，中⽂就不能正常显⽰。

Unicode字符串除了多了⼀个u之外，与普通字符串没啥区别，转义字符和多⾏表⽰法仍然有效：

转义：

u'中⽂\n⽇⽂\n韩⽂'

多⾏：

u'''第⼀⾏

第⼆⾏'''

raw+多⾏：

ur'''Python的Unicode字符串⽀持"中⽂",

"⽇⽂",

"韩⽂"等多种语⾔'''

如果中⽂字符串在Python环境下遇到 UnicodeDecodeError，这是因为.py⽂件保存的格式有问题。可以在第⼀⾏添加注释

# -*- coding: utf-8 -*-

⽬的是告诉Python解释器，⽤UTF-8编码读取源代码。然后⽤Notepad++ 另存为... 并选择UTF-8格式保存。

688IT编程网

python中的unicode码是什么_Python中Unicode字符串

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

python中的unicode码是什么_Python中Unicode字符串

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行