unicode和utf-8的区别--688IT编程网

unicode和utf-8的区别

在Django视图函数中经常出现类似于'ascii' codec can't decode byte 0xef in position 0: ordinal not in range(128)的错误。

在解决错误之前，⾸先要了解unicode和utf-8的区别。

unicode指的是万国码，是⼀种“字码表”。⽽utf-8是这种字码表储存的编码⽅法。unicode不⼀定要由utf-8这种⽅式编成bytecode储存，也可以使⽤utf-16,utf-7等其他⽅式。⽬前⼤多都以utf-8的⽅式来变成bytecode。

其次，中字符串类型分为byte string 和 unicode string两种。

如果在⽂件中指定编码⽅式为utf-8(#coding=utf-8)，那么所有带中⽂的字符串都会被认为是utf-8编码的byte string（例如：mystr="你好"），但是在函数中所产⽣的字符串则被认为是unicode string。

问题就出在这边，unicode string 和 byte string 是不可以混合使⽤的，⼀旦混合使⽤了，就会产⽣这样的错误。例如：

其中，"你好"被认为是byte string，⽽("argu")的返回值被认为是unicode string。由于预设的解码器是ascii，所以就不能识别中⽂byte string。然后就报错了。

以下有两个解决⽅法：

unicode字符转中文1.将字符串全都转成byte string。

2.将字符串全都转成unicode string。

byte string转换成unicode string可以这样转unicode(unicodestring, "utf-8")

发表评论

688IT编程网

unicode和utf-8的区别

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

unicode和utf-8的区别

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式