python中cp936什么意思_Python:终于解决了编码问题--688IT编程网

python中cp936什么意思_Python：终于解决了编码问题

我个⼈喜好的Python编辑器是Ulipad，在解析⽹页的时候，经常会遇到乱码的问题，虽说Windows下Python处理中⽂⼀直有各种问题和各种答案。却不适合我的。

最近搜索下来，终于到了其中的奥秘。Ulipad的默认编码是cp936，可以⽤以下办法得知

import locale

defaultlocale()[1]

之前试图⽤重新设置默认编码的⽅法，没有解决编码问题：

reload(sys)

sys.setdefaultencoding('utf-8')

必须在得到你的字符串之后，先decode到你的⽂本编辑器默认编码，再encode到你的设置的系统默认编码。

title.defaultencoding()).defaultlocale()[1])

为什么Python使⽤过程中会出现各式各样的乱码问题，明明是中⽂字符却显⽰成“\xe4\xb8\xad\xe6\x96\x87”的形式？

字符串在Python内部的表⽰是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码(decode)成unicode，再从unicode编码(encode)成另⼀种编码。

decode的作⽤是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表⽰将gb2312编码的字符串str1转换成unicode编码。

encode的作⽤是将unicode编码转换成其他编码的字符串，如de('gb2312')，表⽰将unicode编码的字符串str2转换成

gb2312编码。

因此，转码的时候⼀定要先搞明⽩，字符串str是什么编码，然后decode成unicode，然后再encode成其他编码。

代码中字符串的默认编码与代码⽂件本⾝的编码⼀致。

如：s='中⽂'

如果是在utf8的⽂件中，该字符串就是utf8编码，如果是在gb2312的⽂件中，则其编码为gb2312。这种情况下，要进⾏编码转换，都需要先⽤decode⽅法将其转换成unicode编码，再使⽤encode⽅法将其转换成其他编码。通常，在没有指定特定的编码⽅式时，都是使⽤的系统默认编码创建的代码⽂件。

如果字符串是这样定义：s=u'中⽂'，则该字符串的编码就被指定为unicode了，即python的内部编码，⽽与代码⽂件本⾝的编码⽆关。因此，对于这种情况做编码转换，只需要直接使⽤encode⽅法将其转换成指定编码即可。

如果⼀个字符串已经是unicode了，再进⾏解码则将出错，因此通常要对其编码⽅式是否为unicode进⾏判断：

isinstance(s, unicode) #⽤来判断是否为unicodepython代码转换

688IT编程网

python中cp936什么意思_Python:终于解决了编码问题

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python中cp936什么意思_Python:终于解决了编码问题

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式