python中json.dumps使用的坑以及字符编码--688IT编程网

python中json.dumps使⽤的坑以及字符编码

我们知道，python中的字符串分普通字符串和unicode字符串，⼀般从数据库中读取的字符串会⾃动被转换为unicode字符串

下⾯回到重点，使⽤json.dumps时，⼀般的⽤法为：

>>> obj={"name":"测试"}

>>> json.dumps(obj)

'{"name": "

>>> print json.dumps(obj)

{"name": "\u6d4b\u8bd5"}

>>> json.dumps(obj).encode("utf-8")

'{"name": "

可以看到这⾥输出的字符串为普通字符串，但是⾥⾯的内容却是unicode字符串的内容，即使对结果进⾏encode("utf-8") ，因为这个字符串本⾝就已经编码过了，所有进⾏encode不会有变化

要想得到字符串的真实表⽰，需要⽤到参数ensure_ascii=False(默认为True)：

>>> json.dumps(obj,ensure_ascii=False)

'{"name": "\xe6\xb5\x8b\xe8\xaf\x95"}'

>>> print json.dumps(obj,ensure_ascii=False)

{"name": "测试"}

坑：试试下⾯的⽤法（⽐如key是从数据库中读取的，则会以unicode字符串形式存在）：

>>> key=u"name"

>>> obj={key:"测试"}

>>> json.dumps(obj,ensure_ascii=False)

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

File "/usr/lib64/python2.6/json/__init__.py", line 237, in dumps

**kw).encode(obj)

File "/usr/lib64/python2.6/json/encoder.py", line 368, in encode

return ''.join(chunks)

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 1: ordinal not in range(128)

这是因为key和value不能以混合普通字符串和unicode字符串的形式存在

改成下⾯则正常了（同时为普通字符串或同时为unicode字符串）：

>>> key=u"name"

>>> obj={key:u"测试"}

>>> json.dumps(obj,ensure_ascii=False)

u'{"name": "\u6d4b\u8bd5"}'

>>> obj={de("utf-8"):u"测试".encode("utf-8")}

>>> json.dumps(obj,ensure_ascii=False)

'{"name": "\xe6\xb5\x8b\xe8\xaf\x95"}'

另外说说还有⼀个参数default

考虑下⾯的场景：

>>> class Data:

... def __init__(self):

... self.name = ""

... self.detail = ""

...

>>> data=Data()

>>> data.name="名字"

>>> data.detail="细节"

>>> obj={"data":data}

>>> json.dumps(obj,ensure_ascii=False)

会报下⾯的异常：

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

File "/usr/lib64/python2.6/json/__init__.py", line 237, in dumps

**kw).encode(obj)

File "/usr/lib64/python2.6/json/encoder.py", line 367, in encode

chunks = list(self.iterencode(o))

File "/usr/lib64/python2.6/json/encoder.py", line 309, in _iterencode

for chunk in self._iterencode_dict(o, markers):

File "/usr/lib64/python2.6/json/encoder.py", line 275, in _iterencode_dict

for chunk in self._iterencode(value, markers):

File "/usr/lib64/python2.6/json/encoder.py", line 317, in _iterencode

for chunk in self._iterencode_default(o, markers):

File "/usr/lib64/python2.6/json/encoder.py", line 323, in _iterencode_default

newobj = self.default(o)

File "/usr/lib64/python2.6/json/encoder.py", line 344, in default

unicode所有字符

raise TypeError(repr(o) + " is not JSON serializable")

TypeError: <__main__.Data instance at 0x11e87e8> is not JSON serializable

这是因为json.dumps不知道如何对Data对象进⾏序列化，需要定义⼀个函数，并赋给参数default：>>> def convert_to_builtin_type(obj):

... d = {}

... d.update(obj.__dict__)

... return d

...

>>> json.dumps(obj,ensure_ascii=False, default=convert_to_builtin_type)

'{"data": {"name": "\xe5\x90\x8d\xe5\xad\x97", "detail": "\xe7\xbb\x86\xe8\x8a\x82"}}'

>>> print json.dumps(obj,ensure_ascii=False, default=convert_to_builtin_type)

{"data": {"name": "名字", "detail": "细节"}}

def convert_to_builtin_type(obj):

d = {}

d.update(obj.__dict__)

return d

688IT编程网

python中json.dumps使用的坑以及字符编码

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python中json.dumps使用的坑以及字符编码

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式