Python中优雅处理JSON文件的方法实例--688IT编程网

Python中优雅处理JSON⽂件的⽅法实例

⽬录

1. 引⾔

2. 什么是JSON⽂件?

3. 使⽤Python处理JSON⽂件

3.1. 将JSON⽂件读取为字典类型

3.2. 将JSON⽂件读取为Pandas类型

3.3. 使⽤Pandas读取嵌套JSON类型

3.4. 访问特定位置的数据

3.5. 导出JSON

3.6. 格式化输出

3.7. 输出字段排序

4.总结

5.参考

1. 引⾔

在本⽂中，我们将学习如何使⽤Python读取、解析和编写JSON⽂件。

我们将讨论如何最好地处理简单的JSON⽂件以及嵌套的JSON⽂件，当然我们也将讨论如何访问Json⽂件数据中的特定值。

2. 什么是JSON⽂件?

JSON（Java Script Object Notation）是⼀种流⾏的⽂件格式，主要⽤于在web应⽤程序中存储和传输数据。如果我们经常和数据打交道，那么⼀定或多或少遇到过JSON格式的⽂件，因此我们有必要来学习如何读取和写⼊JSON。

下图为常见的JSON⽂件结构的⽰例.

JSON结构看起来和Python中的字典⾮常类似。需要注意的是，JSON格式通常是由key: 结对组成，其中key是字符串形

式,value是字符串、数字、布尔值、数组、对象或null。

为了更直观的进⾏说明，在下图中我们以蓝⾊突出显⽰了所有的key，同时以橙⾊突出显⽰了所有的value。请注意，以下每组key/value间均使⽤逗号进⾏区分。

3. 使⽤Python处理JSON⽂件

在Python中内置了⽤于读取JSON⽂件的函数。以下给出⼏个如何将JSON⽂件解析为Python对象的⽰例。

3.1. 将JSON⽂件读取为字典类型

⾸先我们需要导⼊ json库, 接着我们使⽤open函数来读取JSON⽂件，最后利⽤json.load()函数将JSON字符串转化为Python字典形式.

就这么简单，代码如下:

1 2 3 4 5 6 7import json

with open('superheroes.json') as f:

superHeroSquad =json.load(f)

print(type(superHeroSquad)) # Output: dict

print(superHeroSquad.keys())

# Output: dict_keys(['squadName', 'homeTown', 'formed', 'secretBase', 'active', 'members'])

上述代码很简单很直观啦，唯⼀需要注意的是json库中有load()和loads()两个函数.

函数load()作⽤为读取JSON⽂件⽣成Python对象函数loads()作⽤为读取JSON 字符串流⽣成Python对象我们可以将loads()函数中的字符s的含义理解成 load for strings.

3.2. 将JSON⽂件读取为Pandas类型

当然我们也可以使⽤Pandas库中的 read_json函数来读取对应的JSON⽂件,

代码如下:

1import pandas as pd

运⾏结果如下:

需要注意的是使⽤Pandas库不仅仅可以读取电脑本地磁盘上的JSON⽂件，也可以通过URL读取⽹络上存放的⽂件.

代码如下:

3.3. 使⽤Pandas读取嵌套JSON类型

我们有时候遇到的JSON⽂件是嵌套的，这经常会让读取⼯作变得有些困难. 其实嵌套JSON和Python中的嵌套字典思想类似，即字典中嵌套字典.

我们观察上述例⼦中的member字段，其值也为字典类型，下图中我们使⽤缩进来展⽰嵌套结构。

设想⼀下，当我们将JSON⽂件加载到Pandas数据框架中时，members列如下所⽰。每⾏包含⼀个字典。

接下来我们讨论两种实现⽅法，这两种⽅法中，我们可以解析数据，以便将每个键分解为单独的⼀列。

⽅案⼀

我们可以在members这⼀列上使⽤apply⽅法，代码如下：

上述代码执⾏后，

members列会被拆分为4个新列，如下所⽰：

当然如果你想将上述拆分后的结果和之前的结果进⾏合并，可以使⽤pd.concat函数，

代码如下：

1)], axis =1)

⽅案⼆

在Pandas库中还有⼀个函数 json_normalize() ，它允许我们把嵌套的JSON展开。这是最简单的⽅法来解析嵌套的JSON了。代码如下：

1 2 3 4 5def test2():

with open('superheroes.json') as f:

superHeroSquad =json.load(f)

out =pd.json_normalize(superHeroSquad, record_path=['members'],

meta=['squadName', 'homeTown', 'formed', 'secretBase', 'active']) print(out)

上述代码中：

record_path 为我们希望拆分的列的名字

meta 为列名的list ，为我们输出的次序

运⾏结果如下：

最后我们需要注意的是，我们可以在上述函数json_normalize 中添加参数 meta_prefix ，这样可以让我们对meta 中的名字添加统⼀的前缀。

代码如下：

123

js获取json的key和value

pd.json_normalize(superHeroSquad,

record_path = ['members'],

meta = ['squadName', 'homeTown', 'formed', 'secretBase', 'active'],

meta_prefix = 'members_')

运⾏结果如下：

3.4. 访问特定位置的数据

在Python 中我们可以通过Key 的名字或者下标来访问JSON ⽂件中任意位置的数据。

⽐如，假设我们想知道我们的第⼆个超级英雄的秘密⾝份。即在下图中，需要访问特定位置的数据在下图中以紫⾊突出显⽰。

688IT编程网

Python中优雅处理JSON文件的方法实例

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python中优雅处理JSON文件的方法实例

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式