Python中关于列表嵌套列表的处理--688IT编程网

Python中关于列表嵌套列表的处理

在处理列表的时候我们经常会遇到列表中嵌套列表的结构，如果我们要把所有元素放⼊⼀个新列表，或者要计算所有元素的个数的话应该怎么做呢？python怎么读csv数据

第⼀个例⼦

对于上图中的这样⼀组数据，如果我们要知道这个CSV⽂件中所有演员的数量（同⼀个⼈只能出现⼀次）应该怎么做呢？

在pandas中我们可以先取Actors 这⼀列，但是取出来之后我们会发现这是⼀个列表中嵌套列表的结构，要想将所有元素提取出来我们可以使⽤两个for循环来解决这⼀问题。代码如下：

第⼆个例⼦

我们再来看第⼆组例⼦，还是上图中的数据，如果我们想要统计各个分类的电影的数量，应该怎么做呢？核⼼思想是：# encoding = utf-8

import pandas as pd

file_path = "d:/learning/pandas/IMDB-Movie-Data.csv"

df = pd.read_csv(file_path)

print(df.head(1))

# 读平均评分

print(df["Rating"].mean())

# 导演的⼈数（下⾯两个操作达到的效果是⼀样的）

print(len(set(df["Director"].tolist())))

print(len(df["Director"].unique()))

# 获取演员的⼈数

temp_list = df["Actors"].str.split(", ").tolist()

# 将列表套列表转为单列表

actors_list = [i for j in temp_list for i in j]

# set 函数是对列表作集合操作，可以去重

print(len(set(actors_list)))

1. 先处理列表嵌套列表，将所有的分类统计出来；

2. 建⽴⼀个值全为0的数组，这个数组的⾏数等于电影数，列数等于分类数；

3. 在这个数组的列⽅向上进⾏求和，得出结果。

结果如图：

这⾥有⼀个重要的问题，如果原始数据的⾏数特别多，再采⽤for循环进⾏⾏遍历就会耗费特别长的时间

解决办法见的第三个例⼦。# coding=utf-8

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

file_path = "~/桌⾯/IMDB-Movie-Data.csv"

df = pd.read_csv(file_path)

# 新建临时列表，将数组中分类列读取

temp_list = df["Genre"].str.split(",").tolist()

# 处理列表嵌套列表的结构，去除重复元素

Genre_list = set([i for j in temp_list for i in j])

# 新建⼀个统计数组，即上⽂所说的第⼆步

a = pd.s((df.shape[0], len(Genre_list))), columns=Genre_list, dtype=int)

# 赋值，将上述列表中对应的位置的值变为1

for i in range(len(temp_list)):

a.loc[i, temp_list[i]] = 1

# 求和，统计每个分类的电影的数量

sum = a.sum(axis=0)

sum = sum.sort_values(ascending=False)

# 绘制条形统计图

_x = sum.index

_y = sum.values

plt.figure(figsize=(20, 8), dpi=80)

plt.bar(_x, _y)

plt.show()

688IT编程网

Python中关于列表嵌套列表的处理

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

688IT编程网

Python中关于列表嵌套列表的处理

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法 正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

nginx map用法正则

nginx map用法正则