python pandas 实例
Python是一种高级编程语言,具有简洁、易读、易编写和易调试等优点。Python在数据分析领域应用非常广泛,其中pandas是Python中最有名的数据分析库之一,它能够帮助我们在Python中处理和分析大量的数据。下面将会为大家介绍一些Python pandas实例的操作方法。
一、导入 pandas
我们需要先导入pandas模块,可以使用如下代码:
```
import pandas as pd
```
二、创建DataFrame
DataFrame是pandas中的一个重要数据结构,它类似于Excel中的表格。我们可以使用以下代码来创建DataFrame:
```
python index函数data = {'姓名': ['张三', '李四', '王五'], '数学分数': [90, 80, 85], '语文分数': [80, 75, 95]}
df = pd.DataFrame(data)
```
这个代码将会创建一个包含姓名、数学分数和语文分数的DataFrame。
三、读取和写入数据
Pandas中能够读取和写入的数据类型非常多,如csv、excel等。下面是以CSV文件为例读取和写入数据的代码:
读取csv文件:
```
df = pd.read_csv('data.csv')
```
写入csv文件:
```
df.to_csv('result.csv', index=False)
```
以上两个代码分别是从data.csv读取数据,并将结果写入result.csv文件。其中to_csv函数中的参数index=False表示不将行索引写入结果csv文件。
四、数据选择和过滤
Pandas中支持类似于SQL的选择和过滤操作。以下代码将会选取数学分数大于80的所有行:
```
result = df[df['数学分数'] > 80]
```
以上代码中的df['数学分数'] > 80进行了一个布尔操作,返回了一个布尔数组,其中值为True的表示该行的数学分数大于80。最后将这个布尔数组传入df中,将会得到结果DataFrame。
五、数据聚合和分组
Pandas中的聚合和分组操作可以帮助我们对数据进行汇总和分析。以下是一个例子,假设我们有一个DataFrame df,包含姓名、城市和销售额:
```
df = pd.DataFrame({'Name': ['Tom', 'Jack', 'Tom', 'Jack', 'Steve', 'Steve', 'Mike', 'Mike'], 'City': ['Seattle', 'Los Angeles', 'Seattle', 'Seattle', 'Los Angeles', 'Los Angeles', 'Seattle', 'Seattle'], 'Sales': [100, 200, 300, 400, 500, 600, 700, 800]})
```
我们可以通过以下代码计算每个城市的总销售额:
```
results = df.groupby('City')['Sales'].sum()
```
以上代码中,我们将Sales列按照城市进行了分组,然后使用sum函数计算了每个城市的总销售额。
六、数据可视化
Pandas也支持数据可视化。以下代码将会画出数学分数和语文分数的柱形图:
```
import matplotlib.pyplot as plt
plt.bar(df['姓名'], df['数学分数'])
plt.bar(df['姓名'], df['语文分数'])
plt.show()
```
以上代码中,我们使用了matplotlib库,通过bar函数画出了柱形图,最后使用show函数显示了结果。
在Python pandas实例中,以上介绍了一些基础操作,但是pandas还有很多高级操作,这些操作帮助我们更好的进行数据分析和处理。阅读官方文档和学习高级API可以帮助我们更好地学习使用Pandas进行数据分析。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论