Python之Pandas模块入门讲解及案例--688IT编程网

Python之Pandas模块⼊门讲解及案例

Python之Pandas模块讲解及案例

⼀、安装Pandas

pip install Pandas

⼆、简介

Pandas是⼀个开源的，BSD许可的库，为Python (opens new window)编程语⾔提供⾼性能，易于使⽤的数据结构和数据分析⼯具。

Pandas是NumFOCUS (opens new window)赞助的项⽬。这将有助于确保Pandas成为世界级开源项⽬的成功，并有可能捐赠 (opens new window)给该项⽬。

另外，获得 Pandas 的最佳⽅式是通过 conda(opens new window)：

conda install Pandas

但是此⽅法安装较慢，不太推荐，可以直接pip。

三、Series类

1、Series对象的实现

Series对象是相当于⼀个⼀维的数组

⽅法1

import pandas as pd

"""

导⼊pandas模块

"""

ser_0 = pd.Series(data=[0,1,2,3,4,5])

# data 参数表⽰：所取得的数值是多少

print(ser_0)

# output>

dtype: int64

# 第⼀列是索引（indexs）

# 第⼆列是数值（values）

⽅法2

import pandas as pd

ser_1 = pd.Series(data=[0,1,2,3], index=['a','b','c','d'])

# index 表⽰⾃定义索引

print(ser_1)

# output>

a 0

b 1

c 2

d 3

dtype: int64

⽅法3

config ={

'one':1,

'two':2,

'three':3,

'four':4

}

# 字典

ser_2 = pd.Series(config)

print(ser_2)

# output>

one 1

two 2

three 3

four 4

dtype: int64

2、Head与Tail

import pandas as pd

import numpy as np

index_list =list('abcdefghijklmnopqrst')

data_list = np.arange(20)

ser = pd.Series(data=data_list, index=index_list) print(ser.head())

print(ser.head(3))

print(ser.tail())

print(ser.tail(3))

# output>

a 0

b 1

c 2

d 3

e 4

dtype: int32

a 0

b 1

c 2

dtype: int32

p 15

q 16

r 17

s 18

t 19

dtype: int32

r 17

s 18

t 19

dtype: int32

3、属性与底层数据

index属性

values属性

ser = pd.Series(data=[0,1,2,3,4,5,6,7,8,9,10], index=['a','b','c','d','e','f','g','h','j','k','l']) print(ser.index)

print(ser.values)

# output>

Index(['a','b','c','d','e','f','g','h','j','k','l'], dtype='object')

[012345678910]

4、Series对象的切⽚操作

实际上，Series对象的切⽚与数组的切⽚差别并不⼤。

import pandas as pd

ser = pd.Series([1,2,3,4,5,6,7,8,9,0,11])

print(ser[0])

print(ser[1:7])

print(ser[0:8:2])

print(ser[:])

print(ser[-5:-2])

# output>

dtype: int64

1011

dtype: int64

5、Series对象的⼀些常⽤⽅法

1、Series.index

索引

2、Series.values

数值

3、Series.drop(index)

删除某⼀个数据

4、Series.sum

求所有元素的和

等

四、DataFrame类

1、DataFrame对象的实现

⽅法1

import pandas as pd

df = pd.DataFrame([[0,1,2,3,4],[5,6,7,8,9]])

print(df)

⽅法2

python 定义数组

import pandas as pd

df = pd.DataFrame(data=[[0,1,2,3,4],[5,6,7,8,9]], index=['a','b']) print(df)

⽅法3

import pandas as pd

config={

'a':[1,2,3,4,5],

'b':[4,5,6,7,8],

'c':[2,4,6,8,10]

}

df = pd.DataFrame(data=config,index=['one','two','three','four','five']) print(df)

2、DataFrame的取值以及切⽚

1、取值

Head、 Tail ⽅法

import pandas as pd

config ={

'a':[0,1,2,3,4,5,6,7],

'b':[8,9,10,11,12,13,14,15],

'c':[3,6,9,11,13,15,17,19],

'd':[2,4,6,9,12,14,16,18,]

}

df = pd.DataFrame(data=config, index=['a','b','c','d','e','f','g','h']) print(df)

print(df.head())

print(df.tail())

某⼀个位置处的值：

import pandas as pd

config ={

'a':[0,1,2,3,4,5,6,7],

'b':[8,9,10,11,12,13,14,15],

'c':[3,6,9,11,13,15,17,19],

'd':[2,4,6,9,12,14,16,18,]

}

df = pd.DataFrame(data=config, index=['a','b','c','d','e','f','g','h']) print(df.a.a)

print(df.a.b)

# 实际上是相当于取出字典中的数据的类似⽅法，

# 先去取⼀列，

# 再从这⼀列中去取出来某⼀⾏的数据点。

# output>

2、切⽚

1、⾏切⽚

import pandas as pd

config ={

'a':[0,1,2,3,4,5,6,7],

'b':[8,9,10,11,12,13,14,15],

'c':[3,6,9,11,13,15,17,19],

'd':[2,4,6,9,12,14,16,18,]

}

df = pd.DataFrame(data=config, index=['a','b','c','d','e','f','g','h']) print(df[0:4])

# 从第零⾏切⼑第三⾏数据

print(df['a':'c'])

# 从下标为 a 的⾏⼀直切到下标为 b 的⾏

2、列切⽚

688IT编程网

Python之Pandas模块入门讲解及案例

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python之Pandas模块入门讲解及案例

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式