Python——pandas模块—Series数据结构Python——pandas模块—Series数据结构
Python——pandas模块—Series数据结构
pandas
Numpy更适合处理统⼀的数值数组数据
pandas是专门为处理表格和混杂数据设计的
panda有两种数据结构:
1. Series
2. DataFrame
Series
1. Series数据类型能够保存 任何类型的数据(整数,字符串,浮点数,Python对象等)的⼀维标记数组轴标签统称为索引,每个元素
都带有⼀个索引
2. Series表现形式:索引在左边,值在右边
3. 可以通过Series的属性:
index ——获取——索引列
values——获取——数据列
可以这样想:每⼀个元素可以类似的看成⼀个字典,整个Series可以类似的看成⼀个⼆维数组
如图:
创建Series
没有指定索引列时,⾃动创建:0~~(N-1)(N:数组长度)的整数型索引
import pandas as pd
#通过传⼊⼀个列表⽤Series函数创建
obj = pd.Series([4,7,-5,3])
print('创建的Series对象为')
print(obj)
⾃动添加整数索引 0~~4(数组长度为4)
指定索引列index(数字,字符串)这点与数组不同,数组中的元素类型要相同#指定索引列创建Series对象
obj = pd.Series([4,2,-5,3],index=[2,1,1,'r_4'])
print('指定索引列创建Series对象')
print(obj)
使⽤列表、数组构建Series
lis =[1,2,3,4,5,6,7]
array = np.arange(7)
Series_lis = pd.Series(lis)
Series_array = pd.Series(array)
print('通过列表创建的Series')
print(Series_lis)
print('通过数组创建的Series')
print(Series_array)
同样,还是⾃动添加索引列
通过字典/字典对象的⽅式创建Series
不同的是,在字典⾥的key不可重复
但是在Series中index是可以重复的
#创建⼀个字典对象⽅式
dic =dict(zip(lis,array))
#zip打包zip(lis,array)操作之后形成⼀个元组列表Series_dict = pd.Series(dic)
print('通过字典对象创建的Series对象:')
print(Series_dict)
#直接传⼊字典⽅式
Series_dict2 = pd.Series({'a':1,'b':2,'c':3,'d':4}) print('直接传⼊字典的⽅式创建的Series')
print(Series_dict2)
访问Sreies
再来看⼀个字典构建Series实例
dic ={'Ohio':35000,'Texas':71000,'Oregon':16000,'Utah':5000} a = pd.Series(dic)
print(a)
Series.head()从前访问
默认访问前5个元素
print(a.head(2))
Series.tail()从后访问
默认访问后5个元素
print(a.tail(2))
Sreies.index查看索引列
print(a.index)
Sreies.values查看数据列
print(a.values)
Series.dtype查看数据类型
print(a.dtype)
Series的使⽤
使⽤⼀个Series创建另⼀个Series
上⾯我们创建了⼀个Series对象a
python获取数组长度
接下来,我们⽤a创建另⼀个Series对象
'''字典构建Serise实例'''
dic ={'Ohio':35000,'Texas':71000,'Oregon':16000,'Utah':5000}
a = pd.Series(dic)
b = pd.Series(a,index=['California','Ohio','Oregon','Texas'])
print('通过⼀个对象构建的Series对象:')
print(b)
创建的时候,新的对象的索引列为传⼊的index
样板对象有的index直接取其value
样板对象没有的index,添加进去,value值设为缺失值NaN
缺失值检测
返回的是⼀个 数据列为bool型的对象
True:缺失值
False:不是缺失值
#缺失值检测
print('缺失值检测')
print(pd.isnull(b))

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。