python使⽤教程pandas-⼗分钟搞定pandas(⼊门教程)本⽂是对pandas官⽅⽹站上《10Minutes to pandas》的⼀个简单的翻译,原⽂在这⾥。这篇⽂章是对pandas的⼀个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下⾯格式引⼊所需要的包:
revolve美国⼀、创建对象
可以通过Data Structure Intro Setion 来查看有关该节内容的详细信息。
1、可以通过传递⼀个list对象来创建⼀个Series,pandas会默认创建整型索引:
2、通过传递⼀个numpyarray,时间索引以及列标签来创建⼀个DataFrame:
3、通过传递⼀个能够被转换成类似序列结构的字典对象来创建⼀个DataFrame:
4、查看不同列的数据类型:
5、如果你使⽤的是IPython,使⽤Tab⾃动补全功能会⾃动识别所有的属性以及⾃定义的列,下图中是所有能够被⾃动识别的属性的⼀个⼦集:
⼆、查看数据
详情请参阅:Basics Section
1、 查看frame中头部和尾部的⾏:
2、 显⽰索引、列和底层的numpy数据:
3、 describe()函数对于数据的快速统计汇总:
4、 对数据的转置:
5、 按轴进⾏排序
6、 按值进⾏排序
三、选择
虽然标准的Python/Numpy的选择和设置表达式都能够直接派上⽤场,但是作为⼯程使⽤的代码,我们推荐使⽤经过优化的pandas数据访问⽅式: .at,.iat,.loc,.iloc和.ix详情请参阅Indexingand Selecing Data 和 MultiIndex/ Advanced Indexing。
l 获取
1、 选择⼀个单独的列,这将会返回⼀个Series,等同于df.A:
2、 通过[]进⾏选择,这将会对⾏进⾏切⽚
l 通过标签选择
1、 使⽤标签来获取⼀个交叉的区域
2、 通过标签来在多个轴上进⾏选择
3、 标签切⽚
4、 对于返回的对象进⾏维度缩减
5、 获取⼀个标量
6、 快速访问⼀个标量(与上⼀个⽅法等价)
l 通过位置选择
1、 通过传递数值进⾏位置选择(选择的是⾏)
2、 通过数值进⾏切⽚,与numpy/python中的情况类似
3、 通过指定⼀个位置的列表,与numpy/python中的情况类似
4、 对⾏进⾏切⽚
5、 对列进⾏切⽚
dos命令切换目录6、 获取特定的值
l 布尔索引
1、 使⽤⼀个单独列的值来选择数据:
fwrite与fread区别2、 使⽤where操作来选择数据:
3、 使⽤isin()⽅法来过滤:
l 设置
1、 设置⼀个新的列:
2、 通过标签设置新的值:
3、 通过位置设置新的值:
4、 通过⼀个numpy数组设置⼀组新值:
上述操作结果如下:特效软件推荐
5、 通过where操作来设置新的值:
oracle数据库安装要求
四、缺失值处理
在pandas中,使⽤np.nan来代替缺失值,这些值将默认不会包含在计算中,详情请参阅:Missing Data Section。
1、 reindex()⽅法可以对指定轴上的索引进⾏改变/增加/删除操作,这将返回原始数据的⼀个拷贝:、
京东python入门教程2、 去掉包含缺失值的⾏:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论