Pythonpandas库DataFrame对象读取csv、txt⽂件的⽤法汇
总-如何跳过。。。
Python pandas库DataFrame对象读取csv⽂件的⽤法-如何跳过⽂件开头的⾏,如何指定列间分隔符,如何重新定义列的名称?
今天我们⽤例⼦说明⼀下个这个问题,现在有⼀个txt⽂件,内容如下,我们可以看到有⼏个特点:第⼀⾏数据是没有⽤的,数据使⽤两个空格进⾏分割的;数据是没有列名的,下⾯我们⼀步步的对数据进⾏处理:
1.默认配置读⼊⽂件
import pandas as pd
df = pd.read_csv('')
df
输出如下:
python怎么读文件夹下的文件夹
输出结果差强⼈意,只是第⼀⾏数据被当做列名。
2.跳过第⼀⾏数据,不进⾏读取,使⽤skiprows参数,这⾥后⾯可以单个数字,也可是⼀个list列表,实现跳过多⾏的⽬的。
df = pd.read_csv('',skiprows = 1)
输出结果如下:
可以看到已经跳过第⼀⾏了,但是这⾥数据的第⼀⾏,被当做了列名这不是我们想要的结果。可以设定数据没有列名,所有的都是数据。
3.设定dataframe读取的第⼀⾏为数据。使⽤header = None参数。
默认情况下header参数为header=0,即将第⼀⾏作为参数。
df = pd.read_csv('',skiprows = 1,header=None)
输出如下:
这⾥可以看到,数据读出是正常的了,但是好像出现⼀个问题。所有的数据被当成了⼀列来处理。如何解决这个问题呢?
4.指定数据列的分隔符,使⽤sep参数
df = pd.read_csv('',skiprows = 1,header=None,sep=' ')
输出结果看⼀下:
已经满⾜我们的需求了。这⾥有两点注意:1).列之间使⽤两个空格分隔,因此sep必须指明两个空格,否则会出现问题。2).不指定列名的时候,系统⾃动的⽤数字0,1,2,3作为列名。下⼀步我们就⼿动指定我们的列名。
5.指定列名,使⽤names参数。
df = pd.read_csv('',skiprows = 1,header=None,sep=' '\
,names=['A','B','C','D'])
输出结果如下:
好了,现在数据终于以我们想要的结果呈现了。
6.将某列设置为索引。
df = pd.read_csv('',skiprows = 1,header=None,sep=' '\
,names=['A','B','C','D'],index_col = ['A'])
使⽤index_col=‘列名’,达到设定列名的⽬的。输出结果如下:
7.只保留某⼏列,不保留不想要的⾏。例如,我们只想保留'C'列和‘D‘列。代码如下:
df = pd.read_csv('',skiprows = 1,header=None,sep=' '\
,names=['A','B','C','D'],index_col = ['A'])[['C','D']]
只要像在dataframe对象选取某列的操作相同,使⽤列表将需要筛选的列,取出即可。
好了,后续我还会继续补充dataframe在读取⽂件的相关问题。欢迎关注、点赞和交流^_^。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论