python pandas常用方法
以下是Python Pandas库中的一些常用方法:
1. 创建DataFrame:可以通过传入list、ndarray、字典等数据创建DataFrame。
- pd.DataFrame(data, index, columns)
- pd.read_csv(file_path)
- pd.read_excel(file_path)
2. 查看数据:可以使用以下方法查看DataFrame的内容。
- df.head(n):查看前n行数据,默认为前5行。
- df.tail(n):查看后n行数据,默认为后5行。
- df.shape:查看DataFrame的维度。
- df.columns:查看DataFrame的列名。
- df.describe():查看DataFrame的统计摘要信息。
python index函数3. 选择数据:可以使用以下方法选择DataFrame中的数据。
- df[column_name]:选择指定列的数据,返回Series对象。
- df.loc[row_index, column_name]:选择指定行和列的数据,返回Series对象或DataFrame对象。
- df.iloc[row_index, column_index]:选择指定行和列的数据,使用整数索引,返回Series对象或DataFrame对象。
- df[condition]:选择满足给定条件的数据,返回DataFrame对象。
4. 过滤数据:使用布尔条件过滤数据。
- df[df[column_name] > value]:选择指定列中大于value的数据。
- df[df[column_name].isin(list)]:选择指定列中包含在list中的数据。
5. 排序数据:可以按照指定的列对数据进行排序。
- df.sort_values(by):按照指定列的值进行排序。
- df.sort_index():按照索引进行排序。
6. 缺失值处理:可以对缺失值进行处理。
- df.dropna():删除包含缺失值的行。
- df.fillna(value):将缺失值填充为指定的值。
7. 数据合并:可以将多个DataFrame合并为一个。
- pd.concat([df1, df2]):按照行方向合并DataFrame。
- pd.merge(df1, df2, on=column_name):按照列指定的相同值进行合并。
8. 分组和聚合:可以对DataFrame进行分组聚合操作。
- df.groupby(column_name).size():按照指定列进行分组,并计算每组数据的数量。
- df.groupby(column_name).mean():按照指定列进行分组,并计算每组数据的平均值。
以上只是Python Pandas库中的一些常用方法,还有很多其他方法可以根据具体需求进行使用。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论