python数据清洗实例--688IT编程网

python数据清洗实例

企业处理数据是一种常见的日常工作，但它不容易。在过去的几年中，这项工作变得更加复杂，因为传入数据变得越来越复杂，变化也越来越快。要从各种不同的数据源中提取信息，并将其整理为清洗过的、可以用于更好的分析的数据，就需要我们使用python来完成。以下是用python完成数据清洗任务的实用实例：

* 首先，可以使用pandas库读取数据源：

```Python

import pandas as pd

# 读取csv文件

df = pd.read_csv('Data.csv')

# 读取excel文件

df = pd.read_excel('Data.xls')

# 读取关系数据库

from sqlalchemy import *

engine = create_engine('mssql+pyodbc://username:x.xxx:1433/Database?driver=SQL Server')

sql = 'SELECT * FROM TableName'

df = pd.read_sql(sql, engine)

```

* 接下来，可以使用pandas.DataFrame.describe()方法检查数据：

```Python

df.describe()

```

* 接下来，可以使用pandas.DataFrame.isnull()方法检查缺失的数据：

```Python

python怎么读取xls文件df.isnull() # 检查df里的数据是否为空

```

* 然后，可以使用pandas.DataFrame.fillna()方法将缺失的数据填充上：

```Python

# 用0填充每一行缺失的数据

df = df.fillna(0)

# 将每一行缺失值(NaN)用中位数填充

df = df.dian())

```

* 最后，使用pandas.DataFrame.drop_duplicates()方法来去除重复行：

```Python

# 删除重复行

df = df.drop_duplicates()

```

发表评论

688IT编程网

python数据清洗实例

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

python数据清洗实例

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行