pandas中对dataframe数据类型转换
Pandas是一种广泛使用的Python数据操作库,在数据分析和数据科学中经常用于数据清洗和转换。在Pandas中,有许多方法用于对DataFrame数据类型进行转换。
一、将字符串转换为数字
有时,我们需要将字符串类型的数据转换为数字类型。可以使用“astype”方法将其转换。例如:
```
import pandas as pd
data = {'A': ['1', '2', '3'], 'B': ['4', '5', '6'], 'C': ['7', '8', '9']}
df = pd.DataFrame(data)
df['A'] = df['A'].astype(int)
df['B'] = pd.to_numeric(df['B'])
df['C'] = pd.to_numeric(df['C'], errors='coerce')
print(df.dtypes)
```
“astype”方法将“A”列转换为整数类型,而“to_numeric”方法将“B”和“C”列转换为数字类型。请注意,对于“C”列,“to_numeric”方法将无法将“X”值转换为数字,因此我们将其设置为“coerce”以将其转换为NaN值。
二、将数字转换为字符串
我们可以使用“astype”方法将数字类型转换为字符串类型。例如:
```
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
df['A'] = df['A'].astype(str)
df['B'] = df['B'].apply(str)
df['C'] = df['C'].map(str)
print(df.dtypes)
```
“astype”方法将“A”列转换为字符串类型,而“apply”和“map”方法将“B”和“C”列转换为字符串类型。
三、将日期转换为日期时间
我们可以使用“to_datetime”方法将日期类型转换为日期时间类型。例如:
```
import pandas as pd
data = {'date': ['2021-01-01', '2021-02-01', '2021-03-01']}
df = pd.DataFrame(data)
df['date'] = pd.to_datetime(df['date'])
print(df.dtypes)
string转date的方法 ```
“to_datetime”方法将“date”列转换为日期时间类型。
四、将数据类型转换为分类类型
如果我们有大量不同的值,可以使用“astype”方法将数据类型转换为分类类型。例如:
```
import pandas as pd
data = {'A': ['apple', 'banana', 'orange', 'apple', 'banana', 'apple']}
df = pd.DataFrame(data)
df['A'] = df['A'].astype('category')
print(df.dtypes)
```
“astype”方法将“A”列转换为分类类型。
以上是Pandas中常用的一些数据类型转换方法,可以帮助我们更好地操作数据。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论