如何使用 Pandas 进行数据转换?
步骤:
- 导入 Pandas 库
import pandas as pd
- 读取数据文件
# 示例:读取名为 "data.csv" 的 CSV 文件
data = pd.read_csv("data.csv")
- 数据转换
# 将字符串类型的数据转换为数字类型
data["age"] = data["age"].astype(int)
# 将数值型的数据转换为字符串类型
data["salary"] = data["salary"].astype(str)
# 合并两个数据框
data_merged = pd.merge(data1, data2, on="id")
- 输出转换后的数据
# 打印转换后的数据
print(data_merged)
示例:
原始数据文件 (data.csv):
id,name,age,salary
1,John,30,50000
2,Mary,25,60000
3,Bob,40,70000
使用 Pandas 进行数据转换后的结果:
id name age salary
0 1 John 30 50000
1 2 Mary 25 60000
2 3 Bob 40 70000
其他功能:
- **数据清洗:**使用 pandas.DataFrame.dropna() 和 pandas.DataFrame.fillna() 等方法进行数据清洗。
- **数据筛选:**使用 pandas.DataFrame.loc[] 和 pandas.DataFrame.iloc[] 等方法进行数据筛选。
- **数据分组:**使用 pandas.DataFrame.groupby() 和 pandas.DataFrame.agg() 等方法进行数据分组和聚合。