如何使用 Pandas 进行数据合并?
步骤:
- 导入 pandas 库
import pandas as pd
- 读取数据
# 读取 CSV 文件
data = pd.read_csv("your_file.csv")
# 读取 JSON 文件
data = pd.read_json("your_file.json")
- 合并数据
# 使用 merge 函数合并数据
merged_data = data.merge(data, on="id")
# 使用 concat 函数合并数据
concat_data = pd.concat([data, data], axis=1)
- 查看合并后的数据
# 打印合并后的数据
print(merged_data)
示例:
假设您有一个名为 data.csv
的 CSV 文件和一个名为 data.json
的 JSON 文件,您可以使用以下代码进行数据合并:
import pandas as pd
# 读取 CSV 文件
data = pd.read_csv("data.csv")
# 读取 JSON 文件
data = pd.read_json("data.json")
# 合并数据
merged_data = data.merge(data, on="id")
# 打印合并后的数据
print(merged_data)
结果:
id name age city
0 1 John 25 New York
1 2 Mary 30 London
2 3 Bob 45 Paris
注意:
-
on
参数用于指定合并的键。 -
how
参数指定合并的类型。默认值为inner
,表示仅合并与源数据相同的键。 -
axis
参数指定数据合并的轴。默认值为 1,表示按行合并。