如何使用 Pandas 进行数据读取?
步骤 1:导入 pandas 库
import pandas as pd
步骤 2:读取数据
# 读取 CSV 文件
data = pd.read_csv("your_file.csv")
# 读取 JSON 文件
data = pd.read_json("your_file.json")
# 读取 HTML 文件
data = pd.read_html("your_file.html")
步骤 3:查看读取的数据
# 打印第一行
print(data.head())
# 打印所有数据类型
print(data.dtypes)
# 打印数据行数
print(data.shape[0])
步骤 4:进行数据处理
# 过滤数据
data_filtered = data[data["column_name"] > 10]
# 合并数据
data_merged = pd.merge(data, data_filtered, on="id")
# 统计数据
data_stats = data.describe()
示例:
import pandas as pd
# 读取 CSV 文件
data = pd.read_csv("data.csv")
# 打印第一行
print(data.head())
# 打印所有数据类型
print(data.dtypes)
# 打印数据行数
print(data.shape[0])
# 过滤数据
data_filtered = data[data["age"] > 25]
# 合并数据
data_merged = pd.merge(data, data_filtered, on="id")
# 统计数据
data_stats = data.describe()
# 打印统计结果
print(data_stats)
注意:
- 您可以使用各种参数来控制读取数据的选项,例如:
-
header
:指定第一行作为列名 -
index_col
:指定索引列名 -
usecols
:指定要读取的列名 -
skiprows
:指定跳过的行数 -
nrows
:指定读取的行数
-