如何使用 Pandas 进行数据读取?

如何使用 Pandas 进行数据读取?

步骤 1:导入 pandas 库

import pandas as pd

步骤 2:读取数据

# 读取 CSV 文件
data = pd.read_csv("your_file.csv")

# 读取 JSON 文件
data = pd.read_json("your_file.json")

# 读取 HTML 文件
data = pd.read_html("your_file.html")

步骤 3:查看读取的数据

# 打印第一行
print(data.head())

# 打印所有数据类型
print(data.dtypes)

# 打印数据行数
print(data.shape[0])

步骤 4:进行数据处理

# 过滤数据
data_filtered = data[data["column_name"] > 10]

# 合并数据
data_merged = pd.merge(data, data_filtered, on="id")

# 统计数据
data_stats = data.describe()

示例:

import pandas as pd

# 读取 CSV 文件
data = pd.read_csv("data.csv")

# 打印第一行
print(data.head())

# 打印所有数据类型
print(data.dtypes)

# 打印数据行数
print(data.shape[0])

# 过滤数据
data_filtered = data[data["age"] > 25]

# 合并数据
data_merged = pd.merge(data, data_filtered, on="id")

# 统计数据
data_stats = data.describe()

# 打印统计结果
print(data_stats)

注意:

  • 您可以使用各种参数来控制读取数据的选项,例如:
    • header:指定第一行作为列名
    • index_col:指定索引列名
    • usecols:指定要读取的列名
    • skiprows:指定跳过的行数
    • nrows:指定读取的行数
相似内容
更多>