📜  如何在 pandas 中显示 csv - Python (1)

📅  最后修改于: 2023-12-03 15:08:44.045000             🧑  作者: Mango

如何在 pandas 中显示 csv - Python

Pandas 是一个常用的数据处理库,它可以读取各种格式的数据,并且提供了强大的数据操作和分析工具。在本文中,我们将介绍如何在 Pandas 中读取和显示 csv 文件。

读取 csv 文件

Pandas 提供了 read_csv 函数,可以读取 csv 文件并返回一个 DataFrame 对象。以下是一个基本的使用示例:

import pandas as pd

data = pd.read_csv('data.csv')
print(data.head())

read_csv 函数默认会将第一行作为列名,可以通过 header=None 参数关闭这个功能。如果 csv 文件中有缺失值,可以通过 na_values 参数指定它们的表示方式。

import pandas as pd

data = pd.read_csv('data.csv', header=None, na_values=['N/A'])
print(data.head())
显示 csv 数据

Pandas 的 DataFrame 对象提供了多种方式来展示数据。以下是一些常用的方法:

  • head():显示 DataFrame 的前几行,默认是前 5 行。
  • tail():显示 DataFrame 的后几行,默认是后 5 行。
  • sample():从 DataFrame 中随机抽取几行作为样本。
  • describe():对 DataFrame 中的每一个数值列进行基本的统计描述,如最大值、最小值、平均值等。
  • info():显示 DataFrame 的列名、列的数据类型以及缺失值的数量等信息。

以下是一个展示 csv 数据的示例:

import pandas as pd

data = pd.read_csv('data.csv')
print(data.head())  # 显示前 5 行数据
print(data.describe())  # 显示数值列的统计描述
修改 csv 数据

Pandas 的 DataFrame 对象支持多种修改方式,包括:

  • 修改值:可以通过 atiat 或者 lociloc 方法直接修改 DataFrame 中指定位置的数值。
  • 添加列:可以通过 assign 方法添加新的列。
  • 删除列:可以通过 drop 方法删除指定的列。

以下是一个修改 csv 数据的示例:

import pandas as pd

data = pd.read_csv('data.csv')
data.at[0, 'Name'] = 'Alice'  # 修改第 1 行 'Name' 列的值为 'Alice'
data = data.assign(Male=data['Sex'] == 'Male')  # 添加一个新的 'Male' 列
data = data.drop('Sex', axis=1)  # 删除原来的 'Sex' 列
print(data.head())
总结

本文介绍了如何在 Pandas 中读取和显示 csv 文件,并对如何修改 csv 数据进行了简单的介绍。读者可以通过进一步学习 Pandas 来掌握更多高级的数据操作和分析技巧。