📜  pandas 查找列的基本统计信息 - Python (1)

📅  最后修改于: 2023-12-03 14:45:04.449000             🧑  作者: Mango

Pandas 查找列的基本统计信息 - Python

在数据分析与机器学习中,对数据进行探索性分析是非常重要的。一份数据的描述性统计信息能够告诉我们该数据的基本情况,这在实际场景中也是经常使用的。

Pandas 提供了许多函数来查找列的基本统计信息,包括列的数量、类型、缺失值等等。在本文中,我们将讨论如何使用 Pandas 查找列的基本统计信息。

导入库

首先,我们需要导入 Pandas 库来使用其提供的函数。

import pandas as pd
读取数据

读取数据通常是我们数据分析中的第一步。我们可以使用 Pandas 中的 read_csv 函数来读取 csv 格式的数据。示例如下:

data = pd.read_csv('data.csv')
查看数据的基本信息

读取数据后,我们可以使用以下函数来查看数据的基本信息:

  • shape:该数据框的行数和列数。
  • info:该数据框的基本信息,包括每个列的名称,非空值的数量,数据类型等等。
  • describe:该数据框的描述性统计信息,包括每个列的数量、均值、标准差等等。

示例如下:

# 打印数据框的形状
print("数据框的形状:", data.shape)

# 打印数据框的基本信息
print("数据框的基本信息:")
data.info()

# 打印数据框的描述性统计信息
print("数据框的描述性统计信息:")
data.describe()
查看列的基本信息

在查看数据的基本信息后,我们可以使用以下函数来查看列的基本信息:

  • columns:列名。
  • dtypes:每个列的数据类型。
  • isnull:每个元素是否缺失。
  • sum:每个列中缺失值的数量。

示例如下:

# 打印列名
print("列名:", data.columns)

# 打印每个列的数据类型
print("每个列的数据类型:")
print(data.dtypes)

# 打印每个元素是否缺失
print("每个元素是否缺失:")
print(data.isnull())

# 打印每个列中缺失值的数量
print("每个列中缺失值的数量:")
print(data.isnull().sum())

以上就是使用 Pandas 查找列的基本统计信息的方法,使用这些方法可以帮助我们更好地了解数据。