📌  相关文章
📜  pandas 计算列中唯一值的数量 - Python (1)

📅  最后修改于: 2023-12-03 14:45:04.685000             🧑  作者: Mango

Pandas 计算列中唯一值的数量 - Python

在 Pandas 中,我们可以方便地计算列中唯一值的数量。本文将介绍如何使用 Pandas 计算列中唯一值的数量。

准备数据

我们将使用以下数据作为示例:

import pandas as pd

data = {
    'id': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'name': ['John', 'Jane', 'John', 'John', 'Kate', 'Kate', 'Jane', 'Jane', 'John', 'Kate'],
    'age': [25, 27, 24, 22, 28, 26, 24, 26, 25, 27]
}

df = pd.DataFrame(data)
使用 value_counts() 方法计算唯一值的数量

我们可以使用 value_counts() 方法计算列中每个唯一值的数量。例如,计算名字列中每个唯一值的数量:

name_counts = df['name'].value_counts()

print(name_counts)

输出:

John    4
Kate    3
Jane    3
Name: name, dtype: int64

这意味着在名字列中,John 出现了 4 次,Kate 和 Jane 出现了 3 次。

使用 unique() 方法计算唯一值的数量

我们也可以使用 unique() 方法计算列中唯一值的数量。例如,计算名字列中的唯一值:

unique_names = df['name'].unique()

print(unique_names)

输出:

['John' 'Jane' 'Kate']

这意味着在名字列中,有三个唯一值:John、Jane 和 Kate。

要计算每个唯一值在列中出现的次数,我们可以使用 value_counts() 方法和 unique() 方法组合:

unique_name_counts = df['name'].value_counts()

print(unique_name_counts)

输出:

John    4
Kate    3
Jane    3
Name: name, dtype: int64

这意味着在名字列中,John 出现了 4 次,Kate 和 Jane 出现了 3 次。

使用 nunique() 方法计算唯一值的数量

我们还可以使用 nunique() 方法计算列中唯一值的数量。例如,计算名字列中的唯一值数量:

unique_name_count = df['name'].nunique()

print(unique_name_count)

输出:

3

这意味着在名字列中,有三个唯一值:John、Jane 和 Kate。

注意,与 value_counts() 方法和 unique() 方法不同的是,nunique() 方法返回的是唯一值数量的整数,而不是一个 Series 对象。

结论

在 Pandas 中,我们可以使用 value_counts() 方法、unique() 方法和 nunique() 方法计算列中唯一值的数量。这些方法可以帮助我们快速了解数据中的唯一值的分布。