📜  使用 Pandas 计算每组的唯一值(1)

📅  最后修改于: 2023-12-03 14:49:44.658000             🧑  作者: Mango

使用 Pandas 计算每组的唯一值

在 Pandas 中,我们可以使用 groupby() 函数对数据进行分组,并应用各种函数来计算每个组的唯一值。

以下是如何使用 Pandas 计算每组的唯一值的步骤:

  1. 导入 Pandas 库
import pandas as pd
  1. 创建样本数据
data = {'group': ['A', 'A', 'B', 'B', 'C', 'C'], 
        'value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)

这将创建一个包含两列的 DataFrame 对象,其中 group 表示数据分组的类别,value 表示每个数据点的值。

  1. 对数据进行分组并计算唯一值
unique_values = df.groupby('group')['value'].unique()

在此示例中,我们使用 groupby() 函数按 group 列对数据进行分组,然后使用 unique() 函数计算每个组的唯一值。

  1. 查看结果
print(unique_values)

输出结果将是一个 Pandas Series 对象,其中每个组的唯一值被存储在一个 array 中。

group
A       [1, 2]
B       [3, 4]
C       [5, 6]
Name: value, dtype: object

此示例演示了如何使用 Pandas 计算每组的唯一值。通过 groupby() 函数和其他 Pandas 函数(如 unique()sum()mean()count() 等),我们可以轻松对分组数据进行聚合和统计分析。