📜  Pandas – 数据帧上的 Groupby 值计数(1)

📅  最后修改于: 2023-12-03 15:03:28.742000             🧑  作者: Mango

Pandas – 数据帧上的 Groupby 值计数

在数据分析和数据处理中经常需要对数据进行分组并计算每个组中某个特定值的出现次数。Pandas提供了一种方便的方式来实现这一目标,即通过数据帧上的Groupby值计数功能。

1. 引入库和数据

首先,我们需要导入Pandas库以及要处理的数据。

import pandas as pd

# 创建一个示例数据
data = {'Name': ['John', 'Sam', 'John', 'John', 'Sam', 'Emma'],
        'Age': [25, 30, 27, 25, 32, 29],
        'City': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles', 'Chicago']}
df = pd.DataFrame(data)
2. 使用Groupby进行分组计数

接下来,我们可以使用Groupby对数据进行分组,并计算每个组中某个特定值的出现次数。

# 对姓名(Name)进行分组计数
name_count = df.groupby('Name').size()

# 对城市(City)进行分组计数
city_count = df.groupby('City').size()
3. 查看计数结果

最后,我们可以打印计数结果,以便查看每个组中特定值的出现次数。

print("Name Count:")
print(name_count)

print("\nCity Count:")
print(city_count)

输出结果如下所示:

Name Count:
Name
Emma    1
John    3
Sam     2
dtype: int64

City Count:
City
Chicago        2
Los Angeles    2
New York       2
dtype: int64
总结

通过使用Pandas的Groupby功能,我们可以快速方便地对数据进行分组,并计算每个组中某个特定值的出现次数。这对于数据分析和数据处理非常有用。希望本文能够帮助你更好地理解和使用Pandas的Groupby值计数功能。