📌  相关文章
📜  计算 pandas 列中的元素 - Python (1)

📅  最后修改于: 2023-12-03 15:11:59.563000             🧑  作者: Mango

计算 pandas 列中的元素 - Python

在数据科学中,Pandas 是一个非常流行的 Python 库,用于数据处理和数据分析。它提供了 DataFrame 和 Series 这两个非常有用的数据结构,这些结构允许您轻松地处理和分析数据。在本篇文章中,我们将讨论如何计算 Pandas 列中的元素。

什么是 Pandas 列?

在 Pandas 中,一个列是一个 Series,每个元素都有唯一的索引标签。 它类似于表中的一列或 SQL 中的一个字段。

计算 Pandas 列中的元素

在 Pandas 中,您可以对列执行多种计算。 下面是一些示例:

1.计算平均值

您可以使用 mean() 函数计算 Pandas 列的平均值。

import pandas as pd

# 创建一个 DataFrame
data = {'age': [20, 35, 22, 25, 27],
        'salary': [20000, 35000, 22000, 25000, 27000]}
df = pd.DataFrame(data)

# 计算 salary 列的平均值
mean_salary = df['salary'].mean()

print("平均薪资为:", mean_salary)

输出:

平均薪资为: 25800.0
2.计算中位数

使用 median() 函数计算 Pandas 列的中位数。

import pandas as pd

# 创建一个 DataFrame
data = {'age': [20, 35, 22, 25, 27],
        'salary': [20000, 35000, 22000, 25000, 27000]}
df = pd.DataFrame(data)

# 计算 salary 列的中位数
median_salary = df['salary'].median()

print("薪资中位数为:", median_salary)

输出:

薪资中位数为: 25000.0
3.计算最小值和最大值

您可以使用 min() 和 max() 函数计算 Pandas 列的最小值和最大值。

import pandas as pd

# 创建一个 DataFrame
data = {'age': [20, 35, 22, 25, 27],
        'salary': [20000, 35000, 22000, 25000, 27000]}
df = pd.DataFrame(data)

# 计算 salary 列的最小值和最大值
min_salary = df['salary'].min()
max_salary = df['salary'].max()

print("最小薪资为:", min_salary)
print("最大薪资为:", max_salary)

输出:

最小薪资为: 20000
最大薪资为: 35000
4.计算标准偏差和方差

您可以使用 std() 和 var() 函数计算 Pandas 列的标准偏差和方差。

import pandas as pd

# 创建一个 DataFrame
data = {'age': [20, 35, 22, 25, 27],
        'salary': [20000, 35000, 22000, 25000, 27000]}
df = pd.DataFrame(data)

# 计算 salary 列的标准偏差和方差
std_salary = df['salary'].std()
var_salary = df['salary'].var()

print("薪资的标准偏差为:", std_salary)
print("薪资的方差为:", var_salary)

输出:

薪资的标准偏差为: 6240.150657229051
薪资的方差为: 38920000.0
结论

在 Pandas 中,您可以使用多种函数对列进行计算。您可以计算平均值,中位数,最小值和最大值,标准偏差和方差。这些功能使得数据分析变得容易,方便。