📜  Python| Pandas Series.mad() 计算系列的平均绝对偏差(1)

📅  最后修改于: 2023-12-03 15:34:16.322000             🧑  作者: Mango

Python | Pandas Series.mad() 计算系列的平均绝对偏差

介绍

在统计学中,“平均绝对偏差”(Mean Absolute Deviation,简称 MAD)是一种测量数据集中值离其平均值的平均距离程度的方法。Pandas 中的 Series.mad() 方法可以计算给定 Series 对象的平均绝对偏差。

语法

Series.mad(axis=None, skipna=None, level=None)

参数说明:

  • axis:0 或 'index' 表示行操作(default),1 或 'columns' 表示列操作。
  • skipna:是否排除缺失值。默认值为 True。
  • level:对于多级索引,则指定在哪个级别进行操作。
例子

以下是使用 Python 和 Pandas 计算给定数据的平均绝对偏差的例子:

import pandas as pd

# 创建 Series
data = pd.Series([2, 4, 6, 8, 10])

# 计算平均绝对偏差
mad = data.mad()

print("数据:", data.tolist())
print("平均绝对偏差:", mad)

输出:

数据: [2, 4, 6, 8, 10]
平均绝对偏差: 2.8
注意事项
  1. 平均绝对偏差是平均距离,因此它不是有正负之分的,即 MAD 的值总是非负的。
  2. Series.mad() 方法默认会排除缺失值,因此如果要包括缺失值,需要将 skipna 参数设置为 False
  3. 如果 Series 包含多级索引,则需要通过 level 参数指定对哪个索引级别进行计算。
  4. Series.mad() 方法还可以接受一个 DataFrame 对象进行计算,此时返回的是每列的平均绝对偏差。