📜  标准差python(1)

📅  最后修改于: 2023-12-03 15:40:26.820000             🧑  作者: Mango

标准差

标准差是衡量一组数据离散程度的指标,通常用来度量数据分散的程度。在统计分析中,标准差一般是指样本标准差。

标准差的公式如下:

$$s = \sqrt{\frac{\sum_{i=1}^n(x_i-\overline{x})^2}{n-1}}$$

其中,$x_i$ 表示第 $i$ 个数据点,$\overline{x}$ 表示这些数据的均值,$n$ 表示数据的数量。

在 Python 统计分析中,我们可以使用 NumPy 库中的 std() 函数来计算样本标准差。

import numpy as np

data = [1, 2, 3, 4, 5]
std = np.std(data)
print(std)

上述代码将输出这组数据的样本标准差。

我们也可以对一个矩阵进行标准差计算:

data = [[1, 2], [3, 4], [5, 6]]

# 按行计算标准差
std = np.std(data, axis=0)
print(std)

# 按列计算标准差
std = np.std(data, axis=1)
print(std)

我们还可以使用 Pandas 库中的 std() 函数来计算标准差。Pandas 库支持对数据框、Series 等进行标准差计算。例如,我们可以对一个 DataFrame 进行标准差计算:

import pandas as pd

data = {
    'apples': [1, 2, 3, 4, 5],
    'oranges': [2, 4, 6, 8, 10]
}

df = pd.DataFrame(data)
std = df.std()
print(std)

上述代码将输出这个 DataFrame 的标准差。我们还可以指定 axis 参数对行或列进行标准差计算。

标准差是统计分析中常用的指标之一。Python 中 NumPy 和 Pandas 等库提供了方便的函数来计算标准差,使用起来简单方便。