统计-伽马分布(1) - 芒果文档

📌 相关文章

📜 统计-伽马分布(1)

📅 最后修改于: 2023-12-03 15:11:41.308000 🧑 作者: Mango

统计学中的伽马分布

伽马分布被广泛应用于统计学和概率论中，用于建模许多自然现象，如寿命的分布，财富分布以及风险分析等等。在本文中，我们将介绍伽马分布的基本概念和性质，以及Python中如何使用Scipy库计算伽马分布的各种统计量和绘制伽马分布的图形。

伽马分布的定义

伽马分布是指具有以下概率密度函数的连续概率分布：

$$ f(x; k, \theta) = \frac{1}{\theta^k \Gamma(k)}x^{k-1}e^{-\frac{x}{\theta}} $$

其中，$x \ge 0$，$k > 0$，$\theta > 0$，$\Gamma(k)$是Euler-Gamma函数。随机变量 $X$ 符合伽马分布，记作 $X \sim Gamma(k, \theta)$。

伽马分布的性质

伽马分布具有以下主要性质：

期望：$E[X] = k\theta$
方差：$Var[X] = k\theta^{2}$
矩生成函数：$M(t) = (1 - \theta t)^{-k}$
次序统计量：如果 $X_1, X_2, ..., X_n$ 是互不相关的，具有相同的伽马分布 $X \sim Gamma(k, \theta)$，那么 $\min{X_1, X_2, ..., X_n} \sim Gamma(nk, \theta)$。

Scipy中的伽马分布

在Python中，我们可以使用Scipy库计算伽马分布的各种统计量，并绘制伽马分布图形。首先，我们需要导入Scipy库：

import scipy.stats as stats

Scipy中的伽马分布对象是gamma，我们可以创建一个gamma对象来处理伽马分布相关的计算和分析。例如，我们可以创建一个 $X \sim Gamma(5, 2)$ 的伽马分布对象：

X = stats.gamma(a=5, scale=2)

其中，参数a和scale分别对应伽马分布的 $k$ 和 $\theta$，也可以使用参数loc来指定分布的起始位置。

我们可以使用pdf方法计算伽马分布的概率密度函数（pdf）值。例如，我们可以计算 $X=3$ 时，密度函数的值：

X.pdf(3)

我们还可以使用cdf方法计算伽马分布的累积分布函数（cdf）值。例如，我们可以计算 $X \leq 3$ 的概率：

X.cdf(3)

我们可以使用mean、var和std方法计算伽马分布的期望、方差和标准差。例如，我们可以计算 $X \sim Gamma(5, 2)$ 的期望：

X.mean()

我们可以使用rvs方法生成符合伽马分布的随机变量。例如，我们可以生成 10 个 $X \sim Gamma(5, 2)$ 的样本：

X.rvs(size=10)

我们可以使用fit方法估计拟合伽马分布的参数。例如，我们可以使用MLE方法估计一组数据是否符合伽马分布：

data = [3.1, 1.5, 4.2, 6.5, 2.3, 5.6, 3.8, 1.9, 7.2, 2.8]
stats.gamma.fit(data)

最后，我们可以使用Matplotlib库绘制伽马分布的概率密度函数图和累积分布函数图。例如，我们可以绘制 $X \sim Gamma(5, 2)$ 的概率密度函数图：

import matplotlib.pyplot as plt

fig, ax = plt.subplots(1, 1)
x = np.linspace(0, 25, 100)
ax.plot(x, X.pdf(x), 'r-', lw=2, label='gamma pdf')
ax.legend(loc='best', frameon=False)
plt.show()

截图：

gamma_pdf

我们也可以绘制 $X \sim Gamma(5, 2)$ 的累积分布函数图：

fig, ax = plt.subplots(1, 1)
ax.plot(x, X.cdf(x), 'r-', lw=2, label='gamma cdf')
ax.legend(loc='best', frameon=False)
plt.show()

截图：

gamma_cdf

以上就是关于统计学中伽马分布的介绍和Scipy库的应用，希望本文能为读者理解和应用伽马分布提供帮助。