統計学 – 幾何分布

目次

概要

離散確率分布の1つである幾何分布について解説します。

確率関数

確率変数 $X$ が次のような確率関数をもつとき、$X$ はパラメータ $p$ の幾何分布 (geometric distribution) に従うという。

$$ f_X(x) = \begin{cases} p (1 – p)^x & x = 0, 1, \cdots \\ 0 & その他の場合 \end{cases} $$

ただし、$0 < p < 1$

負の二項分布との関係

幾何分布は負の二項分布において、$r = 1$ とした場合である。

累積確率関数

$$ P(X \le x) = \sum_{k = 0}^{\lfloor x \rfloor} p (1 – p)^x $$

期待値

$$ \begin{aligned} E[X] = \frac{1 – p}{p} \end{aligned} $$

分散

$$ \begin{aligned} Var[X] = \frac{1 – p}{p^2} \end{aligned} $$

積率母関数

$0 < e^{t} (1 – p) < 1$ のとき、

$$ \begin{aligned} m_X(t) &= E[e^{tX}] \\ &= \frac{p}{1 – (1 – p) e^t} \end{aligned} $$

再生性

$X_1, X_2, \cdots, X_n$ が独立で同一なパラメータ $p$ の幾何分布に従うとき、 $S = X_1 + X_2 + \cdots + X_n$ はパラメータ $n, p$ の幾何分布に従う。

scipy.stats の幾何分布

scipy.stats.geom で幾何分布に従う確率変数を作成できます。

In [1]:
import numpy as np
import seaborn as sns
from matplotlib import pyplot as plt
from scipy.stats import geom

sns.set(style="white")

X = geom(p=0.5)

サンプリング

In [2]:
x = X.rvs(size=10)
print(x)
[2 3 2 3 1 1 2 4 1 2]

確率質量関数

In [3]:
x = np.arange(1, 21)
y = X.pmf(x)

fig, ax = plt.subplots()
ax.stem(x, y, use_line_collection=True)
ax.grid()

plt.show()

累積分布関数

In [4]:
x = np.arange(1, 21)
y = X.cdf(x)

fig, ax = plt.subplots()
ax.step(x, y)
ax.grid()

plt.show()

統計量

In [5]:
print("mean", X.mean())
print("var", X.var())
print("std", X.std())
mean 2.0
var 2.0
std 1.4142135623730951

コメント

コメントする

目次