統計学 – 一様分布

目次

概要

連続確率分布の1つである一様分布について解説します。

確率密度関数

確率変数 $X$ が次のような確率密度関数をもつとき、$X$ は区間 $[a, b]$ の(連続)一様分布 (uniform distribution) に従うという。

$$ f_X(x) = \begin{cases} \frac{1}{b – a} & a \le x \le b \\ 0 & その他の場合 \end{cases} $$

確率密度関数である

$$ \int_{-\infty}^{\infty} \frac{1}{b – a} dt = \frac{1}{b – a} [t]^b_a dt = 1 $$

累積確率関数

$$ P(X \le x) = \int_{-\infty}^x \frac{1}{b – a} dt $$

$x < a$ の場合、$f_X(x) = 0$ なので、

$$ \int_{-\infty}^x \frac{1}{b – a} dt = 0 $$

$a \le x \le b$ の場合、

$$ \int_{-\infty}^x \frac{1}{b – a} dt = \int_a^x \frac{1}{b – a} dt = \frac{x – a}{b – a} $$

$x > b$ の場合、$f_X(x) = 0, (x < a, x > b)$ なので、

$$ \int_{-\infty}^x \frac{1}{b – a} dt = \int_a^b \frac{1}{b – a} dt = 1 $$

よって、

$$ P(X \le x) = \begin{cases} 0 & x < a \\ \frac{x – a}{b – a} & a \le x \le b \\ 1 & x > b \end{cases} $$

k 次積率

$$ \begin{aligned} E[X^k] &= \int_a^b x^k \frac{1}{b – a} dx \\ &= \frac{1}{b – a} \left[\frac{x^{k + 1}}{k + 1}\right]_a^b \\ &= \frac{1}{b – a} \frac{b^{k + 1} – a^{k + 1}}{k + 1} \end{aligned} $$

ここで、$b^k – a^k = (b – a) \sum_{i = 0}^{k – 1} a^i b^{k – 1 – i}$ を利用すると、

$$ \begin{aligned} \frac{1}{b – a} \frac{b^{k + 1} – a^{k + 1}}{k + 1} &= \frac{1}{k + 1} \frac{(b – a) \sum_{i = 0}^k a^i b^{k – i}}{b – a} \\ &= \frac{1}{k + 1} \sum_{i = 0}^k a^i b^{k – i} \end{aligned} $$

期待値

$k$ 次積率の結果より、

$$ \begin{aligned} E[X] = \frac{a + b}{2} \end{aligned} $$

分散

$k$ 次積率の結果より、

$$ E[X^2] = \frac{1}{3} (a^2 + ab + b^2) $$$$ \begin{aligned} Var[X] &= E[X^2] – [E(X)]^2 \\ &= \frac{1}{3} (a^2 + ab + b^2) – \frac{(a + b)^2}{4} \\ &= \frac{a^2 – 2ab – b^2}{12} \\ &= \frac{(b – a)^2}{12} \end{aligned} $$

標準偏差

$$ Std[X] = \sqrt{Var[X]} = \frac{b – a}{2 \sqrt{2}} $$

積率母関数

$$ \begin{aligned} m_X(t) &= E[e^{tX}] \\ &= \frac{1}{b – a} \int_a^b e^{tx} dx \\ &= \frac{1}{b – a} \left[\frac{e^{tx}}{t}\right]_a^b \\ &= \frac{e^{tb} – e^{ta}}{t(b – a)} \end{aligned} $$

scipy.stats の一様分布

scipy.stats.uniform で一様分布に従う確率変数を作成できます。

In [1]:
import numpy as np
import seaborn as sns
from matplotlib import pyplot as plt
from scipy.stats import uniform

sns.set(style="white")

X = uniform(loc=-2, scale=4)

サンプリング

In [2]:
x = X.rvs(size=5)
print(x)
[-0.17091662 -0.53469003  1.35470988 -1.71785535  1.02110735]

確率密度関数

In [3]:
x = np.linspace(-5, 5, 100)
y = X.pdf(x)

fig, ax = plt.subplots()
ax.plot(x, y)
ax.grid()

plt.show()

累積分布関数

In [4]:
x = np.linspace(-5, 5, 100)
y = X.cdf(x)

fig, ax = plt.subplots()
ax.plot(x, y)
ax.grid()

plt.show()

統計量

In [5]:
print("mean", X.mean())
print("var", X.var())
print("std", X.std())
mean 0.0
var 1.3333333333333333
std 1.1547005383792515

コメント

コメントする

目次