統計学 – 非心カイ二乗分布

概要

連続確率分布の1つである非心カイ二乗分布について解説します。

非心カイ二乗分布

確率変数 X1,X2,,XnX_1, X_2, \cdots, X_n が独立でそれぞれ平均 μi\mu_i、分散 11 の正規分布に従うとき、Y=X12+X22++Xn2Y = X_1^2 + X_2^2 + \cdots + X_n^2 は非心度 δ=μ12+μ22++μn2\delta = \mu_1^2 + \mu_2^2 + \cdots + \mu_n^2、自由度 nn の非心カイ二乗分布に従う。

積率母関数

確率変数 X1,X2,,XnX_1, X_2, \cdots, X_n が独立でそれぞれ平均 μi\mu_i、分散 11 の正規分布に従うとし、Y=X12+X22++Xn2Y = X_1^2 + X_2^2 + \cdots + X_n^2 とする。

mY(t)=E[etY]=E[exp(ti=1nXi2)]=E[i=1nexp(tXi2)] \begin{aligned} m_Y(t) &= E[e^{tY}] \\ &= E\left[ \exp \left(t \sum_{i = 1}^n X_i^2 \right) \right] \\ &= E\left[ \prod_{i = 1}^n \exp \left(t X_i^2 \right) \right] \\ \end{aligned}

ここで、

E[i=1nexp(tXi2)]=txi212πexp((xiμi)22)dxi=12πexp(txi2(xiμi)22)dxi=12πexp(12((12t)xi2+2xμμ2))dxi=12πexp(12((12t)(xiμi12t)2μi2+μi212t))dxi平方完成=12πexp(12t2(xiμi12t)2+tμi212t)dxi=exp(tμi212t)12πexp(12t2(xiμi12t)2)dxi=exp(tμi212t)112t12t2πexp(12t2(xiμi12t)2)dxi=exp(tμi212t)112tf(xi)dxit<12のとき、平均μi12t、分散112tの正規分布=exp(tμi212t)(112t)12 \begin{aligned} & E\left[ \prod_{i = 1}^n \exp \left(t X_i^2 \right) \right] \\ &= \int_{-\infty}^\infty t x_i^2 \frac{1}{\sqrt{2 \pi}} \exp \left( – \frac{(x_i – \mu_i)^2}{2} \right) dx_i \\ &= \int_{-\infty}^\infty \frac{1}{\sqrt{2 \pi}} \exp \left( t x_i^2 – \frac{(x_i – \mu_i)^2}{2} \right) dx_i \\ &= \int_{-\infty}^\infty \frac{1}{\sqrt{2 \pi}} \exp \left(\frac{1}{2} (-(1 – 2 t) x_i^2 + 2 x \mu – \mu^2) \right) dx_i \\ &= \int_{-\infty}^\infty \frac{1}{\sqrt{2 \pi}} \exp \left( \frac{1}{2} \left( -(1 – 2 t) \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 – \mu_i^2 + \frac{\mu_i^2}{1 – 2t} \right) \right) dx_i \quad \because 平方完成 \\ &= \int_{-\infty}^\infty \frac{1}{\sqrt{2 \pi}} \exp \left( -\frac{1 – 2 t}{2} \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 + \frac{t \mu_i^2}{1 – 2t} \right) dx_i \\ &= \exp(\frac{t \mu_i^2}{1 – 2t}) \int_{-\infty}^\infty \frac{1}{\sqrt{2 \pi}} \exp \left(-\frac{1 – 2 t}{2} \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 \right) dx_i \\ &= \exp(\frac{t \mu_i^2}{1 – 2t}) \frac{1}{\sqrt{1 – 2t}} \int_{-\infty}^\infty \frac{\sqrt{1 – 2t}}{\sqrt{2 \pi}} \exp \left(-\frac{1 – 2 t}{2} \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 \right) dx_i \\ &= \exp \left(\frac{t \mu_i^2}{1 – 2t} \right) \frac{1}{\sqrt{1 – 2t}} \int_{-\infty}^\infty f(x_i) dx_i \quad \because t < \frac{1}{2} のとき、平均 \frac{\mu_i}{1 – 2t}、分散 \frac{1}{1 – 2t} の正規分布 \\ &= \exp \left(\frac{t \mu_i^2}{1 – 2t} \right) \left( \frac{1}{1 – 2t} \right)^\frac{1}{2} \end{aligned}

よって、

mY(t)=E[i=1nexp(tXi2)]=exp(ti=1nμi212t)(112t)n2,t<12 \begin{aligned} m_Y(t) &= E\left[ \prod_{i = 1}^n \exp \left(t X_i^2 \right) \right] \\ &= \exp \left(\frac{t \sum_{i = 1}^n \mu_i^2}{1 – 2t} \right) \left( \frac{1}{1 – 2t} \right)^\frac{n}{2}, t < \frac{1}{2} \end{aligned}

確率関数

確率変数 XX が次の確率密度関数をもつとき、XX は非心度 (noncentral parameter) δ\delta、自由度 nn の非心カイ二乗分布 (noncentral chi squared distribution) または非心 χ2\chi^2 分布に従うという。

確率変数 XX が非心度 δ\delta、自由度 nn の非心カイ二乗分布に従うとき、Xχn2(δ)X \sim \chi_n^2(\delta) と表す。

fX(x)={fX(x)=k=0eδ2(δ2)kk!12n2+kΓ(n2+k)xn2+k1ex2x>00その他の場合 \begin{aligned} f_X(x) &= \begin{cases} \displaystyle f_X(x) = \sum_{k = 0}^\infty \frac{e^{-\frac{\delta}{2}} (\frac{\delta}{2})^k}{k!} \frac{1} {2^{\frac{n}{2} + k} \Gamma \left(\frac{n}{2} + k\right)} x^{\frac{n}{2} + k – 1} e^{- \frac{x}{2}} & x > 0 \\ 0 & その他の場合 \end{cases} \\ \end{aligned}

ただし、Γ()\Gamma(\cdot) はガンマ関数、nN,δ0n \in \N, \delta \ge 0 とする。

f2k+n(x)f_{2_k + n}(x) を自由度 2k+n2k + n のカイ二乗分布の確率密度関数とすると、

fX(x)={fX(x)=eδ2k=0(δ2)kk!f2k+n(x)x>00その他の場合 \begin{aligned} f_X(x) &= \begin{cases} \displaystyle f_X(x) = e^{-\frac{\delta}{2}} \sum_{k = 0}^\infty \frac{ (\frac{\delta}{2})^k}{k!} f_{2k + n}(x) & x > 0 \\ 0 & その他の場合 \end{cases} \\ \end{aligned}

とかける。

期待値

XiN(μi,1)X_i \sim N(\mu_i, 1) なので、E[Xi2]=μi2+1E[X_i^2] = \mu_i^2 + 1 に注意すると、

E[Y]=E[X12++Xn2]=i=1nE[Xi2]=i=1n(μi2+1)=i=1nμi2+n=δ+n \begin{aligned} E[Y] &= E[X_1^2 + \cdots + X_n^2] \\ &= \sum_{i = 1}^n E[X_i^2] \\ &= \sum_{i = 1}^n (\mu_i^2 + 1) \\ &= \sum_{i = 1}^n \mu_i^2 + n \\ &= \delta + n \\ \end{aligned}

分散

XiN(μi,1)X_i \sim N(\mu_i, 1) のとき、正規分布の中心積率 より E[(Xiμi)4]=3,E[(Xiμi)2]=1E[(X_i – \mu_i)^4] =3, E[(X_i – \mu_i)^2] = 1 なので、

Var[(Xiμi)2]=E[(Xiμi)4](E[(Xiμi)2])2=31正規分布のk次の中心積率=2 \begin{aligned} Var[(X_i – \mu_i)^2] &= E[(X_i – \mu_i)^4] – (E[(X_i – \mu_i)^2])^2 \\ &= 3 – 1 \quad \because 正規分布の k 次の中心積率 \\ &= 2 \end{aligned}

に注意すると、

Var[Y]=Var[X12++Xn2]=i=1nVar[Xi2]X1,X2,,Xnは独立[1]=i=1nVar[(Xiμi)2+2μi(Xiμi)+μi2]=i=1n(Var[(Xiμi)2]+Var[2μi(Xiμi)])(Xiμi)2,Xiμiは独立=i=1nVar[(Xiμi)2]+i=1n4μi2Var[Xiμi]=2n+4i=1nμi2Var[Xiμi]=Var[Xi]=1=2n+4δ \begin{aligned} Var[Y] &= Var[X_1^2 + \cdots + X_n^2] \\ &= \sum_{i = 1}^n Var[X_i^2] \quad \because X_1, X_2, \cdots, X_n は独立 [1] \\ &= \sum_{i = 1}^n Var[(X_i – \mu_i)^2 + 2 \mu_i (X_i – \mu_i) + \mu_i^2] \\ &= \sum_{i = 1}^n (Var[(X_i – \mu_i)^2] + Var[2 \mu_i (X_i – \mu_i)]) \quad \because (X_i – \mu_i)^2, X_i – \mu_i は独立 \\ &= \sum_{i = 1}^n Var[(X_i – \mu_i)^2] + \sum_{i = 1}^n 4 \mu_i^2 Var[X_i – \mu_i] \\ &= 2n + 4 \sum_{i = 1}^n \mu_i^2 \quad \because Var[X_i – \mu_i] = Var[X_i] = 1 \\ &= 2n + 4 \delta \\ \end{aligned}

標準偏差

Std[X]=Var[X]=2n+4δ Std[X] = \sqrt{Var[X]} = \sqrt{2n + 4 \delta}

scipy.stats の非心カイ二乗分布

scipy.stats.ncx2 で非心カイ二乗分布に従う確率変数を作成できます。

In [1]:
import numpy as np
import seaborn as sns
from matplotlib import pyplot as plt
from scipy.stats import ncx2

sns.set(style="white")

df, nc = 21, 1.06
X = ncx2(21, 1.06)

サンプリング

In [2]:
x = X.rvs(size=5)
print(x)
[15.41757792 23.61434967 27.98127105 22.85990679 37.43546455]

確率密度関数

In [3]:
x = np.linspace(0.01, 50, 100)
y = X.pdf(x)

fig, ax = plt.subplots()
ax.plot(x, y)
ax.grid()

plt.show()

累積分布関数

In [4]:
x = np.linspace(0.01, 50, 100)
y = X.cdf(x)

fig, ax = plt.subplots()
ax.plot(x, y)
ax.grid()

plt.show()

統計量

In [5]:
print("mean", X.mean())
print("var", X.var())
print("std", X.std())
mean 22.06
var 46.24
std 6.8

コメント

コメント一覧 (0件)

  • 非心分布の資料がネット上に少ない中、大変参考になりました。ありがとうございます。
    ところで分散の導出のところの1つ目の式の左辺はVではなくEではありませんか…?
    また分散の導出の2つ目の式で3をうまく導けないのですがどのように導くのか、差し支えなければ教えていただきたいです。

      • コメントありがとうございます。
        分散の項の Var[(X-μ)^2] の導出のところで、記述の間違いやわかりづらい点があったので修正しました。
        E[(X-μ)^4] = 3, E[(X-μ)^2] = 1 については、正規分布の中心積率から求まります。

        X ~ N(μ, σ) のとき、
        E[(X–μ)^k] = (k–1)!!σ^k (k = 2, 4, …)
        E[(X–μ)^k] = 0 (k = 1, 3, …)
        今回、σ^2 = 1 なので E[(X–μ)^4] = 3 (尖度), E[(X–μ)^2] = 1

        正規分布のk次の中心積率の導出
        https://pystyle.info/statistics-normal-distribution/#outline__8

pystyle へ返信する コメントをキャンセル