概要
連続確率分布の1つである非心カイ二乗分布 について解説します。
非心カイ二乗分布
確率変数 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X 1 , X 2 , ⋯ , X n が独立でそれぞれ平均 μ i \mu_i μ i 、分散 1 1 1 の正規分布に従うとき、Y = X 1 2 + X 2 2 + ⋯ + X n 2 Y = X_1^2 + X_2^2 + \cdots + X_n^2 Y = X 1 2 + X 2 2 + ⋯ + X n 2 は非心度 δ = μ 1 2 + μ 2 2 + ⋯ + μ n 2 \delta = \mu_1^2 + \mu_2^2 + \cdots + \mu_n^2 δ = μ 1 2 + μ 2 2 + ⋯ + μ n 2 、自由度 n n n の非心カイ二乗分布に従う。
積率母関数
確率変数 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X 1 , X 2 , ⋯ , X n が独立でそれぞれ平均 μ i \mu_i μ i 、分散 1 1 1 の正規分布に従うとし、Y = X 1 2 + X 2 2 + ⋯ + X n 2 Y = X_1^2 + X_2^2 + \cdots + X_n^2 Y = X 1 2 + X 2 2 + ⋯ + X n 2 とする。
m Y ( t ) = E [ e t Y ] = E [ exp ( t ∑ i = 1 n X i 2 ) ] = E [ ∏ i = 1 n exp ( t X i 2 ) ]
\begin{aligned}
m_Y(t)
&= E[e^{tY}] \\
&= E\left[ \exp \left(t \sum_{i = 1}^n X_i^2 \right) \right] \\
&= E\left[ \prod_{i = 1}^n \exp \left(t X_i^2 \right) \right] \\
\end{aligned}
m Y ( t ) = E [ e t Y ] = E [ exp ( t i = 1 ∑ n X i 2 ) ] = E [ i = 1 ∏ n exp ( t X i 2 ) ] ここで、
E [ ∏ i = 1 n exp ( t X i 2 ) ] = ∫ − ∞ ∞ t x i 2 1 2 π exp ( – ( x i – μ i ) 2 2 ) d x i = ∫ − ∞ ∞ 1 2 π exp ( t x i 2 – ( x i – μ i ) 2 2 ) d x i = ∫ − ∞ ∞ 1 2 π exp ( 1 2 ( − ( 1 – 2 t ) x i 2 + 2 x μ – μ 2 ) ) d x i = ∫ − ∞ ∞ 1 2 π exp ( 1 2 ( − ( 1 – 2 t ) ( x i – μ i 1 – 2 t ) 2 – μ i 2 + μ i 2 1 – 2 t ) ) d x i ∵ 平方完成 = ∫ − ∞ ∞ 1 2 π exp ( − 1 – 2 t 2 ( x i – μ i 1 – 2 t ) 2 + t μ i 2 1 – 2 t ) d x i = exp ( t μ i 2 1 – 2 t ) ∫ − ∞ ∞ 1 2 π exp ( − 1 – 2 t 2 ( x i – μ i 1 – 2 t ) 2 ) d x i = exp ( t μ i 2 1 – 2 t ) 1 1 – 2 t ∫ − ∞ ∞ 1 – 2 t 2 π exp ( − 1 – 2 t 2 ( x i – μ i 1 – 2 t ) 2 ) d x i = exp ( t μ i 2 1 – 2 t ) 1 1 – 2 t ∫ − ∞ ∞ f ( x i ) d x i ∵ t < 1 2 のとき、平均 μ i 1 – 2 t 、分散 1 1 – 2 t の正規分布 = exp ( t μ i 2 1 – 2 t ) ( 1 1 – 2 t ) 1 2
\begin{aligned}
& E\left[ \prod_{i = 1}^n \exp \left(t X_i^2 \right) \right] \\
&= \int_{-\infty}^\infty
t x_i^2 \frac{1}{\sqrt{2 \pi}}
\exp \left( – \frac{(x_i – \mu_i)^2}{2} \right) dx_i \\
&= \int_{-\infty}^\infty
\frac{1}{\sqrt{2 \pi}}
\exp \left( t x_i^2 – \frac{(x_i – \mu_i)^2}{2} \right) dx_i \\
&= \int_{-\infty}^\infty
\frac{1}{\sqrt{2 \pi}}
\exp \left(\frac{1}{2} (-(1 – 2 t) x_i^2 + 2 x \mu – \mu^2) \right) dx_i \\
&= \int_{-\infty}^\infty
\frac{1}{\sqrt{2 \pi}}
\exp \left(
\frac{1}{2} \left(
-(1 – 2 t) \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 – \mu_i^2 + \frac{\mu_i^2}{1 – 2t}
\right) \right) dx_i
\quad \because 平方完成 \\
&= \int_{-\infty}^\infty
\frac{1}{\sqrt{2 \pi}}
\exp \left(
-\frac{1 – 2 t}{2} \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 + \frac{t \mu_i^2}{1 – 2t}
\right) dx_i \\
&=
\exp(\frac{t \mu_i^2}{1 – 2t})
\int_{-\infty}^\infty
\frac{1}{\sqrt{2 \pi}}
\exp \left(-\frac{1 – 2 t}{2} \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 \right) dx_i \\
&=
\exp(\frac{t \mu_i^2}{1 – 2t}) \frac{1}{\sqrt{1 – 2t}}
\int_{-\infty}^\infty
\frac{\sqrt{1 – 2t}}{\sqrt{2 \pi}}
\exp \left(-\frac{1 – 2 t}{2} \left(x_i – \frac{\mu_i}{1 – 2 t}\right)^2 \right) dx_i \\
&=
\exp \left(\frac{t \mu_i^2}{1 – 2t} \right) \frac{1}{\sqrt{1 – 2t}}
\int_{-\infty}^\infty f(x_i) dx_i
\quad \because t < \frac{1}{2} のとき、平均 \frac{\mu_i}{1 – 2t}、分散 \frac{1}{1 – 2t} の正規分布 \\
&= \exp \left(\frac{t \mu_i^2}{1 – 2t} \right)
\left( \frac{1}{1 – 2t} \right)^\frac{1}{2}
\end{aligned}
E [ i = 1 ∏ n exp ( t X i 2 ) ] = ∫ − ∞ ∞ t x i 2 2 π 1 exp ( – 2 ( x i – μ i ) 2 ) d x i = ∫ − ∞ ∞ 2 π 1 exp ( t x i 2 – 2 ( x i – μ i ) 2 ) d x i = ∫ − ∞ ∞ 2 π 1 exp ( 2 1 ( − ( 1–2 t ) x i 2 + 2 xμ – μ 2 ) ) d x i = ∫ − ∞ ∞ 2 π 1 exp ( 2 1 ( − ( 1–2 t ) ( x i – 1–2 t μ i ) 2 – μ i 2 + 1–2 t μ i 2 ) ) d x i ∵ 平方完成 = ∫ − ∞ ∞ 2 π 1 exp ( − 2 1–2 t ( x i – 1–2 t μ i ) 2 + 1–2 t t μ i 2 ) d x i = exp ( 1–2 t t μ i 2 ) ∫ − ∞ ∞ 2 π 1 exp ( − 2 1–2 t ( x i – 1–2 t μ i ) 2 ) d x i = exp ( 1–2 t t μ i 2 ) 1–2 t 1 ∫ − ∞ ∞ 2 π 1–2 t exp ( − 2 1–2 t ( x i – 1–2 t μ i ) 2 ) d x i = exp ( 1–2 t t μ i 2 ) 1–2 t 1 ∫ − ∞ ∞ f ( x i ) d x i ∵ t < 2 1 のとき、平均 1–2 t μ i 、分散 1–2 t 1 の正規分布 = exp ( 1–2 t t μ i 2 ) ( 1–2 t 1 ) 2 1 よって、
m Y ( t ) = E [ ∏ i = 1 n exp ( t X i 2 ) ] = exp ( t ∑ i = 1 n μ i 2 1 – 2 t ) ( 1 1 – 2 t ) n 2 , t < 1 2
\begin{aligned}
m_Y(t)
&= E\left[ \prod_{i = 1}^n \exp \left(t X_i^2 \right) \right] \\
&= \exp \left(\frac{t \sum_{i = 1}^n \mu_i^2}{1 – 2t} \right)
\left( \frac{1}{1 – 2t} \right)^\frac{n}{2}, t < \frac{1}{2}
\end{aligned}
m Y ( t ) = E [ i = 1 ∏ n exp ( t X i 2 ) ] = exp ( 1–2 t t ∑ i = 1 n μ i 2 ) ( 1–2 t 1 ) 2 n , t < 2 1
確率関数
確率変数 X X X が次の確率密度関数をもつとき、X X X は非心度 (noncentral parameter) δ \delta δ 、自由度 n n n の非心カイ二乗分布 (noncentral chi squared distribution) または非心 χ 2 \chi^2 χ 2 分布に従うという。
確率変数 X X X が非心度 δ \delta δ 、自由度 n n n の非心カイ二乗分布に従うとき、X ∼ χ n 2 ( δ ) X \sim \chi_n^2(\delta) X ∼ χ n 2 ( δ ) と表す。
f X ( x ) = { f X ( x ) = ∑ k = 0 ∞ e − δ 2 ( δ 2 ) k k ! 1 2 n 2 + k Γ ( n 2 + k ) x n 2 + k – 1 e − x 2 x > 0 0 その他の場合
\begin{aligned}
f_X(x) &=
\begin{cases}
\displaystyle f_X(x) = \sum_{k = 0}^\infty
\frac{e^{-\frac{\delta}{2}} (\frac{\delta}{2})^k}{k!}
\frac{1}
{2^{\frac{n}{2} + k}
\Gamma \left(\frac{n}{2} + k\right)}
x^{\frac{n}{2} + k – 1} e^{- \frac{x}{2}}
& x > 0 \\
0 & その他の場合
\end{cases} \\
\end{aligned}
f X ( x ) = ⎩ ⎨ ⎧ f X ( x ) = k = 0 ∑ ∞ k ! e − 2 δ ( 2 δ ) k 2 2 n + k Γ ( 2 n + k ) 1 x 2 n + k –1 e − 2 x 0 x > 0 その他の場合 ただし、Γ ( ⋅ ) \Gamma(\cdot) Γ ( ⋅ ) はガンマ関数、n ∈ N , δ ≥ 0 n \in \N, \delta \ge 0 n ∈ N , δ ≥ 0 とする。
f 2 k + n ( x ) f_{2_k + n}(x) f 2 k + n ( x ) を自由度 2 k + n 2k + n 2 k + n のカイ二乗分布の確率密度関数とすると、
f X ( x ) = { f X ( x ) = e − δ 2 ∑ k = 0 ∞ ( δ 2 ) k k ! f 2 k + n ( x ) x > 0 0 その他の場合
\begin{aligned}
f_X(x) &=
\begin{cases}
\displaystyle f_X(x) =
e^{-\frac{\delta}{2}} \sum_{k = 0}^\infty
\frac{ (\frac{\delta}{2})^k}{k!} f_{2k + n}(x)
& x > 0 \\
0 & その他の場合
\end{cases} \\
\end{aligned}
f X ( x ) = ⎩ ⎨ ⎧ f X ( x ) = e − 2 δ k = 0 ∑ ∞ k ! ( 2 δ ) k f 2 k + n ( x ) 0 x > 0 その他の場合 とかける。
期待値
X i ∼ N ( μ i , 1 ) X_i \sim N(\mu_i, 1) X i ∼ N ( μ i , 1 ) なので、E [ X i 2 ] = μ i 2 + 1 E[X_i^2] = \mu_i^2 + 1 E [ X i 2 ] = μ i 2 + 1 に注意すると、
E [ Y ] = E [ X 1 2 + ⋯ + X n 2 ] = ∑ i = 1 n E [ X i 2 ] = ∑ i = 1 n ( μ i 2 + 1 ) = ∑ i = 1 n μ i 2 + n = δ + n
\begin{aligned}
E[Y]
&= E[X_1^2 + \cdots + X_n^2] \\
&= \sum_{i = 1}^n E[X_i^2] \\
&= \sum_{i = 1}^n (\mu_i^2 + 1) \\
&= \sum_{i = 1}^n \mu_i^2 + n \\
&= \delta + n \\
\end{aligned}
E [ Y ] = E [ X 1 2 + ⋯ + X n 2 ] = i = 1 ∑ n E [ X i 2 ] = i = 1 ∑ n ( μ i 2 + 1 ) = i = 1 ∑ n μ i 2 + n = δ + n
分散
X i ∼ N ( μ i , 1 ) X_i \sim N(\mu_i, 1) X i ∼ N ( μ i , 1 ) のとき、正規分布の中心積率 より E [ ( X i – μ i ) 4 ] = 3 , E [ ( X i – μ i ) 2 ] = 1 E[(X_i – \mu_i)^4] =3, E[(X_i – \mu_i)^2] = 1 E [( X i – μ i ) 4 ] = 3 , E [( X i – μ i ) 2 ] = 1 なので、
V a r [ ( X i – μ i ) 2 ] = E [ ( X i – μ i ) 4 ] – ( E [ ( X i – μ i ) 2 ] ) 2 = 3 – 1 ∵ 正規分布の k 次の中心積率 = 2
\begin{aligned}
Var[(X_i – \mu_i)^2]
&= E[(X_i – \mu_i)^4] – (E[(X_i – \mu_i)^2])^2 \\
&= 3 – 1 \quad \because 正規分布の k 次の中心積率 \\
&= 2
\end{aligned}
Va r [( X i – μ i ) 2 ] = E [( X i – μ i ) 4 ] – ( E [( X i – μ i ) 2 ] ) 2 = 3–1 ∵ 正規分布の k 次の中心積率 = 2 に注意すると、
V a r [ Y ] = V a r [ X 1 2 + ⋯ + X n 2 ] = ∑ i = 1 n V a r [ X i 2 ] ∵ X 1 , X 2 , ⋯ , X n は独立 [ 1 ] = ∑ i = 1 n V a r [ ( X i – μ i ) 2 + 2 μ i ( X i – μ i ) + μ i 2 ] = ∑ i = 1 n ( V a r [ ( X i – μ i ) 2 ] + V a r [ 2 μ i ( X i – μ i ) ] ) ∵ ( X i – μ i ) 2 , X i – μ i は独立 = ∑ i = 1 n V a r [ ( X i – μ i ) 2 ] + ∑ i = 1 n 4 μ i 2 V a r [ X i – μ i ] = 2 n + 4 ∑ i = 1 n μ i 2 ∵ V a r [ X i – μ i ] = V a r [ X i ] = 1 = 2 n + 4 δ
\begin{aligned}
Var[Y]
&= Var[X_1^2 + \cdots + X_n^2] \\
&= \sum_{i = 1}^n Var[X_i^2] \quad \because X_1, X_2, \cdots, X_n は独立 [1] \\
&= \sum_{i = 1}^n Var[(X_i – \mu_i)^2 + 2 \mu_i (X_i – \mu_i) + \mu_i^2] \\
&= \sum_{i = 1}^n (Var[(X_i – \mu_i)^2] + Var[2 \mu_i (X_i – \mu_i)])
\quad \because (X_i – \mu_i)^2, X_i – \mu_i は独立 \\
&= \sum_{i = 1}^n Var[(X_i – \mu_i)^2]
+ \sum_{i = 1}^n 4 \mu_i^2 Var[X_i – \mu_i] \\
&= 2n + 4 \sum_{i = 1}^n \mu_i^2 \quad \because Var[X_i – \mu_i] = Var[X_i] = 1 \\
&= 2n + 4 \delta \\
\end{aligned}
Va r [ Y ] = Va r [ X 1 2 + ⋯ + X n 2 ] = i = 1 ∑ n Va r [ X i 2 ] ∵ X 1 , X 2 , ⋯ , X n は独立 [ 1 ] = i = 1 ∑ n Va r [( X i – μ i ) 2 + 2 μ i ( X i – μ i ) + μ i 2 ] = i = 1 ∑ n ( Va r [( X i – μ i ) 2 ] + Va r [ 2 μ i ( X i – μ i )]) ∵ ( X i – μ i ) 2 , X i – μ i は独立 = i = 1 ∑ n Va r [( X i – μ i ) 2 ] + i = 1 ∑ n 4 μ i 2 Va r [ X i – μ i ] = 2 n + 4 i = 1 ∑ n μ i 2 ∵ Va r [ X i – μ i ] = Va r [ X i ] = 1 = 2 n + 4 δ
標準偏差
S t d [ X ] = V a r [ X ] = 2 n + 4 δ
Std[X] = \sqrt{Var[X]} = \sqrt{2n + 4 \delta}
St d [ X ] = Va r [ X ] = 2 n + 4 δ
scipy.stats の非心カイ二乗分布
scipy.stats.ncx2 で非心カイ二乗分布に従う確率変数を作成できます。
サンプリング
[15.41757792 23.61434967 27.98127105 22.85990679 37.43546455]
確率密度関数
累積分布関数
統計量
mean 22.06
var 46.24
std 6.8
コメント
コメント一覧 (0件)
非心分布の資料がネット上に少ない中、大変参考になりました。ありがとうございます。
ところで分散の導出のところの1つ目の式の左辺はVではなくEではありませんか…?
また分散の導出の2つ目の式で3をうまく導けないのですがどのように導くのか、差し支えなければ教えていただきたいです。
失礼しました。Vで合ってました…。
そして3は尖度から導くのですね。
コメントありがとうございます。
分散の項の Var[(X-μ)^2] の導出のところで、記述の間違いやわかりづらい点があったので修正しました。
E[(X-μ)^4] = 3, E[(X-μ)^2] = 1 については、正規分布の中心積率から求まります。
X ~ N(μ, σ) のとき、
E[(X–μ)^k] = (k–1)!!σ^k (k = 2, 4, …)
E[(X–μ)^k] = 0 (k = 1, 3, …)
今回、σ^2 = 1 なので E[(X–μ)^4] = 3 (尖度), E[(X–μ)^2] = 1
正規分布のk次の中心積率の導出
https://pystyle.info/statistics-normal-distribution/#outline__8