概要
連続確率分布の1つであるF分布 について解説します。
F 分布
確率変数 X X X が自由度 m m m のカイ二乗分布に従い、環境変数 Y Y Y が自由度 n n n のカイ二乗分布に従うとし、X , Y X, Y X , Y は独立であるとする。このとき、
W = X / m Y / n
W = \frac{X / m}{Y / n}
W = Y / n X / m は自由度 m , n m, n m , n の F 分布 (F distribution) に従うという。
確率変数 W W W が自由度 m , n m, n m , n の F 分布に従うとき、W ∼ F m , n W \sim F_{m,n} W ∼ F m , n と表す。
確率関数
確率変数 X X X が F 分布に従う確率変数のとき、確率密度関数は
f X ( w ) = { Γ ( m + n 2 ) m m 2 n n 2 Γ ( m 2 ) Γ ( n 2 ) w m 2 – 1 ( m w + n ) m + n 2 w > 0 0 その他の場合
f_X(w) =
\begin{cases}
\displaystyle
\frac{\Gamma(\frac{m + n}{2}) m^\frac{m}{2} n^\frac{n}{2}}
{\Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})}
\frac{w^{\frac{m}{2}} – 1}{(mw + n)^\frac{m + n}{2}}
& w > 0 \\
0 & その他の場合
\end{cases}
f X ( w ) = ⎩ ⎨ ⎧ Γ ( 2 m ) Γ ( 2 n ) Γ ( 2 m + n ) m 2 m n 2 n ( m w + n ) 2 m + n w 2 m –1 0 w > 0 その他の場合 ただし、Γ ( ⋅ ) \Gamma(\cdot) Γ ( ⋅ ) はガンマ関数、m , n ∈ N m, n \in \N m , n ∈ N は正の整数とする。
確率密度関数の導出
x > 0 , y > 0 x > 0, y > 0 x > 0 , y > 0 のとき、カイ二乗分布の結合確率密度関数は
f X , Y ( x , y ) = x m 2 – 1 e − x 2 2 m 2 Γ ( m 2 ) y n 2 – 1 e − y 2 2 n 2 Γ ( n 2 ) ∵ X , Y は独立 = x m 2 – 1 y n 2 – 1 exp ( − x + y 2 ) 2 m + n 2 Γ ( m 2 ) Γ ( n 2 )
\begin{aligned}
f_{X, Y}(x, y)
&=
\frac{x^{\frac{m}{2} – 1} e^{- \frac{x}{2}}}{2^\frac{m}{2} \Gamma(\frac{m}{2})}
\frac{y^{\frac{n}{2} – 1} e^{- \frac{y}{2}}}{2^\frac{n}{2} \Gamma(\frac{n}{2})} \quad \because X, Y は独立 \\
&=
\frac{x^{\frac{m}{2} – 1} y^{\frac{n}{2} – 1} \exp(- \frac{x + y}{2})}{2^\frac{m + n}{2} \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})} \\
\end{aligned}
f X , Y ( x , y ) = 2 2 m Γ ( 2 m ) x 2 m –1 e − 2 x 2 2 n Γ ( 2 n ) y 2 n –1 e − 2 y ∵ X , Y は独立 = 2 2 m + n Γ ( 2 m ) Γ ( 2 n ) x 2 m –1 y 2 n –1 exp ( − 2 x + y ) ここで、W = X / m Y / n , V = Y W = \frac{X / m}{Y / n}, V = Y W = Y / n X / m , V = Y の変数変換をすると、
{ w = x / m y / n v = y ⇔ { x = m n w v y = v
\begin{cases}
w = \frac{x/m}{y/n} \\
v = y
\end{cases}
\Leftrightarrow
\begin{cases}
x = \frac{m}{n} wv \\
y = v
\end{cases}
{ w = y / n x / m v = y ⇔ { x = n m w v y = v また、w > 0 , v > 0 w > 0, v > 0 w > 0 , v > 0
ヤコビアンは
∣ ∂ x ∂ w ∂ x ∂ v ∂ y ∂ w ∂ y ∂ v ∣ = ∣ m n v m n w 0 1 ∣ = m n v
\begin{vmatrix}
\frac{\partial x}{\partial w} & \frac{\partial x}{\partial v} \\
\frac{\partial y}{\partial w} & \frac{\partial y}{\partial v} \\
\end{vmatrix}
=
\begin{vmatrix}
\frac{m}{n}v & \frac{m}{n}w \\
0 & 1 \\
\end{vmatrix}
= \frac{m}{n}v
∂ w ∂ x ∂ w ∂ y ∂ v ∂ x ∂ v ∂ y = n m v 0 n m w 1 = n m v よって、
f W , V ( w , v ) = ( m n w v ) m 2 – 1 v n 2 – 1 exp ( − m n w v + v 2 ) 2 m + n 2 Γ ( m 2 ) Γ ( n 2 ) m n v = ( m n ) m 2 w m 2 – 1 v m + n 2 – 1 exp ( − 1 2 ( m n w + 1 ) v ) 2 m + n 2 Γ ( m 2 ) Γ ( n 2 )
\begin{aligned}
f_{W, V}(w, v)
&= \frac{(\frac{m}{n} wv)^{\frac{m}{2} – 1} v^{\frac{n}{2} – 1}
\exp(- \frac{\frac{m}{n} wv + v}{2})}{2^\frac{m + n}{2} \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})} \frac{m}{n}v \\
&= \frac{(\frac{m}{n})^{\frac{m}{2}}
w^{\frac{m}{2} – 1}
v^{\frac{m + n}{2} – 1}
\exp(- \frac{1}{2}(\frac{m}{n}w + 1)v)
}{2^\frac{m + n}{2} \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})} \\
\end{aligned}
f W , V ( w , v ) = 2 2 m + n Γ ( 2 m ) Γ ( 2 n ) ( n m w v ) 2 m –1 v 2 n –1 exp ( − 2 n m w v + v ) n m v = 2 2 m + n Γ ( 2 m ) Γ ( 2 n ) ( n m ) 2 m w 2 m –1 v 2 m + n –1 exp ( − 2 1 ( n m w + 1 ) v ) w w w の周辺確率密度関数は
f W ( w ) = ∫ 0 ∞ f W , V ( w , v ) d v = ∫ 0 ∞ ( m n ) m 2 w m 2 – 1 v m + n 2 – 1 exp ( − 1 2 ( m n w + 1 ) v ) 2 m + n 2 Γ ( m 2 ) Γ ( n 2 ) d v = K ∫ 0 ∞ v m + n 2 – 1 exp ( − ( m w + n ) v 2 n ) d v
\begin{aligned}
f_W(w)
&= \int_0^\infty f_{W, V}(w, v) dv \\
&= \int_0^\infty
\frac{
(\frac{m}{n})^{\frac{m}{2}}
w^{\frac{m}{2} – 1}
v^{\frac{m + n}{2} – 1}
\exp(- \frac{1}{2}(\frac{m}{n}w + 1)v)
}
{
2^\frac{m + n}{2} \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})
} dv \\
&= K \int_0^\infty
v^{\frac{m + n}{2} – 1}
\exp \left(- \frac{(mw + n)v}{2n}\right)
dv \\
\end{aligned}
f W ( w ) = ∫ 0 ∞ f W , V ( w , v ) d v = ∫ 0 ∞ 2 2 m + n Γ ( 2 m ) Γ ( 2 n ) ( n m ) 2 m w 2 m –1 v 2 m + n –1 exp ( − 2 1 ( n m w + 1 ) v ) d v = K ∫ 0 ∞ v 2 m + n –1 exp ( − 2 n ( m w + n ) v ) d v ただし、
K = ( m n ) m 2 w m 2 – 1 2 m + n 2 Γ ( m 2 ) Γ ( n 2 )
K = \frac{
(\frac{m}{n})^{\frac{m}{2}}
w^{\frac{m}{2} – 1}
}
{
2^\frac{m + n}{2} \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})
}
K = 2 2 m + n Γ ( 2 m ) Γ ( 2 n ) ( n m ) 2 m w 2 m –1 とおいた。
ここで、t = ( m w + n ) v 2 n t = \frac{(mw + n)v}{2n} t = 2 n ( m w + n ) v とおくと、v = 2 n m w + n t v = \frac{2n}{mw + n} t v = m w + n 2 n t 、d v = 2 n m w + n d t dv = \frac{2n}{mw + n} dt d v = m w + n 2 n d t より、
∫ 0 ∞ ( 2 n m w + n t ) m + n 2 – 1 e − t 2 n m w + n d t = ( 2 n m w + n ) m + n 2 ∫ 0 ∞ t m + n 2 – 1 e − t d t = ( 2 n m w + n ) m + n 2 Γ ( m + n 2 ) ∵ ガンマ関数の定義
\begin{aligned}
& \int_0^\infty
\left( \frac{2n}{mw + n} t \right)^{\frac{m + n}{2} – 1}
e^{-t} \frac{2n}{mw + n} dt \\
&= \left( \frac{2n}{mw + n} \right)^{\frac{m + n}{2}}
\int_0^\infty
t^{\frac{m + n}{2} – 1}
e^{-t} dt \\
&= \left( \frac{2n}{mw + n} \right)^{\frac{m + n}{2}}
\Gamma\left( \frac{m + n}{2} \right)
\quad \because ガンマ関数の定義
\end{aligned}
∫ 0 ∞ ( m w + n 2 n t ) 2 m + n –1 e − t m w + n 2 n d t = ( m w + n 2 n ) 2 m + n ∫ 0 ∞ t 2 m + n –1 e − t d t = ( m w + n 2 n ) 2 m + n Γ ( 2 m + n ) ∵ ガンマ関数の定義 以上より、
f W ( w ) = ( m n ) m 2 w m 2 – 1 2 m + n 2 Γ ( m 2 ) Γ ( n 2 ) ( 2 n m w + n ) m + n 2 Γ ( m + n 2 ) = Γ ( m + n 2 ) m m 2 n n 2 Γ ( m 2 ) Γ ( n 2 ) w m 2 – 1 ( m w + n ) m + n 2
\begin{aligned}
f_W(w)
&=
\frac{(\frac{m}{n})^{\frac{m}{2}} w^{\frac{m}{2} – 1}}
{2^\frac{m + n}{2} \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})}
\left( \frac{2n}{mw + n} \right)^{\frac{m + n}{2}}
\Gamma\left( \frac{m + n}{2} \right) \\
&=
\frac{\Gamma(\frac{m + n}{2}) m^\frac{m}{2} n^\frac{n}{2}}
{\Gamma(\frac{m}{2}) \Gamma(\frac{n}{2})}
\frac{w^{\frac{m}{2}} – 1}{(mw + n)^\frac{m + n}{2}}
\end{aligned}
f W ( w ) = 2 2 m + n Γ ( 2 m ) Γ ( 2 n ) ( n m ) 2 m w 2 m –1 ( m w + n 2 n ) 2 m + n Γ ( 2 m + n ) = Γ ( 2 m ) Γ ( 2 n ) Γ ( 2 m + n ) m 2 m n 2 n ( m w + n ) 2 m + n w 2 m –1
期待値
E [ W ] = E [ X / m Y / n ] = n m E [ X Y ] = n m E [ X ] E [ 1 Y ] ∵ X , Y は独立
\begin{aligned}
E[W]
&= E\left[\frac{X / m}{Y / n} \right] \\
&= \frac{n}{m} E\left[\frac{X}{Y} \right] \\
&= \frac{n}{m} E[X] E\left[\frac{1}{Y} \right] \quad \because X, Y は独立 \\
\end{aligned}
E [ W ] = E [ Y / n X / m ] = m n E [ Y X ] = m n E [ X ] E [ Y 1 ] ∵ X , Y は独立 n > 2 n > 2 n > 2 において、
E [ 1 Y ] = ∫ 0 ∞ 1 y f Y ( y ) d y = ∫ 0 ∞ 1 y 1 2 n 2 Γ ( n 2 ) y n 2 – 1 e − y 2 d y = 1 2 n 2 Γ ( n 2 ) ∫ 0 ∞ y n 2 – 2 e − y 2 d y = 1 2 n 2 Γ ( n 2 ) ∫ 0 ∞ ( 2 z ) n 2 – 2 e − z 2 d z ∵ z = y 2 と置換積分 = 1 2 Γ ( n 2 ) ∫ 0 ∞ z n – 2 2 – 1 e − z d z = 1 2 Γ ( n 2 ) Γ ( n – 2 2 ) ∵ ガンマ関数の定義 = 1 2 ( n – 2 2 ) Γ ( n – 2 2 ) Γ ( n – 2 2 ) ∵ ガンマ関数の性質 Γ ( a ) = ( a – 1 ) Γ ( a – 1 ) = 1 n – 2
\begin{aligned}
E\left[\frac{1}{Y} \right]
&= \int_0^\infty \frac{1}{y} f_Y(y) dy \\
&= \int_0^\infty \frac{1}{y}
\frac{1}{2^\frac{n}{2} \Gamma(\frac{n}{2})}
y^{\frac{n}{2} – 1} e^{- \frac{y}{2}} dy \\
&= \frac{1}{2^\frac{n}{2} \Gamma(\frac{n}{2})}
\int_0^\infty
y^{\frac{n}{2} – 2} e^{- \frac{y}{2}} dy \\
&= \frac{1}{2^\frac{n}{2} \Gamma(\frac{n}{2})}
\int_0^\infty
(2z)^{\frac{n}{2} – 2} e^{-z} 2 dz
\quad \because z = \frac{y}{2} と置換積分 \\
&= \frac{1}{2\Gamma(\frac{n}{2})}
\int_0^\infty
z^{\frac{n – 2}{2} – 1} e^{-z} dz \\
&= \frac{1}{2\Gamma(\frac{n}{2})}
\Gamma \left(\frac{n – 2}{2} \right)
\quad \because ガンマ関数の定義 \\
&= \frac{1}{2 \left(\frac{n – 2}{2} \right) \Gamma \left(\frac{n – 2}{2} \right)}
\Gamma \left(\frac{n – 2}{2} \right)
\quad \because ガンマ関数の性質 \Gamma(a) = (a – 1) \Gamma(a – 1) \\
&= \frac{1}{n – 2} \\
\end{aligned}
E [ Y 1 ] = ∫ 0 ∞ y 1 f Y ( y ) d y = ∫ 0 ∞ y 1 2 2 n Γ ( 2 n ) 1 y 2 n –1 e − 2 y d y = 2 2 n Γ ( 2 n ) 1 ∫ 0 ∞ y 2 n –2 e − 2 y d y = 2 2 n Γ ( 2 n ) 1 ∫ 0 ∞ ( 2 z ) 2 n –2 e − z 2 d z ∵ z = 2 y と置換積分 = 2Γ ( 2 n ) 1 ∫ 0 ∞ z 2 n –2 –1 e − z d z = 2Γ ( 2 n ) 1 Γ ( 2 n –2 ) ∵ ガンマ関数の定義 = 2 ( 2 n –2 ) Γ ( 2 n –2 ) 1 Γ ( 2 n –2 ) ∵ ガンマ関数の性質 Γ ( a ) = ( a –1 ) Γ ( a –1 ) = n –2 1 よって、
E [ W ] = n m E [ X ] E [ 1 Y ] = n m m 1 n – 2 ∵ E [ X ] = m = n n – 2
\begin{aligned}
E[W]
&= \frac{n}{m} E[X] E\left[\frac{1}{Y} \right] \\
&= \frac{n}{m} m \frac{1}{n – 2} \quad \because E[X] = m \\
&= \frac{n}{n – 2} \\
\end{aligned}
E [ W ] = m n E [ X ] E [ Y 1 ] = m n m n –2 1 ∵ E [ X ] = m = n –2 n
分散
E [ W 2 ] = E [ ( X / m ) 2 ( Y / n ) 2 ] = n 2 m 2 E [ X 2 Y 2 ] = n 2 m 2 E [ X 2 ] E [ 1 Y 2 ] ∵ X , Y は独立
\begin{aligned}
E[W^2]
&= E\left[\frac{(X / m)^2}{(Y / n)^2} \right] \\
&= \frac{n^2}{m^2} E\left[\frac{X^2}{Y^2} \right] \\
&= \frac{n^2}{m^2} E[X^2] E\left[\frac{1}{Y^2} \right] \quad \because X, Y は独立 \\
\end{aligned}
E [ W 2 ] = E [ ( Y / n ) 2 ( X / m ) 2 ] = m 2 n 2 E [ Y 2 X 2 ] = m 2 n 2 E [ X 2 ] E [ Y 2 1 ] ∵ X , Y は独立 n > 4 n > 4 n > 4 において、
E [ 1 Y 2 ] = ∫ 0 ∞ 1 y 2 f Y ( y ) d y = ∫ 0 ∞ 1 y 2 1 2 n 2 Γ ( n 2 ) y n 2 – 1 e − y 2 d y = 1 2 n 2 Γ ( n 2 ) ∫ 0 ∞ y n 2 – 3 e − y 2 d y = 1 2 n 2 Γ ( n 2 ) ∫ 0 ∞ ( 2 z ) n 2 – 3 e − z 2 d z ∵ z = y 2 と置換積分 = 1 4 Γ ( n 2 ) ∫ 0 ∞ z n – 4 2 – 1 e − z d z = 1 4 Γ ( n 2 ) Γ ( n – 4 2 ) ∵ ガンマ関数の定義 = 1 4 ( n – 2 2 ) ( n – 4 2 ) Γ ( n – 4 2 ) Γ ( n – 4 2 ) ∵ ガンマ関数の性質 Γ ( a ) = ( a – 1 ) Γ ( a – 1 ) = 1 ( n – 2 ) ( n – 4 )
\begin{aligned}
E\left[\frac{1}{Y^2} \right]
&= \int_0^\infty \frac{1}{y^2} f_Y(y) dy \\
&= \int_0^\infty \frac{1}{y^2}
\frac{1}{2^\frac{n}{2} \Gamma(\frac{n}{2})}
y^{\frac{n}{2} – 1} e^{- \frac{y}{2}} dy \\
&= \frac{1}{2^\frac{n}{2} \Gamma(\frac{n}{2})}
\int_0^\infty
y^{\frac{n}{2} – 3} e^{- \frac{y}{2}} dy \\
&= \frac{1}{2^\frac{n}{2} \Gamma(\frac{n}{2})}
\int_0^\infty
(2z)^{\frac{n}{2} – 3} e^{-z} 2 dz
\quad \because z = \frac{y}{2} と置換積分 \\
&= \frac{1}{4\Gamma(\frac{n}{2})}
\int_0^\infty
z^{\frac{n – 4}{2} – 1} e^{-z} dz \\
&= \frac{1}{4\Gamma(\frac{n}{2})}
\Gamma \left(\frac{n – 4}{2} \right)
\quad \because ガンマ関数の定義 \\
&= \frac{1}{4 \left(\frac{n – 2}{2} \right) \left(\frac{n – 4}{2} \right) \Gamma \left(\frac{n – 4}{2} \right)}
\Gamma \left(\frac{n – 4}{2} \right)
\quad \because ガンマ関数の性質 \Gamma(a) = (a – 1) \Gamma(a – 1) \\
&= \frac{1}{(n – 2)(n – 4)} \\
\end{aligned}
E [ Y 2 1 ] = ∫ 0 ∞ y 2 1 f Y ( y ) d y = ∫ 0 ∞ y 2 1 2 2 n Γ ( 2 n ) 1 y 2 n –1 e − 2 y d y = 2 2 n Γ ( 2 n ) 1 ∫ 0 ∞ y 2 n –3 e − 2 y d y = 2 2 n Γ ( 2 n ) 1 ∫ 0 ∞ ( 2 z ) 2 n –3 e − z 2 d z ∵ z = 2 y と置換積分 = 4Γ ( 2 n ) 1 ∫ 0 ∞ z 2 n –4 –1 e − z d z = 4Γ ( 2 n ) 1 Γ ( 2 n –4 ) ∵ ガンマ関数の定義 = 4 ( 2 n –2 ) ( 2 n –4 ) Γ ( 2 n –4 ) 1 Γ ( 2 n –4 ) ∵ ガンマ関数の性質 Γ ( a ) = ( a –1 ) Γ ( a –1 ) = ( n –2 ) ( n –4 ) 1 よって、
E [ W 2 ] = n 2 m 2 E [ X 2 ] E [ 1 Y 2 ] = n 2 m 2 ( m 2 + 2 m ) 1 ( n – 2 ) ( n – 4 ) ∵ E [ X 2 ] = m 2 + 2 m = n 2 ( m + 2 ) m ( n – 2 ) ( n – 4 )
\begin{aligned}
E[W^2]
&= \frac{n^2}{m^2} E[X^2] E\left[\frac{1}{Y^2} \right] \\
&= \frac{n^2}{m^2} (m^2 + 2m) \frac{1}{(n – 2)(n – 4)} \quad \because E[X^2] = m^2 + 2m \\
&= \frac{n^2(m + 2)}{m(n – 2)(n – 4)} \\
\end{aligned}
E [ W 2 ] = m 2 n 2 E [ X 2 ] E [ Y 2 1 ] = m 2 n 2 ( m 2 + 2 m ) ( n –2 ) ( n –4 ) 1 ∵ E [ X 2 ] = m 2 + 2 m = m ( n –2 ) ( n –4 ) n 2 ( m + 2 ) したがって、分散は
V a r [ W ] = E [ W 2 ] – ( E [ W ] ) 2 = n 2 ( m + 2 ) m ( n – 2 ) ( n – 4 ) – ( n n – 2 ) 2 = n 2 ( ( m + 2 ) ( n – 2 ) – m ( n – 4 ) ) m ( n – 2 ) 2 ( n – 4 ) = 2 n 2 ( m + n – 2 ) m ( n – 2 ) 2 ( n – 4 )
\begin{aligned}
Var[W]
&= E[W^2] – (E[W])^2 \\
&= \frac{n^2(m + 2)}{m(n – 2)(n – 4)} – \left( \frac{n}{n – 2}\right)^2 \\
&= \frac{n^2((m + 2)(n – 2) – m (n – 4))}{m(n – 2)^2(n – 4)} \\
&= \frac{2 n^2(m + n – 2)}{m(n – 2)^2(n – 4)} \\
\end{aligned}
Va r [ W ] = E [ W 2 ] – ( E [ W ] ) 2 = m ( n –2 ) ( n –4 ) n 2 ( m + 2 ) – ( n –2 n ) 2 = m ( n –2 ) 2 ( n –4 ) n 2 (( m + 2 ) ( n –2 ) – m ( n –4 )) = m ( n –2 ) 2 ( n –4 ) 2 n 2 ( m + n –2 )
標準偏差
S t d [ X ] = V a r [ X ] = 2 n 2 ( m + n – 2 ) m ( n – 2 ) 2 ( n – 4 ) = n n – 2 2 ( m + n – 2 ) m ( n – 4 ) ∵ n > 4
\begin{aligned}
Std[X]
&= \sqrt{Var[X]} \\
&= \sqrt{\frac{2 n^2(m + n – 2)}{m(n – 2)^2(n – 4)}} \\
&= \frac{n}{n – 2} \sqrt{\frac{2 (m + n – 2)}{m(n – 4)}} \quad \because n > 4
\end{aligned}
St d [ X ] = Va r [ X ] = m ( n –2 ) 2 ( n –4 ) 2 n 2 ( m + n –2 ) = n –2 n m ( n –4 ) 2 ( m + n –2 ) ∵ n > 4
scipy.stats のカイ二乗分布
scipy.stats.chi2 でカイ二乗分布に従う確率変数を作成できます。
サンプリング
[1.00355515 1.05834412 0.38951327 0.43128241 0.92304201]
確率密度関数
累積分布関数
統計量
mean 1.125
var 0.2805572660098522
std 0.5296765673596031
コメント