概要
連続確率分布の1つであるカイ二乗分布について解説します。
確率関数
確率変数 X が次の確率密度関数をもつとき、X は自由度 (degrees of freedom) n の(中心)カイ二乗分布 (chi squared distribution) または χ2 分布に従うという。
確率変数 X が自由度 n のカイ二乗分布に従うとき、X∼χn2 と表す。
fX(x)={fX(x)=22nΓ(2n)1x2n–1e−2x0x>0その他の場合ただし、Γ(⋅) はガンマ関数、n∈N は正の整数とする。
確率密度関数の要件を満たしている
(1) fX(x)≥0 は明らか
(2) 規格化
∫−∞∞fX(x)dx=22nΓ(2n)1∫−∞∞x2n–1e−2xdx=22nΓ(2n)1∫−∞∞(2y)2n–1e−ydy∵2x=yと置換積分=2Γ(2n)1⋅2Γ(2n)∵ガンマ関数の定義=1
ガンマ分布との関係
自由度 n のカイ二乗分布はパラメータ α=2nβ=21 としたときのガンマ分布である。
指数分布との関係
自由度2のカイ二乗分布は α=1β=21 としたときの指数分布であるから、パラメータ β=21 の指数分布である。
k 次積率
ガンマ分布の k 次積率に α=2nβ=21 と代入すると、
E(Xk)=βkα(α+1)⋯(α+k–1)
期待値
パラメータ α,β のガンマ分布の期待値に α=2nβ=21 と代入すると、
E[X]=βα=n
分散
パラメータ α,β のガンマ分布の分散に α=2nβ=21 と代入すると、
Var[X]=β2α=2n
標準偏差
Std[X]=Var[X]=2n
積率母関数
パラメータ α,β のガンマ分布の積率母関数は t<β で定義されるので、t<21 としたとき、
α=2nβ=21 と代入すると、
mX(t)=(1–2t1)2n
再生性
X1,X2,⋯,Xn が独立でそれぞれ自由度 ki のカイ二乗分布に従うとき、
S=X1+X2+⋯+Xn は自由度 k1+k2+⋯+kn のカイ二乗分布に従う。
証明:
Xi の積率母関数を mXi(t) とすると、
mS(t)=i=1∏nmXi(t)=(1–2t1)2k1+k2+⋯+knこれは自由度 k1+k2+⋯+kn のカイ二乗分布の積率母関数と一致する。
積率母関数の一意性より、題意は示された。
標準正規分布との関係
Z が標準正規分布に従うとき、Y=Z2 は自由度1のカイ二乗分布に従う。
証明:
mY(t)=E[etY]=E[etZ2]=∫−∞∞etz22π1exp(−2z2)dz=∫−∞∞2π1exp(2−(1–2t)z2)dz=1–2t1∫−∞∞2π1–2texp(2−(1–2t)z2)dzここで、
∫−∞∞2π1–2texp(2−(1–2t)z2)dzは、平均 μ=0、分散 σ2=1–2t1 としたときの正規分布の全実数についての積分なので、1となる。
よって、
mY(t)=(1–2t1)21これは自由度 1 のカイ二乗分布の積率母関数と一致する。
積率母関数の一意性より、題意は示された。
標準正規分布との関係
Z1,Z2,⋯,Zn が独立でそれぞれ標準正規分布に従うとき、
Y=Z12+Z22+⋯+Zn2 は自由度 n のカイ二乗分布に従う。
証明:
Z2 は自由度1のカイ二乗分布に従うので、カイ二乗分布の再生性より、
Y は自由度 n のカイ二乗分布に従う。
正規分布との関係
X1,X2,⋯,Xn が独立でそれぞれ平均 μi、分散 σ2 の正規分布に従うとき、
Y=∑i=1n(σiXi–μi)2 は自由度 n のカイ二乗分布に従う。
証明:
Zi=σiXi–μi とすると、Zi は標準正規分布に従うので、Y は自由度 n のカイ二乗分布に従う。
scipy.stats のカイ二乗分布
scipy.stats.chi2 でカイ二乗分布に従う確率変数を作成できます。
サンプリング
[14.21866758 17.01161969 9.51196718 13.50533751 14.14309324]
確率密度関数
累積分布関数
統計量
mean 10.0
var 20.0
std 4.47213595499958
コメント