概要
連続確率分布の1つであるt分布について解説します。
t 分布
確率変数 X が自由度 n のカイ二乗分布に従い、環境変数 Z が標準正規分布に従うとし、X,Y は独立であるとする。このとき、
Y=nXZは自由度 n の t 分布 (t distribution) に従うという。
確率変数 X が自由度 n の t 分布に従うとき、Y∼tn と表す。
確率関数
確率変数 Y が t 分布に従う確率変数のとき、確率密度関数は
fY(y)=nπΓ(2n)Γ[2n+1][1+ny2]−2n+1,y∈Rただし、Γ(⋅) はガンマ関数、n∈N とする。
確率密度関数の導出
結合確率密度関数は
fX,Z(x,z)=2π1exp(–2z2)⋅Γ(2n)22n1x2n–1e−2x∵X,Zは独立ここで、Y=nXZ,V=X の変数変換をすると、
{y=nxzv=x⇔{z=nvyx=vヤコビアンは
∂y∂z∂y∂x∂v∂z∂v∂x=nv02nvy1=nvまた、−∞<y<∞,0<v<∞
よって、
fY,V(y,v)=2π1exp(–2nvy2)⋅Γ(2n)22n1v2n–1e−2vnv=Γ(2n)22n2πn1exp(–2v(ny2+1))v2n–1+21Y の周辺確率密度関数は
fY(y)=∫−∞∞fY,V(y,v)dv=K∫0∞exp(–2v(ny2+1))v2n+1–1dvただし、
K=Γ(2n)22n2πn1とおいた。
ここで、t=2v(ny2+1) とおくと、v=y2+n2nt、dv=y2+n2ndt より、
∫0∞e−t(y2+n2nt)2n+1–1y2+n2ndt=(y2+n2n)2n+1∫0∞t2n+1–1e−tdt=(y2+n2n)2n+1Γ(2n+1)∵ガンマ関数の定義以上より、
fY(y)=Γ(2n)22n2πn1(y2+n2n)2n+1Γ(2n+1)=Γ(2n)πnΓ(2n+1)(ny2+1)−2n+1,−∞<y<∞
期待値
n>1 のとき、
E[Y]=EnXZ=nE[XZ]=nE[X1]E[Z]∵X,Zは独立=0∵E[Z]=0
分散
n>2 のとき、
E[Y2]=E[nXZ2]=nE[XZ2]=nE[X1]E[Z2]∵X,Zは独立ここで、X∼χn2 より、
E[X1]=n–21Z2∼χ12 より、
E[Z2]=1よって、
E[Y2]=nE[X1]E[Z2]=n–2nしたがって、分散は
Var[Y]=E[Y2]–(E[Y])2=n–2n
標準偏差
Std[X]=Var[X]=n–2n
scipy.stats の t 分布
scipy.stats.t で t 分布に従う確率変数を作成できます。
サンプリング
[-0.30791396 0.34077362 -2.2863223 -1.55023673 1.40032404]
確率密度関数
累積分布関数
統計量
mean 0.0
var 3.7027027027027017
std 1.924240812035412
コメント