概要
離散確率分布の1つである二項分布について解説します。
確率関数
確率変数 X が次のような確率関数をもつとき、X はパラメータ n,p の二項分布 (binominal distribution) に従うという。
確率変数 X がパラメータ n,p の二項分布に従うことを X∼B(n,p) と表す。
fX(x)={(xn)px(1–p)n–x0x=0,1,⋯,nその他の場合ただし、n は正の整数、0≤p≤1
確率関数である
二項定理 (a+b)n=∑x=0n(xn)axbn–x より、
x=0∑n(xn)px(1–p)n–x=x=0∑n(p+(1–p))n=1また、fX(x)≥0 は明らか。
解釈
結果が成功か失敗かのいずれかである試行をベルヌーイ試行 (Bernoulli trial) という。
ベルヌーイ試行を n 回行ったときの成功回数を表す確率変数 X をとると、X はパラメータ n,p の二項分布に従う。
累積確率関数
P(X≤x)=k=0∑⌊x⌋(kn)pk(1–p)n–k
期待値
E[X]=x=0∑nx(xn)px(1–p)n–x=x=0∑nxx!(n–x)!n!px(1–p)n–x=x=1∑n(x–1)!(n–x)!n!px(1–p)n–x∵x=0の項目は0ここで、x’=x–1,n’=n–1 とおくと、
E[X]=x’=0∑n’x’!(n’–x’)!(n’+1)!px’+1(1–p)n’–x’=(n’+1)px’=0∑n’x’!(n’–x’)!n’!px’(1–p)n’–x’=npx’=0∑n’x’!(n’–x’)!n’!px’(1–p)n’–x’=np(p+(1–p))n’∵二項定理=np
分散
E[X(X–1)]=x=0∑nx(x–1)(xn)px(1–p)n–x=x=0∑nx(x–1)x!(n–x)!n!px(1–p)n–x=x=2∑n(x–2)!(n–x)!n!px(1–p)n–x∵x=0,1の項目は0ここで、x’=x–2,n’=n–2 とおくと、
E[X(X–1)]=x’=0∑n’x’!(n’–x’)!(n’+2)!px’+2(1–p)n’–x’=(n’+2)(n’+1)p2x’=0∑n’x’!(n’–x’)!n’!px’(1–p)n’–x’=n(n–1)p2x’=0∑n’x’!(n’–x’)!n’!px’(1–p)n’–x’=n(n–1)p2∵パラメータn’,pの二項分布の確率関数の総和は1よって、分散は
Var[X]=E[X2]–[E(X)]2=E[X(X–1)]+E[X]–[E(X)]2=n(n–1)p2+np–(np)2=np(1–p)
積率母関数
mX(t)=E[eXt]=x=0∑next(xn)px(1–p)n–x=x=0∑n(xn)(etp)x(1–p)n–x=(etp+1–p)n∵二項定理
ベルヌーイ分布との関係
X1,X2,⋯,Xn を独立で同一なパラメータ p のベルヌーイ分布に従うとき、この確率変数の和 Y=X1+X2+⋯+Xn はパラメータ n,p の二項分布に従う。
mY(t)=i=1∏nmXi(t)∵X1,X2,⋯,Xnは独立=i=1∏n(pet+1–p)∵パラメータpのベルヌーイ分布の積率母関数=(pet+1–p)nであるから積率母関数の一意性より、Y はパラメータ n,p の二項分布に従う。
再生性
X1,X2,⋯,Xk を独立で、Xi はパラメータ ni,p の二項分布に従うとき、この確率変数の和 Y=X1+X2+⋯+Xk はパラメータ n1+n2+⋯+nk,p の二項分布に従う。
mY(t)=i=1∏kmXi(t)∵X1,X2,⋯,Xnは独立で同一=i=1∏k(pet+1–p)ni∵パラメータni,pの二項分布の積率母関数=(pet+1–p)n1+n2+⋯+nkであるから積率母関数の一意性より、Y はパラメータ n1+n2+⋯+nk,p の二項分布に従う。
scipy.stats の二項分布
scipy.stats.binom で二項分布に従う確率変数を作成できます。
サンプリング
確率質量関数
累積分布関数
統計量
mean 3.0
var 2.0999999999999996
std 1.4491376746189437
コメント