概要
連続確率分布の1つである正規分布について解説します。
確率密度関数
確率変数 X が次のような確率密度関数をもつとき、X はパラメータ μ,σ2 の正規分布 (normal distribution) またはガウス分布 (Gaussian distribution) に従うという。
確率変数 X がパラメータ μ,σ2 の正規分布に従うとき、X∼N(μ,σ2) と表す。
fX(x)=2πσ21exp(−2σ2(x–μ)2),x∈R
確率密度関数の要件を満たしている
∫−∞∞2πσ21exp(−2σ2(x–μ)2)dx=∫−∞∞2πσ21exp(−2σ2(t–μ)2)dt=2πσ1∫−∞∞exp(−u2)2σdu∵u=2σt–μと置換積分=π1∫−∞∞exp(−u2)du∵ガウス積分=π1π=1
累積確率関数
P(X≤x)=∫−∞x2πσ21exp(−2σ2(t–μ)2)dt=2πσ1∫−∞2σx–μexp(−u2)2σdu∵u=2σt–μと置換積分=π1∫−∞2σx–μexp(−u2)du=π1(∫−∞0exp(−u2)du+∫02σx–μexp(−u2)du)=π1(2π+∫02σx–μexp(−u2)du)∵ガウス積分=21+21π2∫02σx–μexp(−u2)du=21(1+erf(2σx–μ))∵erfの定義
期待値
E[X]=σ2π1∫−∞∞xexp(−2σ2(x–μ)2)dx=2πσ2σ∫−∞∞(2σt+μ)exp(−t2)dx∵t=2σx–μで置換積分=π1(2σ∫−∞∞texp(−t2)dt+μ∫−∞∞exp(−t2)dt)=π1(2σ⋅0+μπ)∵ガウス積分=μ
分散
E[X2]=σ2π1∫−∞∞x2exp(−2σ2(x–μ)2)dx=2πσ2σ∫−∞∞(2σt+μ)2exp(−t2)dx∵t=2σx–μで置換積分=π1(2σ2∫−∞∞t2exp(−t2)dt+22σμ∫−∞∞texp(−t2)dt+μ2∫−∞∞exp(−t2)dt)=π1(2σ22π+22σμ⋅0+μ2π)=σ2+μ2
よって、分散は
Var[X]=E[X2]–(E[X])2=σ2+μ2–μ2=σ2
標準偏差
Std[X]=Var[X]=σ
積率母関数
mX(t)=E[etX]=2πσ1∫−∞∞etxexp(−2σ2(x–μ)2)dx=2πσ1∫−∞∞exp(tx−2σ2(x–μ)2)dx=exp(μt+2σ2t2)∫−∞∞2πσ1exp(−2σ2(x–(μ+σ2t))2)dx=exp(μt+2σ2t2)∫−∞∞fX(x)dx∵パラメータμ+σ2t,σ2の正規分布=exp(μt+2σ2t2)
正規分布のk次の中心積率
X∼N(μ,σ2) のとき、
E[(X–μ)k]={(k–1)!!σk=((k–1)(k–3)⋯1)σk0k=2,4,⋯k=1,3,⋯例:
E[(X–μ)2]E[(X–μ)4]=1=3証明:
積率母関数の定義より、
mX–μ(t)=E[exp((X–μ)t)]=E[k=0∑∞k!((X–μ)t)k]∵マクローリン展開=k=0∑∞E[(X–μ)k]k!tk(1)他方、X–μ∼N(0,σ2) であるから、正規分布の積率母関数に当てはめると、
mX–μ(t)=exp(2σ2t2)=k=0∑∞k!(2σ2t2)k∵マクローリン展開=k=0∑∞2kk!σ2kt2k(2)両者の式の係数を比較すると、
k が奇数のとき、E[(X–μ)k]=0
k が偶数のとき、(1) における k=2n としたときの t2n の係数 2n!E[(X–μ)2n] と、(2) における t2n の係数 2nn!σ2n が同じなので、
2n!E[(X–μ)2n]E[(X–μ)2n]=2nn!σ2n=2nn!2n!σ2n2nn!=2n⋅2(n–1)⋯(2⋅1)=2n⋅(2n–2)⋅2 に注意すると、
E[(X–μ)2n]=2nn!2n!σ2n=2n⋅(2n–2)⋅22n⋅(2n–1)⋅(2n–2)⋯2⋅1σ2n=((2n–1)⋅(2n–3)⋯3⋅1)σ2n=(2n–1)!!σ2n
scipy.stats の正規分布
scipy.stats.norm で正規分布に従う確率変数を作成できます。
サンプリング
[ 0.49353417 1.45683727 -2.78100417 -0.28630157 -0.79504348]
確率密度関数
累積分布関数
統計量
コメント