概要
連続確率分布の1つであるコーシー分布について解説します。
確率密度関数
確率変数 X が次のような確率密度関数をもつとき、X はパラメータ x0,γ のコーシー分布 (Cauchy distribution) に従うという。
fX(x)=π1(x–x0)2+γ2γただし、x0 は位置パラメータ、γ>0 は尺度母数である。
x0=0,γ=1 のとき、標準コーシー分布という。
fX(x)=π(x2+1)1
確率密度関数である
∫−∞∞π1(x–x0)2+γ2γdx=πγ∫−∞∞t2+γ21dt∵t=x–x0で置換積分=πγγπ∵積分1=1積分1の導出 Integral Calculator • With Steps!
また、fX(x)≥0 は明らか。
累積確率関数
P(X≤x)=∫−∞xπ1(t–x0)2+γ2γdt=πγ∫−∞x–x0u2+γ21du∵u=t–x0で置換積分=πγγ1(arctan(γx–x0)+2π)∵積分1=π1arctan(γx–x0)+21積分1の導出 Integral Calculator • With Steps!
期待値
E[X]=∫−∞∞xfX(x)dx=∫−∞∞x0fX(x)dx+∫−∞∞(x–x0)fX(x)dx=x0+∫−∞∞(x–x0)fX(x)dx=x0+πγ∫−∞∞(x–x0)2+γ2x–x0dx=x0+πγ∫−∞∞1+t2tdt∵t=γ1(x–x0)=x0+R1,R2→∞limπγ∫−R1R21+t2tdt=x0+R1,R2→∞lim2πγlogR12+1R22+1∵積分1ここで、
R1,R2→∞limlogR12+1R22+1は極限が存在しないので、E[X] は定義されない。
積分1の導出 Integral Calculator • With Steps!
分散
期待値が定義されないので、分散も定義されない
標準偏差
期待値が定義されないので、標準偏差も定義されない
scipy.stats のコーシー分布
scipy.stats.cauchy でコーシー分布に従う確率変数を作成できます。
サンプリング
[ 6.88852887e-01 1.63192866e-03 -1.39746430e-01 -1.66039028e+00
2.34561191e+00]
1000個サンプリングした結果を描画します。
図を見るとわかりますが、大半は 0 近辺の値となっていますが、まれに大きな外れ値が発生しています。これはコーシー分布が正規分布より裾野が広いために発生しています。
確率密度関数
比較するために正規分布も合わせて描画しました。
累積分布関数
統計量
期待値、分散、標準偏差は定義されないので、NaN を返します。
サンプル数 N を増やした場合の標本平均の値を描画します。
図を見るとわかりますが、N を増やしても外れ値の影響で標本平均が収束しないことがわかります。
参考文献
コメント