概要
識別規則の1つである最大事後確率規則について解説します。
最大事後確率規則 (MAP decision rule)
事後確率 p(ci∣x) が最大となるクラスに割り当てる識別規則を最大事後確率識別規則 (maximum a posterior classifier ecision rule/MAP ecision rule) といいます。
gi(x)=p(ci∣x),(i=1,2,⋯,K)
クラス ci の決定領域は
Ri={x∈Rd∣ci=jargmaxp(cj∣x)}
入力 x の識別クラス y^ は
y^=iargmaxp(ci∣x)=ci s.t. p(ci∣x)≥p(cj∣x),(i=j)ベイズの定理 p(ci∣x)=p(x)p(x∣ci)p(ci) を適用すると、以下のように書き換えられます。
y^=iargmaxp(x)p(x∣ci)p(ci)=iargmaxp(x∣ci)p(ci)∵p(x)はすべてのiで共通=ci s.t. p(x∣ci)p(ci)≥p(x∣cj)p(cj),(i=j)
最大事後確率識別規則の誤り率を
ε(x)=E[1–imaxp(ci∣x)]と定義すると、その期待値は
E[ε(x)]=E[1–jmaxp(cj∣x)]=1–E[jmaxp(cj∣x)]=1–∫Rdjmaxp(cj∣x)p(x)dx∵期待値の定義=1–i=1∑K∫Rijmaxp(cj∣x)p(x)dx∵R1,R2,⋯,RKはRdの分割=1–i=1∑K∫Rip(ci∣x)p(x)dx∵x∈Ri→p(ci∣x)=jmaxp(cj∣x)p(cj)=1–i=1∑K∫Rip(x∣ci)p(ci)dx∵ベイズの定理
例: 2クラス分類
釣った魚の大きさが x∈R であったとき、その魚が鮭 (salmon)、スズキ (sea bass) のどちらであるかを識別する2クラス分類問題を考えます。(鮭、スズキ以外の魚が釣れることはないと仮定します)
以下の情報がわかっているものとします。
- 事前確率
- 釣った魚が鮭である確率は p(salmon)=32
- 釣った魚がスズキである確率は p(bass)=31
- 尤度
- 鮭の大きさは正規分布 N(5,1) に従う
p(x∣salmon)=2π1exp(−2(x–5)2)
- スズキの大きさは正規分布 N(10,4) に従う
p(x∣bass)=22π1exp(−8(x–10)2)
ベイズの定理より、事後確率は
p(salmon∣x)p(bass∣x)=2π1exp(−2(x–5)2)×32=22π1exp(−8(x–10)2)×31このとき、最大事後確率識別規則に従うと、予測クラスは
y^={salmonbassif p(salmon∣x)≥p(bass∣x)if p(salmon∣x)<p(bass∣x)p(x∣salmon),p(x∣bass) 及び p(salmon∣x),p(bass∣x) を描画すると以下のようになります。
このとき、鮭とスズキの決定領域は以下になります。
RsalmonRbass={x∈Rd∣p(salmon∣x)≥p(bass∣x)}={x∈Rd∣p(salmon∣x)<p(bass∣x)}Sympy で p(salmon∣x)=p(bass∣x) を解いて、最尤識別規則の決定境界を計算します
-0.514769585521292 7.18143625218796
p(salmon∣x)=p(bass∣x) の解は x=−0.51,7.18 であるとわかります。
鮭が釣れる確率が高いという事前確率が得られたことにより、決定境界が右に移動しました。
最大事後確率識別規則
コメント