OpenCV – バイラテラルフィルタの仕組みと cv2.bilateralFilter の使い方

概要

バイラテラルフィルタについて解説し、OpenCV の cv2.bilateralFilter でバイラテラルフィルタを適用する方法を紹介します。

バイラテラルフィルタ

バイラテラルフィルタとは、エッジを保存しつつ、平均化を行うように設計された次で紹介するフィルタです。

ガウシアンフィルタの欠点

分散を σ\sigma、カーネルサイズを nn としたガウシアンフィルタの重みは以下のようになっていました。

f(x,y)=12πσ2exp(x2+y22σ2) f(x, y) = \frac{1}{\sqrt{2 \pi \sigma^2}} \exp \left( -\frac{x^2 + y^2}{2 \sigma^2} \right) dst(x,y)=i=0n1j=0n1f(x+i,y+j)src(x+i,y+j) \text{dst}(x, y) = \sum_{i = 0}^{n – 1} \sum_{j = 0}^{n – 1} f(x + i, y + j) \text{src}(x + i, y + j)

ガウシアンフィルタは対象の画素値をより強調するように平均化を行うフィルタですが、以下の画像のようにエッジも平均化されてしまうため、物体の輪郭がぼやけた画像になります。

ガウシアンフィルタの適用結果

画像のエッジとは輝度値が大きく変わる部分です。

エッジ

ガウシアンフィルタでエッジがぼやけてしまう原因は対象画素と輝度値の差が大きい画素まで考慮してしまうためです。

バイラテラルフィルタの変更点

対象画素と輝度値の差が大きい画素は小さい重み付けになるようにガウシアンフィルタの重みを以下のように変更します。

f(x,y,x,y)=exp(x2+y22σ2)exp(((src(x,y)–src(x,y))22σ2) f(x, y, x’, y’) = \exp \left( -\frac{x’^2 + y’^2}{2 \sigma^2} \right) \exp \left( -\frac{((\text{src}(x, y) – \text{src}(x’, y’))^2}{2 \sigma^2} \right)

新たに追加された項の (src(x,y)–src(x,y))2(\text{src}(x, y) – \text{src}(x’, y’))^2 は対象の画素値 src(x,y)\text{src}(x, y) と周辺の画素値 src(x,y)\text{src}(x’, y’) との距離の2乗です。これを dd としたとき、

exp(d22σ2)\exp \left( -\frac{d^2}{2 \sigma^2} \right) のグラフを描画すると以下のようになります。 距離 d=0d = 0 のとき 11 をとり、差が大きくなるにつれ、指数関数的に 00 に近づいていきます。この仕組みにより対象画素と輝度値の差が大きい画素について、小さな重みがつくようになります。

上の重み関数 f(x,y,x,y)f(x, y, x’, y’) を使って、出力値は次のように計算されます。

dst(x,y)=1ci=0n1j=0n1f(x,y,x+i,y+j)src(x+i,y+j) \text{dst}(x, y) = \frac{1}{c} \sum_{i = 0}^{n – 1} \sum_{j = 0}^{n – 1} f(x, y, x + i, y + j) \text{src}(x + i, y + j)

ただし、cc1ci=0n1j=0n1f(x,y,x+i,y+j)=1\frac{1}{c} \sum_{i = 0}^{n – 1} \sum_{j = 0}^{n – 1} f(x, y, x + i, y + j) = 1 とするための正則化項で

c=j=0n1f(x,y,x+i,y+j) c = \sum_{j = 0}^{n – 1} f(x, y, x + i, y + j)

cv2.bilateralFilter

cv2.bilateralFilter() でバイラテラルフィルタを適用できます。

引数の sigmaColorsigmaSpace は以下に対応します。

f(x,y,x,y)=exp(x2+y22σspace2)exp(((src(x,y)–src(x,y))22σcolor2) f(x, y, x’, y’) = \exp \left( -\frac{x’^2 + y’^2}{2 \sigma_{space}^2} \right) \exp \left( -\frac{((\text{src}(x, y) – \text{src}(x’, y’))^2}{2 \sigma_{color}^2} \right)

sample.jpg

In [ ]:
import cv2
import numpy as np
from IPython.display import Image, display


def imshow(img):
    """ndarray 配列をインラインで Notebook 上に表示する。
    """
    ret, encoded = cv2.imencode(".jpg", img)
    display(Image(encoded))

    # 画像を読み込む。


img = cv2.imread("sample.jpg")

# バイラテラルフィルタ
dst = cv2.bilateralFilter(img, 15, sigmaColor=50, sigmaSpace=20)
imshow(dst)
Python

エッジは保持したまま、平均化ができていることが確認できます。

コメント

コメントする