ガウスカーネルを使ったサポートベクターマシンで配送可能エリアを区分けする

2021年10月15日2024年5月18日

1. 三次元のカーネルトリックでは解けないサポートベクターマシン分類問題もある
2. ガウスカーネルで無限次元の分類ができる
3. ガウスカーネルをExcelに実装して試してみる

三次元のカーネルトリックでは解けないサポートベクターマシン分類問題もある

まずは前回のおさらいです。

下のようなデータがある時に、配送可能エリアと配送不可エリアを直線で分けることはできません。

そこで、x²やy²やxyという新たな特徴量を作り、３次元に非線形変換しました。

これによって下の写真のように直線で切り分けられるようになりました。

そして、その直線を元の２次元に復元すると、下図のように切り分ける曲線が出来上がるというものでした。

これをカーネルトリックと呼びました。

>> 【カーネルトリック】非線形のサポートベクターマシンをExcelに実装して理解する

ところが、もし次のようなデータだったらどうでしょうか？

実は前回のやり方では、このような分類曲線は作れません。

x²やy²やxyだけの特徴量では足りないのです。

このような曲線は２次関数では表現できないため、x³やy⁴等のもっと高次の特徴量が必要なのです。

でも、どのくらい次数を高めれば良いのか事前に決めるのは難しいですね。

ガウスカーネルで無限次元の分類ができる

そこで役に立つのがガウスカーネルです。

ガウスカーネルは

K(x, x’) = exp(-β║x-x’║²)

β>0

で定義されますが、e^xはマクローリン展開するとxについての無限次数の級数で表せるため、ガウスカーネルを使うと無限次数の特徴量を使っていることになるのです。

ちなみに、前回使ったカーネルは

K(x, x’) = (x^Tx’)²

でしたが、これは多項式カーネルと呼ばれ、一般的には次式で表現されます。

K(x, x’) = (x^Tx’+c)^d

この式でc=0、d=2と置いた式が前回使ったカーネルというわけです。

多項式カーネルだと次数は有限になってしまい、何次の多項式カーネルにすれば良いのか試行錯誤が必要になりますが、ガウスカーネルだとその手間がなくなります。

ガウスカーネルをExcelに実装して試してみる

損失関数の式をL2ノルムを使って変更する

それではガウスカーネルを使って、先の分類曲線が作れるかどうかをExcelで実験してみましょう。

まずはExcelに入力するために、式を具体的に書き直します。

サポートベクターマシンは、次式の目的関数Lを最大化させるようなλ_iを求める問題に帰着しました。

λ₁t₁+λ₂t₂+ ･･･ +λ_nt_n=0の条件下で、

L = (λ₁+λ₂+ ･･･ +λ_n ) – ½ (λ₁λ₁t₁t₁(Φ(x₁)^T Φ(x₁)) + λ₁λ₂t₁t₂(Φ(x₁)^T Φ(x₂)) + ･･･ + λ_nλ_nt_nt_n(Φ(x_n)^T Φ(x_n)))

今回の例では教師データが15個ありますので、n=15です。

また、

Φ(x₁)^T Φ(x₂) = K(x₁, x₂) = exp(-β║ x₁– x₂║²)

ですから、

L = (λ₁+λ₂+ ･･･ +λ_n ) – ½ (λ₁λ₁t₁t₁exp(-β║ x₁– x₁║²)+ λ₁λ₂t₁t₂exp(-β║ x₁– x₂║²)+ ･･･ + λ_nλ_nt_nt_nexp(-β║ x_n– x_n║²))

と書き換えられます。

ここで、║ x₁– x₂║はベクトルx₁とベクトルx₂のL2ノルムといい、次式で定義されます。

ベクトルx₁の成分を(x₁, y₁)、ベクトルx₂の成分を(x₂, y₂)とすると、

║ x₁– x₂║= √(x₁–x₂)²

= √((x₁-x₂)²+(y₁-y₂)²)

従って、ベクトルの成分（スカラー）で目的関数Lを表現すると、次式のようになります。

L = (λ₁+λ₂+ ･･･ +λ_n ) – ½ (λ₁λ₁t₁t₁exp(-β((x₁-x₁)²+(y₁-y₁)²))+ λ₁λ₂t₁t₂exp(-β((x₁-x₂)²+(y₁-y₂)²))+ ･･･ + λ_nλ_nt_nt_nexp(-β((x_n-x_n)²+(y_n-y_n)²)))

前回は

L = (λ₁+λ₂+ ･･･ +λ_n ) – ½ (λ₁λ₁t₁t₁exp(-β(x₁x₁+y₁y₁)²)+ λ₁λ₂t₁t₂exp(-β(x₁x₂+y₁y₂)²)+ ･･･ + λ_nλ_nt_nt_nexp(-β(x_nx_n+y_ny_n)²))