サポートベクターマシーン(SVM)を理解してみる - デジタル・デザイン・ラボラトリーな日々

はじめに

ディープラーニング(深層学習)の理解もまだ進んでいないわけですが、今回は勝手に古い技術と思い込み何も理解しようとすらしていなかったサポートベクターマシン(Support Vector Machine：SVM)に着目してみます。

サポートベクターマシンとは

サポートベクターマシン(Support Vector Machine：SVM)は、1995年頃にAT&TのV.Vapnik(ウラジミール・ヴァプニーク(Vladimir Vapnik;1936-))が発表したパターン識別用の教師あり機械学習方法であり、局所解収束の問題が無い長所がある。「マージン最大化」というアイデア等で汎化能力も高め、現在知られている方法としては、最も優秀なパターン識別能力を持つとされている。
参照：サポートベクターマシン（SVM）

機械学習には大きく分けて「識別関数」「識別モデル」「生成モデル」の3つの種類があります。このなかで識別関数が確率を使わないので初心者が入門するのに最適です。

識別問題には線形分離可能と線形分離不可能がある。
f:id:Yaju3D:20180901022342p:plain

パーセプトロンという基礎的な識別関数の学習手法は、誤差関数の勾配を利用してどんどん誤差関数を小さくしていくというものであるが、この手法には下記の2点の課題がある。

モデルの汎化能力が保証されない。
線形分離可能な問題で利用できない。

SVMは2クラスの分類を行うための機械学習の手法で、大雑把に言うとパーセプトロンという基礎的な識別関数に「マージン最大化」と「カーネル関数」という考え方を導入して上記の課題に対応したものである。

マージン最大化 →　未学習データに対する高い汎化性能
カーネルトリック →　非線形の問題にも対応

マージン最大化

学習データの中で最も他クラスと近い位置にいるもの（サポートベクタ）を基準として、そのユークリッド距離が最大になるように識別面を決める。

汎化能力とは学習時に与えられた訓練データだけに対してだけでなく、未知の新たなデータに対するクラスラベルや関数値も正しく予測できる能力のことを指す。そもそも、単純パーセプトロンのような機械学習を利用する目的は、スパムメールの例であれば、学習では使っていないメールでも上手くスパムかどうかを分類することである。決して、以前にきたことのあるメールだけを分類すればいいというわけではない。

qiita.com