誤り訂正出力符号 (error correcting output code; ECOC)

誤り訂正出力符号は,多クラスの分類問題を,2値分類器で解くための手法.

一対他分類器では,\(k-1\)個の,一対一分類器では,\(k(k-1)/2\)個の分類器を学習する.多数の分類器を使うと頑健性は向上するが,多くの計算量が必要になる. \(k-1\)と\(k(k-1)/2\)個の間の個数の分類器で,頑健性と計算量のバランスをとるための手法が誤り訂正出力符号を使った多クラス分類.

クラス\分類器123456
A111111
B000111
C011100
D101010

A〜Dの4クラスの場合に,6個の分類器を使う例. この表は,分類器 1 は,クラスAとDでは1を,クラスBとCでは0を出力することを示す. ここで,各クラスの行を,そのクラスの符号とする.

頑健性を向上させるため,行ベクトルの符号は,Hamming距離で測って互いに離れるようにする.符号長を \(L\) とすると,Hamming距離は \(k\) から \(L-k\) の間にできる.この例ではHamming距離は3か4になっている.同時に,同じ列があってはならず,列の0/1を反転させたものも他の列にあってはならない.という訳で \(k\) が大きいと設計は大変.

分類は,1〜6の分類器の出力の符号と,各クラスの符号を比べHamming距離で一番近いクラスに分類する. 例えば,分類器1〜6が 100111 という出力をした場合,クラス A〜D の符号へのHamming距離はそれぞれ,2,1,5,3となり,一番近いクラスBに分類にする.

-- しましま

関連項目

リンク集

Freeware

関連文献


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2016-03-28 (月) 14:03:49 (250d)