カーネルk-means法 (kernel k-means method)

通常のk-means法の目的関数は次式 \[\mathrm{Err}(\{X_i\})=\sum_{c=1}^k\;\sum_{\mathbf{x}\in X_c}\;{||\mathbf{x} - \bar{\mathbf{x}}_c||}^2\] ただし,データ集合 \(X\) は,ベクトルで表現されたデータ \(\mathbf{x}\) の集合. クラスタ \(X_i\) は,データ集合の網羅的で互いに素な部分集合. \(\bar{x}_i\) は \(X_i\) 中の重心(セントロイドともいう). \(||\cdot||\) はユークリッドノルム.

ここで,\(\mathbf{x}\) を特徴空間に写して \(\phi(\mathbf{x})\) と置き換える.また,内積 \(\phi(\mathbf{x}_i)\cdot\phi(\mathbf{x}_j)\) を カーネル \(k(\mathbf{x}_i,\mathbf{x}_j)\) と置き換えると,上記の目的関数はカーネルだけで書ける. \[\sum_{c=1}^k\;\sum_{\mathbf{x}_i\in X_c}\;\Bigl[k(\mathbf{x}_i,\mathbf{x}_i)-\frac{2}{n_c}\sum_{\mathbf{x}_j\in X_c} k(\mathbf{x}_i,\mathbf{x}_j)+\frac{1}{n_c^2}\sum_{\mathbf{x}_j,\mathbf{x}_k\in X_c} k(\mathbf{x}_j,\mathbf{x}_k)\Bigr]\] ただし,\(n_c=|X_i|\).

こうして,カーネルトリックが適用でき,超球形以外のクラスタも抽出できるようになる.

-- しましま

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:12:18 (2487d)