CLIQUE

各クラスタごとに,まとまりのある部分空間も同時に求める部分空間クラスタリング

CLIQUEは,座標軸に平行な超平面で分離された高密度領域をクラスタとして抽出する. クラスタは,次のような選言標準形で表される.

((30≦age<50)∧(4≦salary≦8))∨((40≦age<60)∧(2≦salary<6))

アルゴリズムは次の3ステップ

  1. クラスタを含む部分空間の抽出
  2. クラスタの識別
  3. クラスタの最小記述の獲得

最初の高密度部分空間の抽出は Apriori と同様の手法で行う. 高密度な部分空間とは,一定割合以上のデータを含む,次のような連言で表された矩形領域

(30≦age<50)∧(4≦salary≦8)

この矩形領域が高密度であるには,(30≦age<50) と (4≦salary≦8) の両方の矩形領域が共に高密度部分空間でなくてはならない. この単調性は,Apriori の高頻度アイテム集合の単調性とほぼ同じなので,類似したアルゴリズムで抽出できる.

次のステップでは,こうして見つけた矩形領域を連結しているものごとにまとめることでクラスタとする.

最後に,クラスタを表す選言標準形の論理式を,できるだけ単純な式となるように整理する.

-- しましま

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:10:53