クラスタアンサンブル (cluster ensemble)

アンサンブル学習の枠組みで行うクラスタリング. 条件を変えて対象集合を分けて,同じ対象集合の複数のクラスタリングを得る. これらを弱クラスタリングなどという. これらの弱クラスタリングをまとめて一つのクラスタリングを得るのがクラスタアンサンブル (cluster ensemble)という.アンサンブルクラスタリングということもある. このとき,元の対象の特徴や,対象間の類似度を参照しないことに注意

目的

文献1では,クラスタアンサンブルの目的には次のようなものがあると述べている.

  • 頑健性:適用分野やデータ集合が違っても平均的に良い結果が得られる
  • 新規性:単一のクラスタリングでは見つからなかったものが見つかることも
  • 安定性と確信度推定:ノイズ,はずれ値,サンプリングの違いによる変動を抑制.クラスタリングの不確実性をアンサンブル分布から予測可能.
  • 並列化と大規模化:データや属性が分散した計算機環境の下で計算できる

クラスタリング

クラスタリングを得る方法には次のようなものがある

  • ランダム分割:ランダムに分けても,違うクラスタの対象対は高い確率で違うクラスタになると考えられる.
  • パラメータや部分空間を変える:アルゴリズムの超パラメータを変えたり,類似度を測る部分空間を変えたりする.特に低次元部分空間での弱クラスタリングを使う場合は,高次元データに対する対策として多用される.
  • 全く違うクラスタリング手法:多様なクラスタ構造を反映させるために,全く違うクラスタリング手法を適用する.

手法

-- しましま

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:12:19 (2494d)