* ORCLUS [#x9e1e588]

//ここには %項目の説明を書いてください.よろしければ署名しておいてください.

ORCLUS (arbitrarily ORiented projected CLUSter generation) はトップダウン型の部分空間クラスタリング手法.
[[ORCLUS]] と同じ戦略だが,各クラスタの部分空間が軸に平行である制限がない.


初期的には,多数の小さな,比較的高次元の部分空間をもつクラスタに分割.
これらのクラスタを反復的に併合して,少数の低次元部分空間をもつクラスタを見つけてゆく.

軸に平行でない部分空間を見つけるために,主成分分析の逆である,minor component analysis (MCA) を利用する.主成分分析では,固有値の大きな軸から選ぶが,小さな軸から選ぶことで,分散の小さな軸を見つけることができる.

各反復は,以下の3ステップ
- (1) データ点のクラスタへの割り当て~
各データを,そのseed点までの距離が一番近いクラスタへ分類.ただし,距離は,各クラスタの現在の部分空間中で測る
- (2) 部分空間の再計算~
MCAを用いて,クラスタ内の分散が小さくなるような部分空間を選択する
- (3) クラスタの併合
-- クラスタを仮に併合したとして,併合後の部分空間を求める
-- 併合前と併合後の部分空間が近いと併合されやすい性質をもつ評価関数に基づいて併合するクラスタを決定

事前に定めた数になるまで,クラスタ数が減ったら停止.

さらに,BIRCH のように各クラスタごとに十分統計量のみを保持することで,大規模化も行う.

> -- しましま

** 関連項目 [#b8f39fee]

//英語や同義語のあとに,#brで区切って関連する項目をリストしてください.
-[[クラスタリング]]
-[[部分空間クラスタリング]]
-[[PROCLUS]]
-[[特徴選択]]
-[[次元削減]]
-[[主成分分析]]
#br
-[[検索:ORCLUS]]

** リンク集 [#c248b456]

*** Freeware [#ve7c167b]

-[[ELKI>http://www.dbs.ifi.lmu.de/research/KDD/ELKI/]] ORCLUSを含むパッケージ

** 関連文献 [#vc327315]

//この%項目%に関連する書籍や論文を紹介してください.

-基本文献~
C.C.Aggarwal and P.S.Yu,  "Finding Generalized Projected Clusters in High Dimensional Spaces", SIGMOD 2000~
[[GoogleScholarAll:Finding Generalized Projected Clusters in High Dimensional Spaces]]

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS