Clustering Using REpresentatives (CURE) は,超楕円体以外の形状のクラスタを抽出できるクラスタリング手法. そうした形状のクラスタを扱うため,各クラスタを一つの代表点ではなく,c 個の代表点で表す.
クラスタの生成
凝集型階層的クラスタリングである単リンク法に似ている.
ただし,単リンク法では,二つのクラスタ中の点の間で最も近い点の対の距離をクラスタの距離とする.それに対し,CURE では,c個の代表点の間の最短距離がクラスタ間の距離となる.
それ以外は,各クラスタがデータ点一つの状態から始めて,最も近いクラスタを逐次併合する.
クラスタの併合
クラスタ u と v を併合して,新たなクラスタ w を作る.このとき,w の代表点集合を次の二つの手続きで見つける
w の代表点を選ぶとき,w 中の全ての点ではなく,u と v の代表点のみを候補として計算量を減らす方法も提案.
-- しましま