STREAM

データストリームクラスタリングの先駆的研究.ベタな名前だが,特に何かの略というわけではない.

データストリームを,一定の大きさのチャンク単位ごとに読み込む. このチャンクを,LSEARCHと呼ぶを高速なクラスタリング手法で分割し,その中心位置だけを保持して,元のデータは廃棄する.中心位置だけなので,少ないメモリで保持できる.

そうして得られたクラスタの中心を,後で大域的なクラスタリングにかける点はBIRCHなど他のデータストリームクラスタリング手法と同じ.

LSEARCHは,k-medoids型のクラスタリングを,誤差の上限を保証した近似で解くことで高速化を実現する手法.

-- しましま

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:11:23