* CluStream [#f0fa1636]

//ここには %項目の説明を書いてください.よろしければ署名しておいてください.

データストリームのためのクラスタリング手法.

ストリームのいろいろな期間のクラスタを調査できるように,pyramidal time frame構造で,いろいろな時期のデータのスナップショットを保持.
- スナップショットは,時間間隔を変えて複数の系列でとる.
- 次数 \(i\) のスナップショットの系列は,間隔 \(\alpha^i\) ごとに取得.
- 各次数ごとに最新のものを一定数個ずつ保存する
- 異なる次数で,重複したスナップショット保持しなくて済むので,総スナップショット数は抑制できる

スナップショットは,[[BIRCH]]や[[STREAM]]と同様に,マイクロクラスタと呼ぶ小さなクラスタの集合で表し,最終クラスタはこれらのマイクロクラスタをまとめたものになる.

マイクロクラスタは,初期的にはk-means法で生成.新たなデータは,既存マイクロクラスタに分類するか,新たなマイクロクラスタを生成して分類する.
また,マイクロクラスタは,[[BIRCH]]のCF-treeのような要約情報だけを保持することで,記憶容量を節約する.
また,この要約情報の加法性から,時刻 \(t\) と \(t-h\) のスナップショットがあれば,その間の期間に入力されたデータの情報が計算できるところがポイント.

> -- しましま

** 関連項目 [#f67d5709]

//英語や同義語のあとに,#brで区切って関連する項目をリストしてください.
-[[クラスタリング]]
-[[データストリーム]]
#br
-[[検索:CluStream]]

** リンク集 [#ed6fd45a]

//関連するWWW資源があればリンクしてください.

** 関連文献 [#b45e83c1]

//この%項目%に関連する書籍や論文を紹介してください.

-基本文献~
C.C.Aggarwal, J.Han, J.Wang, and P.S.Yu "A Framework for Clustering Evolving Data Streams" 29th VLDB, pp.81-92 (2003)~
[[GoogleScholarAll:A Framework for Clustering Evolving Data Streams]]
-[[Book/Data Mining - Concepts and Techniques]] 8.1.5節

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS