データストリームとは次の性質
- 連続的に与えられ,時間順に整列されている
- その更新頻度や間隔は一定ではない (時系列データとの相違)
- データの性質が急激に変化することがある
- 大量で,潜在的に無限に高速でデータが与えられる
これらの性質のため,データをそのまま全て蓄積することは不可能.
よって,目的に応じた要約技術を利用してデータを蓄積して学習を行う.
逐次学習とは,データの変動を考えたり,一定以上過去のデータの影響を無視したり,さらに,任意の期間の解析を扱ったりすることにより重点を置いていることが違うと思う.
-- しましま
関連項目†
リンク集†
関連文献†
- 有村 博紀,喜田 拓也 "データストリームのためのマイニング技術" 情報処理, vol.46, no.1, pp.4-11 (2005)
- 櫻井 保志 "時系列データのためのストリームマイニング技術" 情報処理, vol.47, no.7, pp.755-761 (2006)
- D.Barbará, "Requirements for Clustering Data Streams", SIGKDD Explorations, vol.3, issue.2, pp.23-27 (2002)
GoogleScholarAll:Requirements for Clustering Data Streams
- Book/Data Mining - Concepts and Techniques 8.1節