時系列とは,時間と共に変化するデータやイベントを継続的に観測した系列.
通常は,観測する時間間隔は一定.
統計などの分野では,従来から将来のデータの予測,検定,周期性の検証などが行われてきた.
データマイニングの分野では次のような解析もなされるようになってきた(文献1)
- 索引付け(内容による質問):質問時系列 \(Q\) と,類似度 \(D(Q,C)\) にもとづいて,事例集合中から最も類似した時系列を見つける.
- クラスタリング:類似度尺度 \(D(Q,C)\) に基づき事例集合中の時系列をグループ化する.
- クラス分類:ラベルのない時系列 \(Q\) を,二つ以上の事前に定めたクラスに割り当てる.
- セグメンテーション:\(n\)個のデータ点を持つ時系列 \(Q\) を,この\(Q\) を近似するような \(K\ll n\) 個の部分から成るモデル \(\bar{Q}\) を生成.
構造化データの中でも最も長く研究されてきたため多様なモデルが利用されている.
-- しましま
関連項目†
リンク集†
関連文献†
- 文献1:時系列データの研究のためのテスト用データ充実の必要性を示した論文だが,時系列に対するデータマイニング技術のサーベイとしてもすぐれる.
E. Keogh and S. Kasetty, "On the Need for Time Series Data Mining Benchmarks: A Survey and Empirical Demonstration", Data Mining and Knowledge Discovery, vol.7, pp.349-371 (2003)
GoogleScholarAll:On the Need for Time Series Data Mining Benchmarks: A Survey and Empirical Demonstration
- 時系列からスライディングウィンドウと呼ぶ方法で集めた部分系列をクラスタリングする問題が無意味であると述べた論文.
E. Keogh and J. Lin, "Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research", Knowledge and Information Systems, vol.8, pp.154-177 (2005)
E. Keogh, J. Lin, and W. Truppel, "Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research", 3rd ICDM, pp.115-122 (2003)
GoogleScholarAll:Clustering of Time-Series Subsequences is Meaningless
- P.Esling&C.Agon "Time-series data mining", ACM CSUR, vol.45, issue 1 (2012)
- 統計の時系列解析
北川 源四郎 "時系列解析入門" 岩波書店 (2005)
- Book/人工知能学事典 13-13節
- Book/統計学の基礎I(統計科学のフロンティア1) 第2部
- Book/Data Mining - Concepts and Techniques 8.2節
- Book/Pattern Recognition and Machine Learning 13節
- Book/Principles of Data Mining 14.6節