Paper/ICDM-2003-p115

Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research†

@InProceedings{icdm:03:04,
 author =       "E. Keogh and J. Lin and W. Truppel",
 title =        "Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research",
 booktitle =    "Proc. of The 3rd {IEEE} Int'l Conf. on Data Mining",
 year =         2003,
 pages =        "115-122"
}

フルペーパー

@Article{kais:05:01,
 author =       "E. Keogh and J. Lin",
 title =        "Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research",
 journal =      "Knowledge and Information Systems",
 year =         2005,
 volume =       "8",
 pages =        "154-177"
}

↑

キーワード†

クラスタリング, 時系列

↑

メモ†

スライディングウィンドウにより得られた部分時系列をクラスタリングする問題がランダムな解を導く意味のないものであることを示した論文．

もう少し形式的に書くと，n個の部分系列 [t,t+w-1], [t+1, t+(w-1)+1] ... [t+n, t+(w-1)+n] を一つの系列から取り出す．これを長さ w のベクトルと見なしてクラスタリングすることを部分時系列クラスタリング (STSクラスタリング; subsequence time-series clustering) と呼ぶ．

このSTSクラスタリングをすると，クラスタリングの結果はノイズやクラスタリングの初期値に依存して決まるランダムな分割しか導かないと主張．また，k-meansなどを適用するとその中心はサイン曲線のようになる．

直観的な原因として自明な一致(trivial match)を挙げている．これは，[t,t+w-1] とその隣の [t+1,t+(w-1)+1] は多くの場合類似度が高くなる．そのため，どうしても時間的に近い系列が同じクラスタに入りやすくなってしまい，意図した結果が得られない．

単純な回避法としては，1ずつずらすのではなく，一度に充分に大きな幅ずつ移動するか，自明な一致を排除するようなヒューリスティクスの導入が挙げられる．

-- しましま

↑

リンク†

ICDM
GoogleScholarAll:Clustering of Time-Series Subsequences is Meaningless
各クラスタの中心がなぜサイン曲線になるのかをより詳細に示した論文
Tsuyoshi Ide "Why Does Subsequence Time-Series Clustering Produce Sine Waves?" 10th PKDD, pp.609-616 (2006) [LNAI 4213]
井手剛 "部分時系列クラスタリングの理論的基礎
 GoogleScholarAll:Why Does Subsequence Time-Series Clustering Produce Sine Waves?

朱鷺の杜Wiki

↑

参加しよう

Wiki超入門
練習用ページ
数式の表示
こびとさん
編集用ID: ibis
パスワード: 「VC次元」のVのフルスペルで最初だけ大文字

最新の30件
2024-04-13
- python
2024-04-09
- K-NEL
- K-NEL/errata
2023-11-22
- PRML/errata2
2023-11-21
- PRML/errata1
2023-11-01
- しましま/IBIS2023
2023-10-29
- IBIS
2023-06-16
- 人工知能学会全国大会
2023-06-11
- しましま/人工知能学会全国大会2023
2023-03-28
- Book
2022-11-27
- 朱鷺の社
2022-11-24
- しましま/IBIS2022
2022-07-08
- AutoTicketLinkName
2022-06-17
- しましま/人工知能学会全国大会2022
2021-11-13
- しましま/IBIS2021
2021-10-29
- 回帰分析
2021-06-11
- しましま/人工知能学会全国大会2021
2021-03-07
- MenuBar
2021-02-15
- python/numpy
2020-12-22
- 特異値分解
2020-12-18
- complement naive Bayes
2020-11-27
- しましま/IBIS2020
2020-10-17
- Paper/bias-on-the-web
2020-07-16
- F値
2020-06-30
- DataSet
2020-06-24
- バイアス-バリアンス
2020-06-10
- Paper
2020-03-15
- PRML
- PRML/link
2020-01-13
- Wiki超入門

↑

カウンタ

累計: 9092
今日: 2
昨日: 3