Minepi†
AprioriAll や PrefixSpan とは異なるタイプの系列データからのマイニング問題を扱う.Winepi と類似した問題を扱う.
- イベント系列では,有限のイベント型のうちのイベントが,各時刻でたかだか1種類発生する.発生時刻とイベントの対を時間順に並べたもの.
例:<(E,31),(D,32),(F,33),(A,35),(B,37),(C,38),(E,39),(F,40),(C,42),(D,44)...(D,67)>
- エピソード:イベントが発生する時間的前後関係を半順序関係で表した,イベントの半順序集合.だが主に扱うのは次の2種類
- 並列エピソード:指定されたイベントの集合が,相対順序に特に制約なしに発生する.
- 直列エピソード:指定されたイベントの集合が,決められた順序で発生する.
- イベント \(\alpha\) の極小発生 (minimal occurrence):時刻 \(t_s\) で始まり,\(t_e\)の一つ前で終わる区間 \([t_s,t_e)\) で,イベントαが発生し,\(t_s\)を一つでも後ろに,もしくは\(t_e\)を一つでも前にずらすと,\(\alpha\)は発生しなくなるようなもののこと
- 例では,AとBの並列エピソードの,上記の系列中での極小発生は [35,38) に存在.
あるエピソード \(\alpha\) について,系列中の全ての極小発生をを含む集合 \(mo(\alpha)\) を考える.この\(mo(\alpha)\)の大きさが min_sup 以上のイベントを列挙するアルゴリズムがMinepi.
- 探索はAprioriと類似.イベント数が1個の頻出エピソード集合を初期集合とする.以後は,イベントを一つずつ追加して候補エピソード集合を作り,その中から実際に頻出のエピソードを抽出することを反復する幅優先探索.
- 見つけた極小発生の集合は,相関ルールのようなエピソード間の関係を見つけ出すのに利用する.
-- しましま
関連項目†
リンク集†
関連文献†