Winepi†
AprioriAll や PrefixSpan とは異なるタイプの系列データからのマイニング問題を扱う.Minepi と類似した問題を扱う.
- イベント系列では,有限のイベント型のうちのイベントが,各時刻でたかだか1種類発生する.発生時刻とイベントの対を時間順に並べたもの.
例:<(E,31),(D,32),(F,33),(A,35),(B,37),(C,38),(E,39),(F,40),(C,42),(D,44)...(D,67)>
- エピソード:イベントが発生する時間的前後関係を半順序関係で表した,イベントの半順序集合.だが主に扱うのは次の2種類
- 並列エピソード:指定されたイベントの集合が,相対順序に特に制約なしに発生する.
- 直列エピソード:指定されたイベントの集合が,決められた順序で発生する.
- ウィンドウ:系列上の一定の時間幅の範囲
- 例:時刻35から始まる幅が5のウィンドウ(時刻39に終了)には,イベント A と B の並列エピソードは発生するか,イベント E と F の直列エピソードは発生していない(イベントFはウィンドウからはみ出している).
- 頻度:あるエピソードαの頻度とは,系列上で開始時刻を一つずつずらせてウィンドウを移動させるとき,全ウィンドウ数に対する,エピソードαが発生するウィンドウ数の割合
Winepi は,頻度が min_fr 以上のエピソードを列挙するアルゴリズム
- 探索はAprioriと類似.イベント数が1個の頻出エピソード集合を初期集合とする.以後は,イベントを一つずつ追加して候補エピソード集合を作り,その中から実際に頻出のエピソードを抽出することを反復する幅優先探索.
- 見つけた頻出エピソードの集合は,相関ルールのようなエピソード間の関係を見つけ出すのに利用する.
-- しましま
関連項目†
リンク集†
関連文献†