* AprioriAll [#k4f5d94e]

//ここには %項目の説明を書いてください.よろしければ署名しておいてください.

AprioriAllは,系列パターンの列挙問題を,バスケットデータ解析のAprioriで利用されるのと同様の単調性を利用し,幅優先探索で解くアルゴリズム.

系列中にあるアイテム集合の数を系列の長さという.
ここで,長さ k の系列が頻出であるには,長さ k-1 の全ての部分系列が頻出でなけれ
ばならないことを利用する.
例えば,\(\langle(a) (cd) (be)\rangle\) が頻出になるには,\(\langle(cd) (be)\rangle\),\(\langle(a) (be)\rangle\),および \(\langle(a) (cd)\rangle\) が頻出でなければならない.

この性質を使って候補系列を生成し,実際に頻出かどうかを調べる.
短い系列から順に幅優先探索で全体を調べる.

''GSP (Generalized Sequential Patterns)'' はこのAprioriAllの改良手法.系列パターン中のマッチするアイテム集合の間の長さの制限や,効率化などが図られている.

> -- しましま

**関連項目 [#q5bb962a]

//英語や同義語のあとに,#brで区切って関連する項目をリストしてください.
-[[GSP]]
#br
-[[系列パターン]]
-[[バスケットデータ]]
-[[データマイニング]]
-[[頻出パターンマイニング]]
-[[Apriori]]
-[[PrefixSpan]]
#br
-[[検索:AprioriAll GSP]]

**リンク集 [#x77b8d00]

//関連するWWW資源があればリンクしてください.
-[[Wikipedia:GSP_Algorithm]]

**関連文献 [#o560cffe]

//この%項目%に関連する書籍や論文を紹介してください.

-[[Book/Data Mining - Concepts and Techniques]] 8.3.2節
-AprioriAllの基本文献~
R.Agrawal and R.Srikant, "Mining Sequential Patterns", Proc. of The 11th Int'l Conf. on Data Engineering, pp.3-14 (1995)~
[[GoogleScholarAll:Mining Sequential Patterns]]
-GSPの基本文献~
R.Srikant and R.Agrawal, "Mining Sequential Patterns: Generalizations and performance improvements", In Proc. of The 5th Int'l Conference on Extending Database Technology (1996)~
[[GoogleScholarAll:Mining Sequential Patterns: Generalizations and performance improvements]]

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS