すでに蓄積されている大量のデータから興味深く再利用可能な規則性を見つけ出すこと.
Book/Advances in Knowledge Discovery and Data Mining では,狭義には,知識発見の中でデータのパターンを見つけるアルゴリズムのこととされる.しかし,最近ではこのプロセス全体を指すことが多い.
統計的推定などとの違いは,文献3の見方が興味深いと思う. 推定や学習では,正当性(Validity),有効性(Effectiveness),効率性(Efficiency)の三つの軸をとりあげ,それぞれを重視する研究が 統計,機械学習(人工知能),データベース の各分野になっているのではないかと指摘している. 実際のデータへの適用にはどの軸も大切で,バランスをとろうと心がけることがデータマイニングの特徴といえると思う.-- しましま