並列や分散計算機環境に実装したデータマイニングアルゴリズム.
分散データマイニングを利用する目的としては, 並列・分散計算機環境を導入するときの通常の目的である大規模化や高速化がまず挙げられる.
さらに,物理的に離れた位置に大規模データベースを構築した場合,ネットワークを通じて全体を転送するのが困難になる場合がある.こうしたときにはできるだけ局所的に計算し,通信容量を削減することが必要になる.こうした目的でも分散データマイニングは必要になる.
また,分散環境に参加するデータベースが異なる組織で管理されている場合,個々のデータは復元出来ないようにして,全体の解析を行うプライバシー保護データマイニングもある.
-- しましま