#amazon(4274203484)
@Book{jb:033:00,
author = "元田 浩 and 津本 周作 and 山口 高平 and 沼尾 正行",
title = "データマイニングの基礎",
publisher = "オーム社",
year = 2006
}
キーワード†
データマイニング, 知識発見, 決定木, CART, ID3, 単純ベイズ, 最近傍法,
相関ルール, Apriori, アンサンブル学習, バギング, ブースティング,
ランダムフォレスト, クラスタリング, 凝集型階層的クラスタリング,
k-means法, ファジィc-means法, 混合分布, EMアルゴリズム, SVM, カーネル,
帰納論理プログラミング, FOIL, 数値属性の離散化, 特徴選択, 特徴抽出,
事例選択, 交差確認, ブートストラップ, 検定, 精度, 再現率, ROC曲線, 多重比較,
順位相関係数, 最尤推定, AIC, MDL, BIC
- データマイニングについて,初学者向き(学部3回〜修士1回)に書かれた本.現在,初学者には最も薦められる本だと思う.
- アルゴリズムの説明だけではなく,実際にデータから知識発見を行う過程を重視している点が特徴.そのため,アルゴリズムを適用する前の処理や,その後の結果の検証や検定についても非常に詳しい.特に,この分野の本で検定にこれだけ分量をさいて,マイニング・学習の結果に関連した検定手法をまとめた本は少ないと思う.
- 適用事例については多数を挙げるのではなく,医療データの解析例について,最後に前処理,解析,結果の検証と具体的な手順を一つ述べている.
- 本のページ数に対して非常に多くの方法が紹介されていて,これらを俯瞰するには最適.代表的な手法については丁寧な数値例が示されている.それ以外は概要なので,そういった手法があることが分かる程度.
- 本の性格上,アルゴリズムの手順については書かれているが,その背後の理論は省略.すなわち,アルゴズムの表面と中身はあるが,裏側はない.
なので,構造的損失最小化, バイアス-バリアンス, 再生核Hilbert空間などの背後の理論については書かれていない.
-- しましま
リンク集†