データマイニングの基礎

@Book{jb:033:00,
 author =       "元田 浩 and 津本 周作 and 山口 高平 and 沼尾 正行",
 title =        "データマイニングの基礎",
 publisher =    "オーム社",
 year =         2006
}

キーワード

データマイニング, 知識発見, 決定木, CART, ID3, 単純ベイズ, 最近傍法, 相関ルール, Apriori, アンサンブル学習, バギング, ブースティング, ランダムフォレスト, クラスタリング, 凝集型階層的クラスタリング, k-means法, ファジィc-means法, 混合分布, EMアルゴリズム, SVM, カーネル, 帰納論理プログラミング, FOIL?, 数値属性の離散化, 特徴選択, 特徴抽出, 事例選択, 交差確認, ブートストラップ, 検定, 精度, 再現率, ROC曲線, 多重比較, 順位相関係数, 最尤推定, AIC, MDL, BIC

メモ

  • データマイニングについて,初学者向き(学部3回〜修士1回)に書かれた本.現在,初学者には最も薦められる本だと思う.
  • アルゴリズムの説明だけではなく,実際にデータから知識発見を行う過程を重視している点が特徴.そのため,アルゴリズムを適用する前の処理や,その後の結果の検証や検定についても非常に詳しい.特に,この分野の本で検定にこれだけ分量をさいて,マイニング・学習の結果に関連した検定手法をまとめた本は少ないと思う.
  • 適用事例については多数を挙げるのではなく,医療データの解析例について,最後に前処理,解析,結果の検証と具体的な手順を一つ述べている.
  • 本のページ数に対して非常に多くの方法が紹介されていて,これらを俯瞰するには最適.代表的な手法については丁寧な数値例が示されている.それ以外は概要なので,そういった手法があることが分かる程度.
  • 本の性格上,アルゴリズムの手順については書かれているが,その背後の理論は省略.すなわち,アルゴズムの表面と中身はあるが,裏側はない. なので,構造的損失最小化, バイアス-バリアンス, 再生核Hilbert空間などの背後の理論については書かれていない.

-- しましま

リンク集


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:10:48 (2493d)