Data Mining: Practical Machine Learning Tools and Techniques

第3版

@Book{book,
 author =       "I. H. Witten and E. Frank and M. A. Hall",
 title =        "Data Mining: Practical Machine Learning Tools and Techniques",
 publisher =    "Morgan Kaufmann",
 year =         2011,
 edition =      "third"
}

第2版

@Book{book,
 author =       "I. H. Witten and E. Frank",
 title =        "Data Mining: Practical Machine Learning Tools and Techniques",
 publisher =    "Morgan Kaufmann",
 year =         2005,
 edition =      "second"
}

第1版

@Book{book,
 author =       "I. H. Witten and E. Frank",
 title =        "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations",
 publisher =    "Morgan Kaufmann",
 year =         1999
}

キーワード

データマイニング, Weka, 決定木, 回帰分析, 事例ベース推論, コストを考慮した学習, 交差確認, ROC曲線, 最小二乗法, MDL, SVM, サポートベクトル回帰, ニューラルネット, クラスタリング, COBWEB, Winnow, EMアルゴリズム, ベイジアンネット, 特徴選択, 特徴抽出, アンサンブル学習, ロジスティック回帰, ラベルあり・なし混在データ

メモ

概要と特徴

  • 最大の特徴はFreewereのデータマイニングツールWekaの開発者による利用法のチュートリアルが後半についている点
    • 第1版ではWekaの中でもexploerというインタフェースについてだけだったが,第2版ではknowledge flow,コマンドライン,APIの利用など大幅に強化
    • WekaはJavaが実行できればOSは選ばないが,マック使いのしましまとしては,スクリーンショットがMacOSXのものになったのがうれしい [bigsmile]
  • 章立てはアルゴリズムの体系化をしようとしていると思う
    • 最初の3章はイントロ,入力の形式,そして出力の形式
    • 4章はアルゴリズムの用途の紹介,6章はアルゴリズムこの個別の手法.
    • 5章は結果の評価法,7章は前処理手法.なぜこの順番なのか,ちょっと疑問.
  • 数式はほとんどない.アルゴリズムは仮想コードによる説明がほとんど
    • アルゴリズム使うに当たって知っておくべきことをまとめた感じ
    • 各手法の背景とか誤差に関する理論とかは全くないので,このあたりは他の2冊をみるべき
    • データベース関係は全くない
  • Weka以外で第2版で追加された項目:ラベルあり・なし混在データ, ベイジアンネット, コストを考慮した学習, SVMなど
  • 実際にデータにふれながらデータマイニングを学びたい人向けだと思う

-- しましま

リンク集


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:10:46 (2489d)