Data Mining: Practical Machine Learning Tools and Techniques†
第3版†
#amazon(0123748569)
@Book{book,
author = "I. H. Witten and E. Frank and M. A. Hall",
title = "Data Mining: Practical Machine Learning Tools and Techniques",
publisher = "Morgan Kaufmann",
year = 2011,
edition = "third"
}
第2版†
#amazon(0120884070)
@Book{book,
author = "I. H. Witten and E. Frank",
title = "Data Mining: Practical Machine Learning Tools and Techniques",
publisher = "Morgan Kaufmann",
year = 2005,
edition = "second"
}
第1版†
#amazon(1558605525)
@Book{book,
author = "I. H. Witten and E. Frank",
title = "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations",
publisher = "Morgan Kaufmann",
year = 1999
}
キーワード†
データマイニング, Weka, 決定木, 回帰分析, 事例ベース推論, コストを考慮した学習, 交差確認, ROC曲線, 最小二乗法, MDL, SVM, サポートベクトル回帰, ニューラルネット, クラスタリング, COBWEB, Winnow, EMアルゴリズム, ベイジアンネット, 特徴選択, 特徴抽出, アンサンブル学習, ロジスティック回帰, ラベルあり・なし混在データ
- Z.-H. Zhou "Book Review: Three Perspectives of Data Mining", Artificial Intelligence, vol.143, pp.139-146 (2003)
で紹介されているデータマイニングの著名な教科書の一つ.この書評によれば次のような傾向がある
概要と特徴†
- 最大の特徴はFreewereのデータマイニングツールWekaの開発者による利用法のチュートリアルが後半についている点
- 第1版ではWekaの中でもexploerというインタフェースについてだけだったが,第2版ではknowledge flow,コマンドライン,APIの利用など大幅に強化
- WekaはJavaが実行できればOSは選ばないが,マック使いのしましまとしては,スクリーンショットがMacOSXのものになったのがうれしい
- 章立てはアルゴリズムの体系化をしようとしていると思う
- 最初の3章はイントロ,入力の形式,そして出力の形式
- 4章はアルゴリズムの用途の紹介,6章はアルゴリズムこの個別の手法.
- 5章は結果の評価法,7章は前処理手法.なぜこの順番なのか,ちょっと疑問.
- 数式はほとんどない.アルゴリズムは仮想コードによる説明がほとんど
- アルゴリズムを使うに当たって知っておくべきことをまとめた感じ
- 各手法の背景とか誤差に関する理論とかは全くないので,このあたりは他の2冊をみるべき
- データベース関係は全くない
- Weka以外で第2版で追加された項目:ラベルあり・なし混在データ, ベイジアンネット, コストを考慮した学習, SVMなど
- 実際にデータにふれながらデータマイニングを学びたい人向けだと思う
-- しましま
リンク集†