* Data Mining: Practical Machine Learning Tools and Techniques [#p12b9df4]
//ここには文献のリファレンスを書いてください.bibtex形式で書くことを推奨します.
*** 第3版 [#eefd2df8]
#amazon(0123748569)
@Book{book,
author = "I. H. Witten and E. Frank and M. A. Hall",
title = "Data Mining: Practical Machine Learning Tools and Techniques",
publisher = "Morgan Kaufmann",
year = 2011,
edition = "third"
}
#amazon(,clear)
*** 第2版 [#eefd2df8]
#amazon(0120884070)
@Book{book,
author = "I. H. Witten and E. Frank",
title = "Data Mining: Practical Machine Learning Tools and Techniques",
publisher = "Morgan Kaufmann",
year = 2005,
edition = "second"
}
#amazon(,clear)
*** 第1版 [#i1fdeefa]
#amazon(1558605525)
@Book{book,
author = "I. H. Witten and E. Frank",
title = "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations",
publisher = "Morgan Kaufmann",
year = 1999
}
#amazon(,clear)
*キーワード [#q7829c23]
//ここにはキーワードを列挙してください.
[[データマイニング]], [[Weka]], 決定木, 回帰分析, 事例ベース推論, コストを考慮した学習, 交差確認, ROC曲線, 最小二乗法, [[MDL]], [[SVM]], サポートベクトル回帰, ニューラルネット, クラスタリング, [[COBWEB]], Winnow, EMアルゴリズム, ベイジアンネット, 特徴選択, 特徴抽出, アンサンブル学習, ロジスティック回帰, ラベルあり・なし混在データ
*メモ [#y1b538b5]
//内容とかを簡単に書いてください
-Z.-H. Zhou "Book Review: Three Perspectives of Data Mining", Artificial Intelligence, vol.143, pp.139-146 (2003)~
で紹介されているデータマイニングの著名な教科書の一つ.この書評によれば次のような傾向がある
--文献1:[[Book/Data Mining - Practical Machine Learning Tools and Techniques]] -- 機械学習寄り
--文献2:[[Book/Principles of Data Mining]] -- [[統計]]寄り
--文献3:[[Book/Data Mining - Concepts and Techniques]] -- データベース寄り
*** 概要と特徴 [#oc65bdc4]
- 最大の特徴はFreewereのデータマイニングツール[[Weka]]の開発者による利用法のチュートリアルが後半についている点
-- 第1版では[[Weka]]の中でもexploerというインタフェースについてだけだったが,第2版ではknowledge flow,コマンドライン,APIの利用など大幅に強化
-- [[Weka]]はJavaが実行できればOSは選ばないが,マック使いのしましまとしては,スクリーンショットがMacOSXのものになったのがうれしい &bigsmile;
- 章立てはアルゴリズムの体系化をしようとしていると思う
-- 最初の3章はイントロ,入力の形式,そして出力の形式
-- 4章はアルゴリズムの用途の紹介,6章はアルゴリズムこの個別の手法.
-- 5章は結果の評価法,7章は前処理手法.なぜこの順番なのか,ちょっと疑問.
- 数式はほとんどない.アルゴリズムは仮想コードによる説明がほとんど
-- アルゴリズムを''使うに当たって''知っておくべきことをまとめた感じ
-- 各手法の背景とか誤差に関する理論とかは全くないので,このあたりは他の2冊をみるべき
-- データベース関係は全くない
- [[Weka]]以外で第2版で追加された項目:ラベルあり・なし混在データ, ベイジアンネット, コストを考慮した学習, [[SVM]]など
- 実際にデータにふれながらデータマイニングを学びたい人向けだと思う
> -- しましま
*リンク集 [#s533d605]
//サポートページなど関連リンクを書いてください.
-[[サポートページ>http://www.cs.waikato.ac.nz/ml/weka/book.html]]:errta, 講義資料,目次
-[[GoogleScholarAll:Data Mining: Practical Machine Learning Tools and Techniques]]
-Amazon.co.jpへのリンク:&amazon(0120884070);