* Data Mining: Practical Machine Learning Tools and Techniques [#p12b9df4]
//ここには文献のリファレンスを書いてください.bibtex形式で書くことを推奨します.

*** 第3版 [#eefd2df8]
#amazon(0123748569)
 @Book{book,
  author =       "I. H. Witten and E. Frank and M. A. Hall",
  title =        "Data Mining: Practical Machine Learning Tools and Techniques",
  publisher =    "Morgan Kaufmann",
  year =         2011,
  edition =      "third"
 }
#amazon(,clear)

*** 第2版 [#eefd2df8]
#amazon(0120884070)
 @Book{book,
  author =       "I. H. Witten and E. Frank",
  title =        "Data Mining: Practical Machine Learning Tools and Techniques",
  publisher =    "Morgan Kaufmann",
  year =         2005,
  edition =      "second"
 }
#amazon(,clear)

*** 第1版 [#i1fdeefa]
#amazon(1558605525)
 @Book{book,
  author =       "I. H. Witten and E. Frank",
  title =        "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations",
  publisher =    "Morgan Kaufmann",
  year =         1999
 }
#amazon(,clear)

*キーワード [#q7829c23]

//ここにはキーワードを列挙してください.
[[データマイニング]], [[Weka]], 決定木, 回帰分析, 事例ベース推論, コストを考慮した学習, 交差確認, ROC曲線, 最小二乗法, [[MDL]], [[SVM]], サポートベクトル回帰, ニューラルネット, クラスタリング, [[COBWEB]], Winnow, EMアルゴリズム, ベイジアンネット, 特徴選択, 特徴抽出, アンサンブル学習, ロジスティック回帰, ラベルあり・なし混在データ


*メモ [#y1b538b5]

//内容とかを簡単に書いてください

-Z.-H. Zhou "Book Review: Three Perspectives of Data Mining", Artificial Intelligence, vol.143, pp.139-146 (2003)~
で紹介されているデータマイニングの著名な教科書の一つ.この書評によれば次のような傾向がある
--文献1:[[Book/Data Mining - Practical Machine Learning Tools and Techniques]] -- 機械学習寄り
--文献2:[[Book/Principles of Data Mining]] -- [[統計]]寄り
--文献3:[[Book/Data Mining - Concepts and Techniques]] -- データベース寄り

*** 概要と特徴 [#oc65bdc4]

- 最大の特徴はFreewereのデータマイニングツール[[Weka]]の開発者による利用法のチュートリアルが後半についている点
-- 第1版では[[Weka]]の中でもexploerというインタフェースについてだけだったが,第2版ではknowledge flow,コマンドライン,APIの利用など大幅に強化
-- [[Weka]]はJavaが実行できればOSは選ばないが,マック使いのしましまとしては,スクリーンショットがMacOSXのものになったのがうれしい &bigsmile;
- 章立てはアルゴリズムの体系化をしようとしていると思う
-- 最初の3章はイントロ,入力の形式,そして出力の形式
-- 4章はアルゴリズムの用途の紹介,6章はアルゴリズムこの個別の手法.
-- 5章は結果の評価法,7章は前処理手法.なぜこの順番なのか,ちょっと疑問.
- 数式はほとんどない.アルゴリズムは仮想コードによる説明がほとんど
-- アルゴリズムを''使うに当たって''知っておくべきことをまとめた感じ
-- 各手法の背景とか誤差に関する理論とかは全くないので,このあたりは他の2冊をみるべき
-- データベース関係は全くない
- [[Weka]]以外で第2版で追加された項目:ラベルあり・なし混在データ, ベイジアンネット, コストを考慮した学習, [[SVM]]など
- 実際にデータにふれながらデータマイニングを学びたい人向けだと思う

> -- しましま

*リンク集 [#s533d605]

//サポートページなど関連リンクを書いてください.
-[[サポートページ>http://www.cs.waikato.ac.nz/ml/weka/book.html]]:errta, 講義資料,目次
-[[GoogleScholarAll:Data Mining: Practical Machine Learning Tools and Techniques]]
-Amazon.co.jpへのリンク:&amazon(0120884070);

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS