* Principles of Data Mining [#u4ec0838]
//ここには文献のリファレンスを書いてください.bibtex形式で書くことを推奨します.
#amazon(026208290X)
@Book{eb:046:00,
author = "D. J. Hand and H. Mannila and P. Smyth",
title = "Principles of Data Mining",
publisher = "The MIT Press",
year = 2001
}
#amazon(,clear)
*キーワード [#ma5893a1]
//ここにはキーワードを列挙してください.
[[データマイニング]], [[距離]], 可視化, 主成分分析, 多次元尺度構成法, バイアス-バリアンス, 最尤推定, ベイズ推定, 回帰分析, モデル選択, 最適化
*メモ [#c828ba2c]
//内容とかを簡単に書いてください
-Z.-H. Zhou "Book Review: Three Perspectives of Data Mining", Artificial Intelligence, vol.143, pp.139-146 (2003)~
で紹介されているデータマイニングの著名な教科書の一つ.この書評によれば次のような傾向がある
--文献1:[[Book/Data Mining - Practical Machine Learning Tools and Techniques]] -- 機械学習寄り
--文献2:[[Book/Principles of Data Mining]] -- [[統計]]寄り
--文献3:[[Book/Data Mining - Concepts and Techniques]] -- データベース寄り
*** 概要と特徴 [#pf3ee9ba]
- モデル,損失関数,最適化を軸にした説明.アルゴリズムの手順はあまりない.
- 数式による説明は3冊の中で一番多い
- [[Book/The Elements of Statistical Learning]]ほどではないが,バイアス-バリアンスといった理論もある.
- データベース関係も[[OLAP]]程度は,メモリ管理など大規模データの扱いと共に述べてある.
- 時系列データとか構造化データを,ベクトルデータに変換する方法とかはほとんどない
- 前処理手法については,基本的なことを丁寧に説明してある
- モデル選択や最適化について基礎的なことはひととおり書いてあるのは他の2冊とは違う
- モデルや最適化手法など,アルゴリズムを構成する要素や,その関係について学ぶのに良いと思う
*リンク集 [#tc307799]
//サポートページなど関連リンクを書いてください.
-[[GoogleScholarAll:Principles of Data Mining]]
-Amazon.co.jpへのリンク:&amazon(026208290X);