* データマイニングの基礎 [#e6199aca]
//1行目はタイトルとして目次ページに表示されます
#amazon(4274203484)
@Book{jb:033:00,
author = "元田 浩 and 津本 周作 and 山口 高平 and 沼尾 正行",
title = "データマイニングの基礎",
publisher = "オーム社",
year = 2006
}
#amazon(,clear)
//ここには文献のリファレンスを書いてください.bibtex形式で書くことを推奨します.
* キーワード [#h68c2a55]
//ここにはキーワードを列挙してください.
データマイニング, 知識発見, 決定木, [[CART]], [[ID3]], 単純ベイズ, 最近傍法,
相関ルール, [[Apriori]], アンサンブル学習, [[バギング]], ブースティング,
ランダムフォレスト, クラスタリング, 凝集型階層的クラスタリング,
k-means法, ファジィc-means法, 混合分布, EMアルゴリズム, [[SVM]], カーネル,
帰納論理プログラミング, [[FOIL]], 数値属性の離散化, 特徴選択, 特徴抽出,
事例選択, 交差確認, ブートストラップ, 検定, [[精度]], 再現率, ROC曲線, 多重比較,
順位相関係数, 最尤推定, [[AIC]], [[MDL]], [[BIC]]
* メモ [#w171dd50]
//内容とかを簡単に書いてください
- データマイニングについて,初学者向き(学部3回〜修士1回)に書かれた本.現在,初学者には最も薦められる本だと思う.
- アルゴリズムの説明だけではなく,実際にデータから知識発見を行う過程を重視している点が特徴.そのため,アルゴリズムを適用する前の処理や,その後の結果の検証や検定についても非常に詳しい.特に,この分野の本で検定にこれだけ分量をさいて,マイニング・学習の結果に関連した検定手法をまとめた本は少ないと思う.
- 適用事例については多数を挙げるのではなく,医療データの解析例について,最後に前処理,解析,結果の検証と具体的な手順を一つ述べている.
- 本のページ数に対して非常に多くの方法が紹介されていて,これらを俯瞰するには最適.代表的な手法については丁寧な数値例が示されている.それ以外は概要なので,そういった手法があることが分かる程度.
- 本の性格上,アルゴリズムの手順については書かれているが,その背後の理論は省略.すなわち,アルゴズムの表面と中身はあるが,裏側はない.
なので,構造的損失最小化, バイアス-バリアンス, 再生核Hilbert空間などの背後の理論については書かれていない.
> -- しましま
* リンク集 [#u1442f96]
//サポートページなど関連リンクを書いてください.
//-[[サポートページ>http://example.com/]]
-[[GoogleScholarAll:データマイニングの基礎]]
-Amazon.co.jpへのリンク:&amazon(4274203484);