* データマイニングの基礎 [#e6199aca]
//1行目はタイトルとして目次ページに表示されます

#amazon(4274203484)
 @Book{jb:033:00,
  author =       "元田 浩 and 津本 周作 and 山口 高平 and 沼尾 正行",
  title =        "データマイニングの基礎",
  publisher =    "オーム社",
  year =         2006
 }
#amazon(,clear)

//ここには文献のリファレンスを書いてください.bibtex形式で書くことを推奨します.

* キーワード [#h68c2a55]

//ここにはキーワードを列挙してください.

データマイニング, 知識発見, 決定木, [[CART]], [[ID3]], 単純ベイズ, 最近傍法, 
相関ルール, [[Apriori]], アンサンブル学習, [[バギング]], ブースティング, 
ランダムフォレスト, クラスタリング, 凝集型階層的クラスタリング, 
k-means法, ファジィc-means法, 混合分布, EMアルゴリズム, [[SVM]], カーネル, 
帰納論理プログラミング, [[FOIL]], 数値属性の離散化, 特徴選択, 特徴抽出, 
事例選択, 交差確認, ブートストラップ, 検定, [[精度]], 再現率, ROC曲線, 多重比較, 
順位相関係数, 最尤推定, [[AIC]], [[MDL]], [[BIC]]

* メモ [#w171dd50]

//内容とかを簡単に書いてください

- データマイニングについて,初学者向き(学部3回〜修士1回)に書かれた本.現在,初学者には最も薦められる本だと思う.
- アルゴリズムの説明だけではなく,実際にデータから知識発見を行う過程を重視している点が特徴.そのため,アルゴリズムを適用する前の処理や,その後の結果の検証や検定についても非常に詳しい.特に,この分野の本で検定にこれだけ分量をさいて,マイニング・学習の結果に関連した検定手法をまとめた本は少ないと思う.
- 適用事例については多数を挙げるのではなく,医療データの解析例について,最後に前処理,解析,結果の検証と具体的な手順を一つ述べている.
- 本のページ数に対して非常に多くの方法が紹介されていて,これらを俯瞰するには最適.代表的な手法については丁寧な数値例が示されている.それ以外は概要なので,そういった手法があることが分かる程度.
- 本の性格上,アルゴリズムの手順については書かれているが,その背後の理論は省略.すなわち,アルゴズムの表面と中身はあるが,裏側はない.
なので,構造的損失最小化, バイアス-バリアンス, 再生核Hilbert空間などの背後の理論については書かれていない.

> -- しましま

* リンク集 [#u1442f96]

//サポートページなど関連リンクを書いてください.

//-[[サポートページ>http://example.com/]]
-[[GoogleScholarAll:データマイニングの基礎]]
-Amazon.co.jpへのリンク:&amazon(4274203484);

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS