* Rで学ぶクラスタ解析 [#vdb53ea9]
//1行目はタイトルとして目次ページに表示されます

#amazon(4274067033)
 @Book{jb:040:00,
  author =    "新納 浩幸",
  title =        "{R}で学ぶクラスタ解析",
  publisher =    "オーム社",
  year =         2007,
  yomi =      "Shinnou"
 }
#amazon(,clear)

//ここには文献のリファレンスを書いてください.bibtex形式で書くことを推奨します.

* キーワード [#j4971f01]

//ここにはキーワードを列挙してください.

[[R]], クラスタリング, 階層的クラスタリング, k-means法, スペクトラルクラスタリング, 次元削減, 主成分分析, probabilistic latent semantic analysis, ファジィc-means法, EMアルゴリズム, non-negative matrix factorization

* メモ [#g2e4857d]

//内容とかを簡単に書いてください

- 統計のクラスタリングの本はアヤメデータとかから始まるが,この本は文書データのクラスタリングを中心に扱っている
- 形態素解析などが済んで,文書をBag-of-Wordsで,頻度ベクトルやTF-IDFで重み付けしたベクトルに変換したあとの処理に特化して書かれている
- [[R]]の基本的な説明は,ほとんど知っていることが前提のような感じ
- 大規模データで[[R]]で効率的に計算するために小技がたっぷり.for文を使わずに,ベクトルや行列の演算に持ち込むと[[R]]は速くなるが,そうしたプログラミングテクニックが載っている本は少ない.
//この本以外では,こうしたテクが載っているのは「&amazon(4431712186);」とか.
- purity など,分割の類似性を測る指標の説明が載っているのはこの本の特色.
- probabilistic latent semantic analysis, スペクトラルクラスタリング, non-negative matrix factorizationの日本語の説明は,あまり他では載っていない.こうした手法があるのは,文書クラスタリングを対象にした本ならでは.

> -- しましま

* リンク集 [#te6c70ae]

//サポートページなど関連リンクを書いてください.

-[[サポートページ>http://nlp.dse.ibaraki.ac.jp/~shinnou/books.html#R-clustering]]:掲載コードの配布
-[[出版社ページ>http://ssl.ohmsha.co.jp/cgi-bin/menu.cgi?ISBN=978-4-274-06703-7]]
-[[GoogleScholarAll:Rで学ぶクラスタ解析]]
-Amazon.co.jpへのリンク:&amazon(4274067033);

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS