*クラスタリング (clustering) [#f3e65be0]

''クラスタリング(clustering)''とは,分類対象の集合を,内的結合(internal cohesion)と外的分離(external isolation)が達成されるような部分集合に分割すること.

> --しましま

**関連項目 [#rafefb7e]
-[[clustering]]
-[[クラスター分析]]
-[[cluster analysis]]
#br
-[[EMアルゴリズム]]
--[[Bregmanダイバージェンス]]
-[[ベクトル量子化]]
-[[教師なし学習]]
-[[クラスタリングの不可能性定理]]
-[[劣モジュラ]]
-[[プライバシー保護データマイニング/クラスタリング]]
-[[クラスタアンサンブル]]
-[[自己組織化マップ]]
-[[概念クラスタリング]]:[[COBWEB]]
-[[球面クラスタリング]]
-[[共クラスタリング]]
-[[情報ボトルネック]]
-[[時系列]]
-[[データストリーム]]:[[STREAM]],[[CluStream]],[[HPStream]],[[VFKM]], [[BIRCH]]
-[[分割最適化クラスタリング]]:[[k-means法]],[[カーネルk-means法]],[[k-medoids法]], [[ファジィc-means法]]
-[[階層的クラスタリング]]:[[単リンク法]],[[完全リンク法]],[[群平均法]],[[Ward法]],[[セントロイド法]] ([[重心法]]),[[メジアン法]]
-その他の方法
--[[部分空間クラスタリング]]:[[CLIQUE]],[[ORCLUS]],[[PROCLUS]],[[HPStream]]
--[[スペクトラルクラスタリング]]
--[[サポートベクトルクラスタリング]]
--[[最大マージンクラスタリング]]
--大規模データ:[[CLARANS]] (PAM, CLARA), [[BIRCH]]
--任意形状のクラスタ:[[DBSCAN]] (OPTICS),[[CURE]]
#br
-[[検索:クラスタリング クラスター分析 clustering]]

**リンク集 [#pd0e5777]

-[[クラスタリングとは (クラスター分析とは) >http://www.kamishima.net/jp/clustering/]] @ 神嶌敏弘:
基本的な手法の説明とクラスタリングを用いた分析での注意点
-[[クラスター分析>Aoki:lecture/misc/clustan.html]]: 統計学自習ノート@青木繁伸
-[[Wikipedia:Data_clustering]]

*** Freeware [#hd5344ff]

-[[mloss:clustering]]
-[[Cluster Analysis & Finite Mixture Models @ CRAN Task View>http://cran.r-project.org/web/views/Cluster.html]]:統計処理ソフト [[R]] の関連パッケージまとめ
-RjpWikiの関連ページ
--[[RjpWiki:Rの基本パッケージ中の多変量解析関数一覧]]
--[[RjpWiki:stats(R 統計)パッケージ中のオブジェクト一覧]]:
一般的な凝集型階層的クラスタリングのhclustやk-means法のkmeansといった関数を含む
--[[RjpWiki:CRANパッケージリスト#content_1_34]]:
clusterパッケージには clara, agnes, diana, fanny, mona, silhouette, xclara のアルゴリズムが含まれる
-[[Cluster>http://bonsai.ims.u-tokyo.ac.jp/~mdehoon/software/cluster/]]:クラスタリング (C,perl,python)
-[[figue>http://code.google.com/p/figue/]]:JavaScript で k-means法 と凝集型階層的クラスタリング を実装
-[[Graclus software>http://www.cs.utexas.edu/users/dml/Software/graclus.html]]:グラフクラスタリング
-[[Karypis, Gらのソフト>http://glaros.dtc.umn.edu/gkhome/software]]: クラスタリング, 協調フィルタリングなど
-[[meteoLab>http://grupos.unican.es/ai/meteo/MeteoLab.html]]:k-means,SOM,PCA,CCA
-[[Strehl, A.>http://hercules.ece.utexas.edu/~strehl/soft.html]] 超グラフクラスタリングやクラスタアンサンブルなど (matlab)
-[[K-means and KD-trees resources>http://www.cs.cmu.edu/~dpelleg/kmeans.html]]:KD-treeを使って点の検索を高速化
-[[MClust>http://www.stat.washington.edu/mclust/]]:混合正規分布をEMアルゴリズムで解く方法の[[R]]による実装.
-[[MIPKmeans>http://mloss.org/software/view/48/]]:MPIを使ったk-means法の並列実装
-[[Parallel K-Means Data Clustering>http://www.ece.northwestern.edu/~wkliao/Kmeans/]]:MPIを使ったk-means法の並列実装
-[[MUSASHI>http://musashi.sourceforge.jp/]]:xkmean で k-means法を実行
-[[Weka]]:clusterers クラスの下位クラスとして実装されている

** 関連文献 [#eefcbc3c]

-[[Book/Algorithms for Clustering Data]]:1990年ぐらいまでの研究は網羅されている著名な教科書
-A. K. Jain, M. N. Murty and P. J. Flynn "Data Clustering: A Review" ACM Computing Surveys, vol.31, no.3 (1999):上記の本の内容をまとめたサーベイ~
[[GoogleScholarAll:Data Clustering: A Review]]
-[[Book/クラスター分析入門]]:日本語の基本的な教科書
-[[Book/関連性データの解析法]]:基本的な手法の解説.[[Lance-Williams updating formula]]などについて詳しい.
-文書クラスタリングについてよく調査されたサーベイ~
[[岸田和明 "文書クラスタリングの技法:文献レビュー" Library and Information Science, no.49, pp.33-75 (2003)>http://wwwsoc.nii.ac.jp/mslis/lis04.html#no49]]~
[[GoogleScholarAll:文書クラスタリングの技法:文献レビュー]]
-[[Book/Data Mining - Concepts and Techniques]]:7章はデータマイニング分野の主なクラスタリング手法が多数取り上げられている
-[[Book/パターン認識と学習の統計学(統計科学のフロンティア6)]] 第I部4節
-[[Book/データマイニングの基礎]] 3.2節
-[[R.Dubes, A.K.Jain "Validity Studies in Clustering Methodologies", Pattern Recognition, vol.11, pp.235-254 (1979)>Paper/PatternRecognition-11-p235]]:
クラスタの妥当性の検証法についてのサーベイ.~
[[GoogleScholarAll:Validity Studies in Clustering Methodologies]]
-[[J.Grabmeier and A.Rudolph "Techniques of Cluster Algorithms in Data Mining">Paper/DataMiningAndKnowledgeDiscovery-6-p303]]:
クラスタリングのための距離・類似度や目的関数についてのサーベイ~
[[GoogleScholarAll:Techniques of Cluster Algorithms in Data Mining]]

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS