データが高次元になると汎化誤差が向上しなくなる現象.主な原因は次の二つ:
- 次元数の増加に伴ってモデルが複雑になり,有限のサンプル数では適切な学習ができなくなる
- 球面集中現象により,次元の増加に伴って,いろいろなデータ間の距離が互いに等しくなっていく
このような場合には,特徴選択や次元削減によって次元数を減らす.
-- しましま
関連項目†
リンク集†
関連文献†
- 次元の呪いをやさしく解説
坂野 鋭, 山田 敬嗣, 怪奇!!次元の呪い --- 識別問題,パターン認識,データマイニングの初心者のために(前編)", 情報処理, vol.43, no.5, pp.562-567 (2002)
坂野 鋭, 山田 敬嗣, 怪奇!!次元の呪い --- 識別問題,パターン認識,データマイニングの初心者のために(後編)", 情報処理, vol.43, no.6, pp.658-663 (2002)
- Book/計算統計II(統計科学のフロンティア12) 第I部 3.1章
- Book/Pattern Recognition and Machine Learning 1.4節
- Book/フリーソフトでつくる音声認識システム 3.3節