半教師あり学習 (semi-supervised learning)

ラベル付けされたデータ集合に加え,ラベルのないデータ集合もある ラベルあり・なし混在データ (labeled and unlabeled data) から学習することで,ラベルありデータだけで学習した場合より,より予測精度の高いクラス分類を実現するのが目標.

クラス分類問題以外の問題にも広がっているので,特に,半教師ありクラス分類 (semi-supervised classification) と呼ぶべきとの主張もある.

semi-supervised learning の訳語は 半教師あり学習準教師あり学習 に分かれています.どちらの訳語がよいと思いますか?

選択肢 投票
準教師あり学習  485 
半教師あり学習  1475 

文献1の第1章のイントロダクションによれば,1960年代からこのアイデアは存在するらしい. また,教師なしデータを用いて予測精度を向上させる半教師あり学習の手法では,データに次のいずれかの性質が仮定されている.

  • 半教師あり平滑性仮定:もし二つの点 x1 と x2 が高密度領域で近ければ,出力 y1 と y2 も関連している.
  • クラスタ仮定:点が同じクラスタになるなら,それらは同じクラスになりやすい.
  • 低密度分離:決定境界は低頻度領域にあるべき.
  • 多様体仮定:(高次元の)データは,低次元の多様体上に(ほぼ)存在する.

-- しましま

関連項目

手法

リンク集

Freeware

関連文献


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:12:42 (2492d)