ラベルや関数値などの教師情報が付随したラベルありデータとそれらがないラベルなしデータが与えられる状況を考える. ここで,与えられていない未知データについてラベルを予測する必要はなく,与えられたラベルなしデータのラベルだけ予測すればよいとする. すなわち,半教師あり学習で,新規のデータのラベルの予測をしない場合.
このとき,通常の教師あり学習のように,任意のデータのラベルを予測する関数を求めて,ラベルなしデータを代入してラベルを求めるアプローチも可能.しかし,ラベルを予測すればよいデータ点は非常に限定されているのに任意の点のラベルを予測する関数を求めるのは過剰に困難な問題を解いているといえる.よって,学習時にラベルなしデータの情報を使うと予測精度を向上させることができるらしい.
-- しましま