サンプル集合 \(X=\{x_i\}^N\) から,重複を許してサンプリングして新たなサンプル集合 X' を作る方法
与えられたサンプル集合 X を用いて,学習器の汎化 e* を推定する方法
- \(i = 1,\ldots,m\) について以下の値を計算
- X からブートストラップサンプリング でサンプル集合 X'i を生成
- 訓練集合に X'i を,テスト集合に X を使って推定したエラーを \(e_i\)
- 訓練集合に X'i を,テスト集合に X'i を使って推定したエラーを \(\hat{e}_i\)
- 汎化誤差と経験誤差の差 \(R_i=e_i-\hat{e}_i\) を計算
- 訓練集合に X を,テスト集合に X を使って推定したエラーを \(e\)
汎化誤差の推定値は \(e + \frac{1}{n}\sum_i^n R_i\) になる.
-- とおりすがり
上記数式のnは正しくはmではないでしょうか?
自然言語処理の分野では,少数のデータに付けられたラベルに基づいて,他のラベルなしデータを分類する.そして,分類結果をも訓練ラベルとして扱い分類器を再学習する.この手続きを繰り返す手法.
-- しましま
関連項目†
リンク集†
関連文献†