これらのキーワードがハイライトされています:自然言語処理 NLP

ブートストラップ (bootstrap)

ブートストラップサンプリング

サンプル集合 \(X=\{x_i\}^N\) から,重複を許してサンプリングして新たなサンプル集合 X' を作る方法

ブートストラップ法

与えられたサンプル集合 X を用いて,学習器の汎化 e* を推定する方法

  1. \(i = 1,\ldots,m\) について以下の値を計算
    • X からブートストラップサンプリング でサンプル集合 X'i を生成
    • 訓練集合に X'i を,テスト集合に X を使って推定したエラーを \(e_i\)
    • 訓練集合に X'i を,テスト集合に X'i を使って推定したエラーを \(\hat{e}_i\)
    • 汎化誤差経験誤差の差 \(R_i=e_i-\hat{e}_i\) を計算
  2. 訓練集合に X を,テスト集合に X を使って推定したエラーを \(e\)
    汎化誤差の推定値は \(e + \frac{1}{n}\sum_i^n R_i\) になる.

-- とおりすがり 上記数式のnは正しくはmではないでしょうか?

自然言語処理でのブートストラップ

自然言語処理の分野では,少数のデータに付けられたラベルに基づいて,他のラベルなしデータを分類する.そして,分類結果をも訓練ラベルとして扱い分類器を再学習する.この手続きを繰り返す手法.

-- しましま

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2014-08-25 (月) 01:48:12