交差確認 (cross validation)

サンプル集合 X から汎化誤差を推定する方法

  1. X を n 個の部分集合に分割する
  2. i=1…n について以下を繰り返す
    • i 番目の部分集合を Xi,その残りを ~Xi=X-Xi とする
    • 訓練集合に ~Xi を,テスト集合に Xi を用いてエラー \(e_i\) を計算
  3. 汎化誤差は \(\frac{1}{n}\sum_i^n e_i\) になる.

n個に分割したとき n分割交差確認 (n-fold cross validation) という.特に,Xの要素数がNのとき N 分割交差確認をすると leave-one-out法という.

cross validation の訳語には,交差確認交差検証とがあるようです.みなさんはどちらの訳語を使っていますか?

選択肢 投票
交差確認  1389 
交差検証  2036 

-- とおりすがり 「交差検定」として使っています。

-- しましま 推定の誤差を見積もる方法で,危険率を設定して仮説の棄却を扱う検定の方法ではないので,私はここで『検定』の言葉は使わない方がよいと思います.また,検定は test の訳語になってて,validation の訳語には統計ではあまり使わないかとも思います.

-- しましま

線形モデルなどの場合,cross validation error が陽に求められるのが重要 (具体的な式はいつか追記). cross validation によって得られた推定量は縮小推定量と関係が深い. 一般化交差確認 (generalized cross validation; GCV) についてもいつか追記

--あかほ

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2013-10-24 (木) 13:57:40