#author("2022-06-12T09:46:17+00:00","","")
#author("2022-08-23T06:36:18+00:00;2013-10-24T04:57:40+00:00","","")
* 交差確認 (cross validation) [#p898ae22]

サンプル集合 X から汎化誤差を推定する方法
+ X を n 個の部分集合に分割する
+ i=1…n について以下を繰り返す
-- i 番目の部分集合を Xi,その残りを ~Xi=X-Xi とする
-- 訓練集合に ~Xi を,テスト集合に Xi を用いてエラー \(e_i\) を計算
+ 汎化誤差は \(\frac{1}{n}\sum_i^n e_i\) になる.

n個に分割したとき n分割交差確認 ('''n'''-fold cross validation) という.特に,Xの要素数がNのとき N 分割交差確認をすると leave-one-out法という.

cross validation の訳語には,交差確認と交差検証とがあるようです.みなさんはどちらの訳語を使っていますか?
#vote2(交差確認[1387],交差検証[2000],notimestamp)
#vote2(交差確認[1387],交差検証[2001],notimestamp)

> -- とおりすがり
「交差検定」として使っています。
>> -- しましま
推定の誤差を見積もる方法で,危険率を設定して仮説の棄却を扱う検定の方法ではないので,私はここで『検定』の言葉は使わない方がよいと思います.また,検定は test の訳語になってて,validation の訳語には統計ではあまり使わないかとも思います.

> -- しましま

線形モデルなどの場合,cross validation error が陽に求められるのが重要 (具体的な式はいつか追記). cross validation によって得られた推定量は縮小推定量と関係が深い. 一般化交差確認 (generalized cross validation; GCV) についてもいつか追記

> --あかほ

** 関連項目 [#la150f3a]

//英語や同義語のあとに,#brで区切って関連する項目をリストしてください.

-[[交差検証]]
-[[cross validation]]
#br
-[[leave-one-out]]
#br
-[[汎化誤差]]
-[[ブートストラップ]]
-[[一般化交差確認]]
-[[縮小推定]]
#br
-[[検索:交差確認]]

** リンク集 [#o9bcf9c1]

//関連するWWW資源があればリンクしてください.

-[[Wikipedia:Cross-validation]]

** 関連文献 [#t0ffaee0]

//この%項目%に関連する書籍や論文を紹介してください.

-[[Book/わかりやすいパターン認識]] 4.5 [3] 節
-[[Book/The Elements of Statistical Learning]] 7.10節
-[[Book/Pattern Recognition and Machine Learning]] 1.3節
-[[Book/データマイニングの基礎]] 5.1.3a節
-[[Book/パターン認識(Rで学ぶデータサイエンス5)]] 1.4節
-[[Book/フリーソフトでつくる音声認識システム]] 8章


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS