#author("2025-01-21T01:52:35+00:00;2013-10-24T04:57:40+00:00","","") #author("2025-01-21T01:52:36+00:00;2013-10-24T04:57:40+00:00","","") * 交差確認 (cross validation) [#p898ae22] サンプル集合 X から汎化誤差を推定する方法 + X を n 個の部分集合に分割する + i=1…n について以下を繰り返す -- i 番目の部分集合を Xi,その残りを ~Xi=X-Xi とする -- 訓練集合に ~Xi を,テスト集合に Xi を用いてエラー \(e_i\) を計算 + 汎化誤差は \(\frac{1}{n}\sum_i^n e_i\) になる. n個に分割したとき n分割交差確認 ('''n'''-fold cross validation) という.特に,Xの要素数がNのとき N 分割交差確認をすると leave-one-out法という. cross validation の訳語には,交差確認と交差検証とがあるようです.みなさんはどちらの訳語を使っていますか? #vote2(交差確認[1392],交差検証[2037],notimestamp) #vote2(交差確認[1392],交差検証[2038],notimestamp) > -- とおりすがり 「交差検定」として使っています。 >> -- しましま 推定の誤差を見積もる方法で,危険率を設定して仮説の棄却を扱う検定の方法ではないので,私はここで『検定』の言葉は使わない方がよいと思います.また,検定は test の訳語になってて,validation の訳語には統計ではあまり使わないかとも思います. > -- しましま 線形モデルなどの場合,cross validation error が陽に求められるのが重要 (具体的な式はいつか追記). cross validation によって得られた推定量は縮小推定量と関係が深い. 一般化交差確認 (generalized cross validation; GCV) についてもいつか追記 > --あかほ ** 関連項目 [#la150f3a] //英語や同義語のあとに,#brで区切って関連する項目をリストしてください. -[[交差検証]] -[[cross validation]] #br -[[leave-one-out]] #br -[[汎化誤差]] -[[ブートストラップ]] -[[一般化交差確認]] -[[縮小推定]] #br -[[検索:交差確認]] ** リンク集 [#o9bcf9c1] //関連するWWW資源があればリンクしてください. -[[Wikipedia:Cross-validation]] ** 関連文献 [#t0ffaee0] //この%項目%に関連する書籍や論文を紹介してください. -[[Book/わかりやすいパターン認識]] 4.5 [3] 節 -[[Book/The Elements of Statistical Learning]] 7.10節 -[[Book/Pattern Recognition and Machine Learning]] 1.3節 -[[Book/データマイニングの基礎]] 5.1.3a節 -[[Book/パターン認識(Rで学ぶデータサイエンス5)]] 1.4節 -[[Book/フリーソフトでつくる音声認識システム]] 8章