説明変数 \(x\) が与えられたときの応答変数 \(y\) の条件付き分布を,モデル \(p(y|x,\theta)\) の中から適切なものを,訓練事例 \(\{(x_i,y_i)\}\) を使って選び出す.
このとき,訓練事例をサンプリングするときの \(x\) の分布 \(p_0(x)\) と,予測に使うときの分布 \(p_1(x)\) が異なるのが共変量シフト (covariate shift).
共変量シフトの状態では次の荷重対数尤度を最大化するようにパラメータ \(\theta\) すると良い.
\[\sum_i \frac{p_1(x_i)}{p_0(x_i)}\log p(y_i|x_i,\theta)\]
-- しましま
関連項目†
リンク集†
関連文献†
- 基本文献
H.Shimodaira, "Improving Predictive Inference under Covariate Shift by Weighting the Log-Likelihood Function", J. of Statistical Planning and Inference, vol.90 (2000)
GoogleScholarAll:Improving Predictive Inference under Covariate Shift by Weighting the Log-Likelihood Function
- サーベイ
杉山 将 "共変量シフト下での教師付き学習", 日本神経回路学会誌, vol.13, no.3 (2006)
GoogleScholarAll:共変量シフト下での教師付き学習
- W.Fan & M.Sugiyama Sample Selection Bias - Covariate Shift: Problems, Solutions, and Applications ICDM2008 tutorial
GoogleScholarAll:Sample Selection Bias - Covariate Shift: Problems, Solutions, and Applications