統計的な推定では,現実のデータに対して何らかの仮定をする. その仮定が現実と合致する場合に加え,この仮定がずれている場合でも,その影響が少なくなるようにした推定法を ロバスト推定 (robust estimation) や ロバスト統計 (robust statistics) という.
順序統計量を利用する方法. 順序統計では,与えられたデータ集合を,その要素を大小関係に応じて整列し,その中で i 番目にある値を扱う. 代表的なものは中央値で,平均と比べて,はずれ値があってもその影響を受けにくい.
順位統計量を利用する方法. 与えられたデータ集合を,その要素を大小関係に応じて整列し,その列中でのあるデータが何番目であるか,すなわち,順位の値が順位統計量. 順位相関係数やWilcoxon検定などが代表的.
最尤推定に基づく方法. ただし,誤差関数によりはずれ値に影響されにくいものを使う. 例えば二乗誤差より,絶対誤差を使う. SVMでは,識別平面の逆側に多少入っても誤差は0のままのヒンジ形誤差を,サポートベクトル回帰では,ε許容誤差やHuber誤差などを使う.
-- しましま