予測結果の評価尺度の一つ.
正と負の2クラスの分類問題を考える.
分類器の予測結果と,真の結果に基づいて以下のように分類.
例えば,真に正であるデータで,かつ,予測結果も正であったようなデータ数をTP個とする.
- 正解率 (精度, accuracy):正や負と予測したデータのうち,実際にそうであるものの割合
\[\mathrm{Accuracy}=\frac{TP+TN}{TP+FP+TN+FN}\]
- 適合率 (precision):正と予測したデータのうち,実際に正であるものの割合
\[\mathrm{Precision}=\frac{TP}{TP+FP}\]
- 再現率 (recall, 感度, sensitivity):実際に正であるもののうち,正であると予測されたものの割合
\[\mathrm{Recall}=\frac{TP}{TP+FN}\]
- 特異度 (specificity):実際に負であるもののうち,負であると予測されたものの割合
\[\mathrm{Specificity}=\frac{TN}{FP+TN}\]
- F値 (F尺度, F-measure):再現率と適合率の調和平均.
\[\frac{2\mathrm{Recall}\cdot\mathrm{Precision}}{\mathrm{Recall}+\mathrm{Precision}}\]
- ブレイクイブンポイント (breakeven point):
精度を上昇させると共に,再現率を下降させる,またその逆も可能なパラーメータを調整して,再現率と精度が同じになるとき,そのときの再現率(=精度)
-- しましま
-- こびとさん
関連項目†
リンク集†
関連文献†