クラス分類を解くための手法は識別モデルと生成モデルに分けられる.
データとクラスの確率変数をそれぞれ \(X\) と\(C\) で表す.
パラメータは \(\theta=(\theta_1,\theta_2)\).
- 生成モデル (generative model)
\(X\) と\(C\) の結合確率をモデル化:
\[\Pr[X,C|\theta]=\Pr[X|C,\theta_1]\Pr[C|\theta_2]\]
パラメータはデータ集合とパラメータの同時確率を最大化するように学習:
\[\Pr[\{x_i,c_i\}_i^N,\theta]=\Pr[\theta]\prod_i^N\Pr[x_i,c_i|\theta]=\Pr[\theta]\prod_i^N\Pr[x_i|c_i,\theta_1]\Pr[c_i|\theta_2]\]
- 識別モデル (判別モデル) (discriminative model)
データ \(X\) が与えられたときの,クラス \(C\) の条件付確率をモデル化し,パラメータはこの条件付確率を最大化するように学習:
\[\Pr[C,\theta|X]=\Pr[\theta]\prod_i\Pr[c_i|x_i,\theta],\mathrm{\ where\ }\Pr[c_i|x_i,\theta]=\frac{\Pr[x_i,c_i|\theta]}{\sum_{c\in C}\Pr[x_i,c|\theta]}\]
生成モデルには,識別モデルと対比しないで,データを生成する分布のモデルといった意味で使われることもある.
discriminative model の訳語は 識別モデル と 判別モデル に分かれています.どちらの訳語がよいと思いますか?
-- しましま
関連項目†
リンク集†
関連文献†