* 共訓練 (co-training) [#ub40120f]

//ここには %項目の説明を書いてください.よろしければ署名しておいてください.

半教師あり学習を実現する手法の一つ
- 事例の定義域は \(X\) は \(X_1\times X_2\) に分割できる.すなわち,一つの事例を二種類の属性ベクトルで表現できる.
例えば,一つのWebページがテキストに基づく特徴\(X_1\)と,リンクに基づく特徴 \(X_2\) で記述されているなど.~
\(X_1\) と \(X_2\) のどちらか一方だけでも分類には十分とする.
- \(\mathcal{D}\) は \(X\) 上の分布.
- \(\Pr{}_{\mathcal{D}}(x)\ne0\)なる事例 \(x\in X\) について,ラベル付け関数は無矛盾,すなわち,\(f(x\in X)=f_1(x_1\in X_1)=f_2(x_2\in X_2)\).これが成立する仮定をcompatibleという.
- ここで,\(x_1\in X_1\) と \(x_2\in X_2\) をそれぞれノード集合とし,\(\Pr{}_{\mathcal{D}}(x_1\times x_2)\ne0\) なら \(x_1\) と \(x_2\) の間に辺がある二部グラフを考える.
- compatibleの仮定は,この二部グラフの連結成分中のラベルが同じであることになる.
- 少数のラベルあり事例と,多数のラベルなし事例が存在する状況を想定
- ラベルなし事例が存在すると,その事例について \(\Pr{}_{\mathcal{D}}(x_1\times x_2)\ne0\) であることがわかり,二部グラフの辺を作れる.
- 二部グラフの連結成分中に一つでもラベルあり事例があれば,その連結成分のラベルはcompatible仮定から同じになるので,少数のラベルでも多数の事例がラベル付けできる.

> -- しましま

** 関連項目 [#acf50f70]

//英語や同義語のあとに,#brで区切って関連する項目をリストしてください.
-[[co-training]]
#br
-[[半教師あり学習]]
-[[多視点学習]]
#br
-[[検索:共訓練 co-training]]

** リンク集 [#uff6508b]

//関連するWWW資源があればリンクしてください.

** 関連文献 [#v7979464]

//この%項目%に関連する書籍や論文を紹介してください.

-基本文献~
A.Blum & T.Mitchell, "Combining Labeled and Unlabeled Data with Co-Training", 11th COLT, pp.92-100 (1998)~
[[GoogleScholarAll:Combining Labeled and Unlabeled Data with Co-Training]]
-共訓練がうまくいく条件の理論の論文.条件を以前のものよりかなり緩くしている.~
S.Abney, "Bootstrapping", 40th Annual Meeting of the Association for Computational Linguistics: Proceedings of the Conference, pp.360-367 (2002)~
[[GoogleScholarAll:Bootstrapping]]
-[[Book/Semi-supervised Learning]] 2.3節, 22節

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS