ブースティング - 機械学習の「朱鷺の杜Wiki」

[ トップ ] [ 編集 | 凍結 | 差分 | 履歴 | 添付 | リロード ] [ 新規 | 一覧 | 検索 | 最終更新 | ヘルプ | ログイン ]

ブースティング (boosting) / AdaBoost †

バギングとならぶ代表的なアンサンブル学習の手法で，クラス分類問題を扱う．弱学習器は，各事例を重み付けして学習できるものでなくてはならない．

アルゴリズム AdaBoost

\(D_t(\mathbf{x}_i)\) を均一に初期化．
以下の手続きを \(t=1,2,\ldots,T\) について反復

現在の誤分類率分布 \(D_t(\mathbf{x}_i)\) の重み付けを用いて，弱学習器に分類器 \(C_t(x)\) を生成させる．
誤分類率分布 \(D_t(\mathbf{x}_i)\) で重み付けした，データ集合 \(\{\mathbf{x}_i\}\) に対する誤分類率を \(\epsilon_t\) とする． \(\beta_t=\epsilon_t/(1-\epsilon_t)\)
誤分類分布を更新：事例 \(\mathbf{x}_i\in\{\mathbf{x}_i\}\) を\(C_t\)が誤分類したならば，\(D_{t+1}(\mathbf{x}_i)=\beta_t D_t(\mathbf{x}_i)\)，そうでなければ，\(D_{t+1}(\mathbf{x}_i)=D_t(\mathbf{x}_i)\)．最後に \(D_{t+1}(\mathbf{x}_i)\) を正規化．

最終分類器は \(C_1,\ldots,C_T\) がそれぞれ，\(\log\frac{1}{\beta_t}\)で重み付けした投票で行う．

誤分類率に応じて(adaptive)重みを変えるブースティングなので，AdaBoostという．
上記のものは厳密には AdaBoost.M1 で，他にも幾つかのバリエーションがある．
\(\gamma_t=\frac{1}{2}-\epsilon_t\) とすると，最終分類器の誤分類率の上界は \[\prod_t^T \sqrt{1-4\gamma_t^2}\le\exp[-2\sum_t^T\gamma_t^2]\] このように上界は指数関数型なので，ブースティングは指数損失関数を最小化している手法とみなせる．
他のアンサンブル学習と同様に，弱学習器がFisher判別分析などの安定的な高バイアスなものでは性能は向上しない．
回帰問題へ適用する拡張もある．

-- しましま

関連項目†

リンク集†

Boosting：Shapireによるチュートリアル
boosting.org：チュートリアル，論文集，ソフトウェア
Wikipedia:Boosting
Wikipedia.jp:ブースティング

Freeware †

mloss:Adaboost, mloss:Boosting
BoosTexter：Shapire自身による実装
gboost：Graph Boosting Toolbox (matlab)
mboost：model-based boosting (R)
RAdaBoost：RでのAdaBoostの実装
JBoost：AdaBoostなどをjavaで実装

関連文献†

基本文献
Y.Freund and R.E.Schapire, "Experiments with a New Boosting Algorithm",Proc. of The 13th Int'l Conf. on Machine Learning, pp.148-156 (1996)
GoogleScholarAll:Experiments with a New Boosting Algorithm
boostingの日本語解説フロインド Y., シャピリ R., 阿部直樹, "ブースティング入門", 人工知能学会誌, vol.14, no.5, pp.771-780 (1999)
GoogleScholarAll:ブースティング入門
ブースティングの基本から始まるが，後半は濃くなってゆく
金森敬文, 畑埜晃平, 渡辺治, 小川英光 "ブースティング - 学習アルゴリズムの設計技法" 森北出版 (2006)
Amazon.co.jpへのリンク：&amazon(4627813317);
Book/Data Mining - Practical Machine Learning Tools and Techniques Boosting
Book/Pattern Recognition and Machine Learning 14.3章
Book/Data Mining - Concepts and Techniques 6.14.2節
Book/Pattern Classification 9.5.2節
Book/The Elements of Statistical Learning 10章
Book/データマイニングの基礎 3.1.3節
Book/パターン認識と学習の統計学(統計科学のフロンティア6) III部 5節
Book/パターン認識(Rで学ぶデータサイエンス5) 14.5章

朱鷺の杜Wiki

参加しよう

Wiki超入門
練習用ページ
数式の表示
こびとさん
編集用ID: ibis
パスワード: 「VC次元」のVのフルスペルで最初だけ大文字

最新の30件
2024-04-13
- python
2024-04-09
- K-NEL
- K-NEL/errata
2023-11-22
- PRML/errata2
2023-11-21
- PRML/errata1
2023-11-01
- しましま/IBIS2023
2023-10-29
- IBIS
2023-06-16
- 人工知能学会全国大会
2023-06-11
- しましま/人工知能学会全国大会2023
2023-03-28
- Book
2022-11-27
- 朱鷺の社
2022-11-24
- しましま/IBIS2022
2022-07-08
- AutoTicketLinkName
2022-06-17
- しましま/人工知能学会全国大会2022
2021-11-13
- しましま/IBIS2021
2021-10-29
- 回帰分析
2021-06-11
- しましま/人工知能学会全国大会2021
2021-03-07
- MenuBar
2021-02-15
- python/numpy
2020-12-22
- 特異値分解
2020-12-18
- complement naive Bayes
2020-11-27
- しましま/IBIS2020
2020-10-17
- Paper/bias-on-the-web
2020-07-16
- F値
2020-06-30
- DataSet
2020-06-24
- バイアス-バリアンス
2020-06-10
- Paper
2020-03-15
- PRML
- PRML/link
2020-01-13
- Wiki超入門

カウンタ

累計: 37443
今日: 5
昨日: 8

Last-modified: 2010-02-11 (木) 16:12:26