Bellman方程式
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
* Bellman方程式 (Bellmann equation) [#m3567f6a]
//ここには %項目の説明を書いてください.よろしければ署名...
マルコフ決定過程において最適政策が満たす再帰方程式.
この方程式に基づいて,動的計画法を効率的に解くことができ...
隠れマルコフモデルにおける Viterbiアルゴリズムや Baum-Wel...
グラフィカルモデルにおけるビリーフプロパゲーションアルゴ...
同じ原理に基づいた再帰方程式によって構成されており,マル...
効率アルゴリズムの基本原理と考えることが出来る.
> --あかほ
強化学習だと,価値関数 \(V(s)\),政策 \(\pi,a\),時刻 \(t...
\[V^{\pi}(s)=\sum_a\pi(s,a)\sum_{s'}\Pr[s_{t+1}=s'|s_t=s,...
ただし,最初の和は状態 \(s\)で可能な行動全てについて,二...
> -- しましま
**関連項目 [#s77d5a51]
//英語や同義語のあとに,#brで区切って関連する項目をリスト...
-[[Bellmann equation]]
#br
-[[Markov決定過程]]
-[[凸二次計画]]
-[[動的計画法]]
-[[数理計画]]
-[[強化学習]]
-[[Viterbiアルゴリズム]]
-[[Baum-Welchアルゴリズム]]
-[[確率伝播]]
#br
-[[検索:Bellman方程式 ベルマン方程式]]
**リンク集 [#q88bc77c]
-[[Wikipedia:Bellman_equation]]
**関連文献 [#pe0c8046]
//この%項目%に関連する書籍や論文を紹介してください.
-R.S.Sutton, A.G.Barto (著), 三上, 皆川 (訳) 強化学習, 森...
Amazon.co.jpへのリンク:&amazon(4627826613);
終了行:
* Bellman方程式 (Bellmann equation) [#m3567f6a]
//ここには %項目の説明を書いてください.よろしければ署名...
マルコフ決定過程において最適政策が満たす再帰方程式.
この方程式に基づいて,動的計画法を効率的に解くことができ...
隠れマルコフモデルにおける Viterbiアルゴリズムや Baum-Wel...
グラフィカルモデルにおけるビリーフプロパゲーションアルゴ...
同じ原理に基づいた再帰方程式によって構成されており,マル...
効率アルゴリズムの基本原理と考えることが出来る.
> --あかほ
強化学習だと,価値関数 \(V(s)\),政策 \(\pi,a\),時刻 \(t...
\[V^{\pi}(s)=\sum_a\pi(s,a)\sum_{s'}\Pr[s_{t+1}=s'|s_t=s,...
ただし,最初の和は状態 \(s\)で可能な行動全てについて,二...
> -- しましま
**関連項目 [#s77d5a51]
//英語や同義語のあとに,#brで区切って関連する項目をリスト...
-[[Bellmann equation]]
#br
-[[Markov決定過程]]
-[[凸二次計画]]
-[[動的計画法]]
-[[数理計画]]
-[[強化学習]]
-[[Viterbiアルゴリズム]]
-[[Baum-Welchアルゴリズム]]
-[[確率伝播]]
#br
-[[検索:Bellman方程式 ベルマン方程式]]
**リンク集 [#q88bc77c]
-[[Wikipedia:Bellman_equation]]
**関連文献 [#pe0c8046]
//この%項目%に関連する書籍や論文を紹介してください.
-R.S.Sutton, A.G.Barto (著), 三上, 皆川 (訳) 強化学習, 森...
Amazon.co.jpへのリンク:&amazon(4627826613);
ページ名: