強化学習
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
*強化学習 (reinforcement learning) [#b70f34db]
知識をもった教師からサンプルが与えられるのではなく,環境...
> -- しましま
強化学習は、ベルマン方程式 \(Q(s,a)=\int Q(s'|a)p(a|\thet...
応用上の問題点としては次のようなものが挙げられる。
-状態s(あるいは行動a)の空間が次元とともに指数的に大きくな...
-観測している状態がMarkov決定過程で近似できない。
--例1:ボールを的にぶつける問題において、サッカーボールと...
--例2:サッカーをするロボットを学習させる問題にて、他のプ...
> -- こびとさん
**関連項目 [#v2be8511]
-[[reinforcement learning]]
#br
-[[機械学習]]
-[[Markov決定過程]]
-[[部分観測Markov決定過程]]
-[[動的計画法]]
-[[能動学習]]
#br
-[[検索:強化学習 reinforcement]]
** リンク集 [#rdd07cc7]
-[[強化学習とは?>http://sysplan.nams.kyushu-u.ac.jp/gen/...
-[[強化学習>http://www.murata.eb.waseda.ac.jp/ryotaro.nis...
-[[Temporal Difference Learning and TD-Gammon>http://www....
強化学習の著名な応用であるTDギャモンのごくごく簡単な説明
-[[RL competition>http://rl-competition.org/]]:強化学習...
-[[強化学習>http://www.ai-gakkai.or.jp/jsai/journal/myboo...
#br
-[[Scholarpedia:Reinforcement_learning]]
-[[Wikipedia:Reinforcement_learning]]
-[[Wikipedia.jp:強化学習]]
*** Freeware [#u8df71a3]
-[[mloss:reinforcement-learning]]
-[[Connectionist Q-learning - Free Java Framework>http://...
-[[Maja Machine Learning Framework>http://mmlf.sourceforg...
-[[Reinforcement Learning Toolkit>http://rlai.cs.ualberta...
-[[RL-Glue>http://glue.rl- community.org/]]:強化学習のた...
-[[Verve>http://verve-agents.sourceforge.net/]]:強化学習...
** 関連文献 [#o045992a]
- [[Richard S. Sutton, Andrew G. Barto "Reinforcement Lea...
[[GoogleScholarAll:Reinforcement Learning: An Introductio...
- 上記の教科書の邦訳版~
R.S.Sutton and A.G.Barto, "強化学習", 森北出版 (2000)(三...
終了行:
*強化学習 (reinforcement learning) [#b70f34db]
知識をもった教師からサンプルが与えられるのではなく,環境...
> -- しましま
強化学習は、ベルマン方程式 \(Q(s,a)=\int Q(s'|a)p(a|\thet...
応用上の問題点としては次のようなものが挙げられる。
-状態s(あるいは行動a)の空間が次元とともに指数的に大きくな...
-観測している状態がMarkov決定過程で近似できない。
--例1:ボールを的にぶつける問題において、サッカーボールと...
--例2:サッカーをするロボットを学習させる問題にて、他のプ...
> -- こびとさん
**関連項目 [#v2be8511]
-[[reinforcement learning]]
#br
-[[機械学習]]
-[[Markov決定過程]]
-[[部分観測Markov決定過程]]
-[[動的計画法]]
-[[能動学習]]
#br
-[[検索:強化学習 reinforcement]]
** リンク集 [#rdd07cc7]
-[[強化学習とは?>http://sysplan.nams.kyushu-u.ac.jp/gen/...
-[[強化学習>http://www.murata.eb.waseda.ac.jp/ryotaro.nis...
-[[Temporal Difference Learning and TD-Gammon>http://www....
強化学習の著名な応用であるTDギャモンのごくごく簡単な説明
-[[RL competition>http://rl-competition.org/]]:強化学習...
-[[強化学習>http://www.ai-gakkai.or.jp/jsai/journal/myboo...
#br
-[[Scholarpedia:Reinforcement_learning]]
-[[Wikipedia:Reinforcement_learning]]
-[[Wikipedia.jp:強化学習]]
*** Freeware [#u8df71a3]
-[[mloss:reinforcement-learning]]
-[[Connectionist Q-learning - Free Java Framework>http://...
-[[Maja Machine Learning Framework>http://mmlf.sourceforg...
-[[Reinforcement Learning Toolkit>http://rlai.cs.ualberta...
-[[RL-Glue>http://glue.rl- community.org/]]:強化学習のた...
-[[Verve>http://verve-agents.sourceforge.net/]]:強化学習...
** 関連文献 [#o045992a]
- [[Richard S. Sutton, Andrew G. Barto "Reinforcement Lea...
[[GoogleScholarAll:Reinforcement Learning: An Introductio...
- 上記の教科書の邦訳版~
R.S.Sutton and A.G.Barto, "強化学習", 森北出版 (2000)(三...
ページ名: