忍者ブログ

[PR]東裏通

強化学習東裏通


[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

強化学習

この前のSOMからHMMのパラメータ学習はやめ。
バッチ学習してるらしい。ちゃんと読めよ。というか翻訳してるときに気づけよ。

やっぱ逐次学習でしょ。うん。
オフライン学習とか面白くないし。

で、強化学習へ。
どっちにしてもロボットを動かそうと思ったらまず強化学習だし。

今はBESOMとHTMの合成を考えてるわけだけど、どっちもベイジアンネット。
というわけでベイジアンネットに使える強化学習を探してみた。

山村雅幸:“Bayesian Network 上の強化学習”,第 24 回知能システムシンポジウム,. pp.61-66,(1997)

これ読みたい。でもネット上に落ちてない。論文取り寄せとかしたことない。
しかたないから山村研究室にあった修士論文でガマン。

これでも十分にわかる。かなりよい。
これでBESOMの強化学習の部分いけるんじゃないかな?

以前からCPTは強化学習の対象になると思ってたけど、Q-Tableで考えてた。
まさかactor-criticだとは。でも、こっちのほうがいい感じ。
すごいね、山村先生って。

拍手[0回]

PR

Comment

お名前
タイトル
文字色
メールアドレス
URL
コメント
パスワード

Trackback

この記事のトラックバックURL:

プラグイン

カレンダー

04 2025/05 06
S M T W T F S
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

カテゴリー

最新記事

最新CM

最新TB

プロフィール

HN:
東こうじ
性別:
男性

リンク

サイトマスター

アクセス解析

バーコード

RSS

ブログ内検索

アーカイブ

カウンター