京大基礎物理研「複雑系の科学」研究会で高橋と甲野が発表しました

京大基礎物理研「複雑系の科学」研究会で高橋と甲野が発表しました。
高橋の科研費と甲野の学振の両テーマに関わりのある内容です。

LSVR モデルの非定常(ばらばら・ぽつぽつ変化)は結構不思議な結果だと思っています。
自分は greedy 法で決定論的に振る舞うのに、環境の不確実性・揺らぎを使って確率的な探索よりも良い塩梅で探索と知識利用を両立できるだけでなく、自分が見ていないところで起こった非定常性、報酬確率の変動、についても、揺らぎの増幅によってかなり追随できてしまう。
不確実性と非定常性はどちらも一般的には難問ですが、両方が区別できない地点(内部観測)においては、お互いがお互いを弱める、という結果が得られました。
そういう意味で、複雑系的にも意味のある結果かなと思い、このテーマで発表しました。

A toy model of human cognition: Utilizing fluctuation in uncertain and non-stationary environments

Tatsuji Takahashi, Yu Kohno
Seminar on science of complex systems (organized by Yukio-Pegio Gunji), Yukawa Institute for Theoretical Physics, Kyoto University, Jan. 20, 2014

http://www.yukawa.kyoto-u.ac.jp/contents/seminar/detail.php?SNUM=51633

http://www.slideshare.net/tatsujit/a-toy-model-of-human-cognition-utilizing-fluctuation-in-uncertain-and-nonstationary-environments

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中