[DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

104 Views

February 22, 17

#deep learning #階層的強化学習 #確率的ニューラルネットワーク #強化学習 #ニューラルネットワーク #事前学習

スライド概要

2017/2/22
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 92.7K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 71.9K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 61.6K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 55.4K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 52.3K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 50.5K

各ページのテキスト

STOCHASTIC NEURAL NETWORKS FOR HIERARCHICAL REINFORCEMENT LEARNING Carlos Florensa† , Yan Duan†‡, Pieter Abbeel†‡ 2017/2/10 発表者：金子貴輝

階層的強化学習 • 報酬を得るまでが長いタスクを分割したい • 従来法の問題 – タスクの分割に固有の知識を必要とする – タスク間で知識を共有せずサンプル効率が低い 2

問題設定 • 事前学習ができる • 状態空間が（共通，タスク固有）に分かれて相互作用が少ない – 例：把持タスクにおける対象物の位置 3

提案手法 • 確率的ニューラルネット – 同じ状況でも異なる行動を取れるので，状況の変化に対応できる • 相互情報量基準での正規化 – 新しい場所に行けば報酬になるらしい • タスク特徴の挿げ替えによる階層的RL – タスクを表す特徴で条件付けて事前学習 • 報酬は疎のままでいい – 固定ステップごとにone hotなタスク特徴を自作する上位のニューラルネット 4