Deep Learning
Reinforcement Learning
Self-Supervised Learning
口頭発表
MaskDP による事前学習のマルチドメイン拡張
- Author
- 鈴木佳三, 板谷英典, 村瀬卓也, 佐々木一磨, 平川翼, 山下隆義, 藤吉弘亘
- Publication
- 日本ロボット学術講演会, 2024
Download: PDF (Japanese)
Masked Decision Prediction (MaskDP) はマスクされた状態と行動の軌道を復元する事前学習を行うことで強 化学習の効率化を図る手法である.しかし,この手法は事前学習と追加学習のドメインが同じ必要がある.そこで MaskDP をマルチドメインへ拡張したMulti-Domain MaskDP を提案する.MuJoCo におけるロボットタスクで 性能を維持したままマルチドメイン事前学習ができることを示す.