機械知覚&ロボティクスグループ
中部大学

Deep Learning Reinforcement Learning Self-Supervised Learning 口頭発表

MaskDP による事前学習のマルチドメイン拡張

Author
鈴木佳三, 板谷英典, 村瀬卓也, 佐々木一磨, 平川翼, 山下隆義, 藤吉弘亘
Publication
日本ロボット学術講演会, 2024

Download: PDF (Japanese)

Masked Decision Prediction (MaskDP) はマスクされた状態と行動の軌道を復元する事前学習を行うことで強 化学習の効率化を図る手法である.しかし,この手法は事前学習と追加学習のドメインが同じ必要がある.そこで MaskDP をマルチドメインへ拡張したMulti-Domain MaskDP を提案する.MuJoCo におけるロボットタスクで 性能を維持したままマルチドメイン事前学習ができることを示す.

前の研究 次の研究