MPRG : 機械知覚&ロボティクスグループ／中部大学

06 Sep 2024 国内会議

MaskDP による事前学習のマルチドメイン拡張

Author: 鈴木佳三, 板谷英典, 村瀬卓也, 佐々木一磨, 平川翼, 山下隆義, 藤吉弘亘
Publication: 日本ロボット学術講演会, 2024

Download: PDF (Japanese)

Masked Decision Prediction (MaskDP) はマスクされた状態と行動の軌道を復元する事前学習を行うことで強化学習の効率化を図る手法である．しかし，この手法は事前学習と追加学習のドメインが同じ必要がある．そこで MaskDP をマルチドメインへ拡張したMulti-Domain MaskDP を提案する．MuJoCo におけるロボットタスクで性能を維持したままマルチドメイン事前学習ができることを示す．