Reinforcement Learning
口頭発表
深層強化学習における状態遷移を考慮した内発的動機付けによる探索の効率化
- Author
- 大鹿 海都, 板谷 英典, 平川 翼, 山下 隆義, 藤吉 弘亘
- Publication
- 電子情報通信学会技術研究報告, パターン認識・メディア理解研究会,2024
Download: PDF (Japanese)
深層強化学習ではエージェントと環境間の相互作用により学習データを収集するため,環境の効率的な探索は網羅的な学習データの獲得に繋がる.この課題を解決する手法として,エージェントの内発的動機付けによる探索の効率化が提案されている.観測情報の新規性を評価し未知の状態空間への探索を促すことで効率的な探索を実現する.しかし,従来の内発的動機付けは現状態のみに着目しているため,環境の時系列情報を考慮していない.そこで,環境の状態遷移に着目した内発的動機付けを提案する.Atari2600を用いた評価実験により,エージェント性能を解析することで状態遷移を考慮する有効性を示す.