機械知覚&ロボティクスグループ
中部大学

Robotics 口頭発表

複数解像度間の整合性を考慮した顕著性予測のモデル効率化

Author
瀬尾俊貴, 平川翼, 山下隆義, 藤吉弘亘
Publication
パターン認識・メディア理解研究会, 2020

Download: PDF (Japanese)

顕著性とは人間の注視の引きつけやすさを意味し,画像から視覚特徴を抽出・統合することにより,顕著性マップとして人間が注意を向けやすい領域を求めることが可能である.そのため,動画像における顕著性予測では,動画要約やセマンティックセグメンテーションを始めとして様々な手法に用いられている.一般的に,顕著性予測は前述した動画要約やセマンティックセグメンテーションなどメインタスクの補助情報として用いられることが多い関係上,精度以外にも学習・評価時間やメモリ使用量の考慮が重要である.そこで,本研究ではモデル効率化を目指した顕著性予測,及び画像解像度毎の整合性を考慮した学習手法を提案する.提案手法では,MobileNetV2をベースとしたモデルの利用によりモデルの効率化を行い,さらに中間特徴量を洗練するRefinement layer,画像解像度毎の顕著性の整合性を考慮することで,モデルのパラメータ数の軽減,及び精度が向上することを確認した.

前の研究 次の研究