機械知覚&ロボティクスグループ
中部大学

Human Detection Deep Learning 口頭発表

Grid-wise-attentionによる物体検出の視覚的説明

Author
木村秋斗, 早川和希, 森巧磨, 長内淳樹, 平川翼, 山下隆義, 藤吉弘亘
Publication
画像センシングシンポジウム, 2022

Download: PDF (Japanese)

歩行者検出は,画像上に存在する歩行者の位置を検出する技術である.そのため,自動運転では前方にいる歩行者を検出し,車を停止させるなど,自動運転の安全性を確保するために必要な技術であると言える.特に,レベル5の完全自動運転の実現には,検出精度の向上だけでなく,サービスを享受する人が信頼できるように検出結果の判断根拠を示す必要がある.従来の物体検出として,Convolutional Neural Network(CNN)による物体検出を用いて行う手法が多数提案されている.中でも,Faster R-CNNが,事前に定義した矩形のテンプレートのセットを用いることで物体の位置推定とクラス分類を1つのネットワークで行うことを実現したことで,高速化かつ高精度な物体検出手法が提案された.しかし,従来の物体検出手法は,ネットワークが物体を検出すると判断した根拠が不明であるという問題がある.本研究は,物体検出の判断根拠を示すことが可能な手法の実現を目的とし,画像をグリッド状に分割した各地点に対して,アテンションマップを獲得する手法を提案する.提案手法は,画像上に存在する複数の物体に対し,それぞれの検出する地点に対するアテンションマップを取得できるため,各対象の検出の判断根拠を示すことができる.また,提案手法のクラス推定と位置推定を段階的に行い,クラス推定に用いる特徴を基にアテンションマップを求めることで,クラスらしさを考慮した物体検出の判断根拠となる.そして,アテンションマップによる重み付けを行い位置の推定をすることで物体の注視領域を考慮した検出を行う.本稿では,CityPersonsデータセットを用いた歩行者検出の精度比較から本手法の有効性を調査し,取得したアテンションマップを可視化することで歩行者検出の判断根拠を調査する.

前の研究 次の研究