Deep Learning
口頭発表
動画像認識におけるST-ABNを用いた人の知見の組み込みによる説明性の向上と高精度化
- Author
- 野口紗季,史宇植, 平川翼,山下隆義,藤吉弘亘
- Publication
- 画像センシングシンポジウム, 2023
Download: PDF (Japanese)
深層学習による動画像認識は学習データに依存するため,認識に必要な領域に注視できず誤認識することがある.一方,人間は経験の中で認識に必要な情報を既に持っており,認識に必要な領域を正確に判断することが可能である.これまで静止画像による物体認識では,認識時における判断根拠の可視化や人の知見の導入の有効性について示されている.しかし,動画像認識分野において人の知見を組み込むことのできる判断根拠の可視化手法は存在しない.そこで本研究では,獲得したアテンションを人の知見に基づいて修正し認識に用いることができる Spatio-Temporal Attention Branch Network (ST-ABN) を提案し,時間方向に対する注視領域を手動で修正する.評価実験では,ST-ABNによる時空間情報の視覚的説明性,人の知見の組み込みの有効性,時間情報の注視領域を修正することによる空間情報への影響について示す.