Deep Learning
口頭発表
Multiple Instance Learningを用いた優劣差に着目するスキル優劣判定
- Author
- 高田雅之, 平川翼, 山下隆義, 藤吉弘亘
- Publication
- 画像センシングシンポジウム, 2022
Download: PDF (Japanese)
スキル優劣判定は,動画内の動作の優劣判定を行うタスクであり,これまでにRank-aware Attention Networks (RAAN)が提案されている.RAANの学習には,優劣の2値ラベルが付与された2つの動画を入力して,Ranking Lossにより重みの更新を行う.このとき,動画をK個のセグメントに分割し,全てのセグメントが正解になるよう学習する.優劣の2値ラベルは動画全体を見てラベルが付与されており,動画内に含まれる全てのセグメントが該当するわけではない.しかしRAANは,優劣の差が無いセグメントに対して全体に付与されたラベルを使用するため,誤った優劣判定を誘発するという問題がある.本研究では,この問題を解決するアプローチとして,Multiple Instance Learning (MIL)を用いて,優劣の差があるセグメントに着目したスキル優劣判定法を提案する.提案手法は,動画をバッグ,動画から切り出したセグメントをインスタンスとし,バッグのみにラベルを付与して優劣判定を行う.これにより,優劣の差があるインスタンスのみに着目した学習が可能となる.また,優れた動作と劣った動作を個別に判定することで,それぞれの時間情報に関する判断根拠の獲得を目指す.