Deep Learning
口頭発表
[サーベイ論文] Adversarial Training
- Author
- 足立浩規, 平川翼, 山下隆義, 藤吉弘亘
- Publication
- パターン認識・メディア理解研究会, 2022
Download: PDF (Japanese)
Adversarial training (AT) は悪意のある摂動を付与したサンプル (AEs: Adversarial examples) を学習に使用して,攻撃に頑健なモデルの獲得を目的とした学習方法である.ATはAEsに対するモデルの頑健性能を向上させる一方で,通常のサンプルに対する分類精度を大幅に劣化させる性質がある.この問題を解消するために,様々な観点からアプローチした手法が数多く提案されている.本稿ではATについてサーベイし,ATの研究動向について体系的にまとめる.また,代表的な手法に関して,データセットやモデルなどを統一して分類精度の評価および比較をする.さらに,各手法を適用したモデルの低次元特徴空間を可視化しつつ,特徴空間の定量的評価指標を用いて比較をする.