機械知覚&ロボティクスグループ
中部大学

CVチュートリアル

Vision Transformerのしくみ

・Transformerのしくみ ・Vision Transformerのしくみ ・Vision Transformerの応用例 ・Vision Transformerと自己教師あり学習

2020年Google Brainが発表したVision Transformer(ViT)は入力画像を固定パッチに分解し,分解したパッチ間の関係を捉えることで,高精度に画像を分類します.
ここでは,ViTの仕組みと,ViTのバックボーンで使われるTransformerのアルゴリズムの解説,そしてViTの応用先について紹介します.

 ・Transformerのしくみ
 ・Vision Transformerのしくみ
 ・Vision Transformerの応用例
 ・Vision Transformerと自己教師あり学習

前の研究 次の研究