MPRG : 機械知覚&ロボティクスグループ／中部大学

13 Oct 2021 CVチュートリアル

Vision Transformerのしくみ

・Transformerのしくみ　・Vision Transformerのしくみ　・Vision Transformerの応用例　・Vision Transformerと自己教師あり学習

2020年Google Brainが発表したVision Transformer(ViT)は入力画像を固定パッチに分解し，分解したパッチ間の関係を捉えることで，高精度に画像を分類します．
ここでは，ViTの仕組みと，ViTのバックボーンで使われるTransformerのアルゴリズムの解説，そしてViTの応用先について紹介します．

　・Transformerのしくみ
　・Vision Transformerのしくみ
　・Vision Transformerの応用例
　・Vision Transformerと自己教師あり学習