CVチュートリアル
Vision Transformerのしくみ
・Transformerのしくみ ・Vision Transformerのしくみ ・Vision Transformerの応用例 ・Vision Transformerと自己教師あり学習
2020年Google Brainが発表したVision Transformer(ViT)は入力画像を固定パッチに分解し,分解したパッチ間の関係を捉えることで,高精度に画像を分類します.
ここでは,ViTの仕組みと,ViTのバックボーンで使われるTransformerのアルゴリズムの解説,そしてViTの応用先について紹介します.
・Transformerのしくみ
・Vision Transformerのしくみ
・Vision Transformerの応用例
・Vision Transformerと自己教師あり学習