Deep Learning
Object Detection
Semantic Segmentation
口頭発表
Next-ViTとBiFPNによる車載カメラ映像からのマルチタスクの高精度化
- Author
- 張 陳雨,平川 翼,山下 隆義,藤吉 弘亘
- Publication
- ビジョン技術の実利用ワークショップ,2023
Download: PDF (Japanese)
自動運転システムには多種多様なタスクが存在するため,マルチタスク学習は非常に効果的である.マルチタスク学習におけるバックボーンでは下流タスクに共通した特徴を抽出する.しかし,下流タスクにより必要な特徴レベルが異なるため,各下流タスクに合わせた特徴抽出が必要である.そこで本研究では,車載カメラ映像を用いた自動運転タスクにおいてCNNとTransformerを活用したNext-ViTと,特徴融合手法BiFPNを導入したマルチタスクモデルを提案する.自動運転タスクによる評価実験から,提案手法を用いることでマルチタスク学習における精度向上を確認した.