機械知覚&ロボティクスグループ
中部大学

Deep Learning Object Detection Semantic Segmentation 口頭発表

Next-ViTとBiFPNによる車載カメラ映像からのマルチタスクの高精度化

Author
張 陳雨,平川 翼,山下 隆義,藤吉 弘亘
Publication
ビジョン技術の実利用ワークショップ,2023

Download: PDF (Japanese)

自動運転システムには多種多様なタスクが存在するため,マルチタスク学習は非常に効果的である.マルチタスク学習におけるバックボーンでは下流タスクに共通した特徴を抽出する.しかし,下流タスクにより必要な特徴レベルが異なるため,各下流タスクに合わせた特徴抽出が必要である.そこで本研究では,車載カメラ映像を用いた自動運転タスクにおいてCNNとTransformerを活用したNext-ViTと,特徴融合手法BiFPNを導入したマルチタスクモデルを提案する.自動運転タスクによる評価実験から,提案手法を用いることでマルチタスク学習における精度向上を確認した.

前の研究 次の研究