機械知覚&ロボティクスグループ
中部大学

Deep Learning

Deep Convolutional Neural Networkによるセマンティックセグメンテーション

セマンティックセグメンテーションは,画像中のシーンを理解する上で重要な認識タスクです.一般的な物体認識は,画像中の物体の位置とスケールを推定する技術ですが,セマンティックセグメンテーションは画像の各ピクセルが何の物体なのかを認識する技術です.Deep Convolutional Neural Network(DCNN)を用いたセマンティックセグメンテーションの研究は活発に研究されており,代表的な手法としてSegNetやFully Convolutional Network (FCN)が提案されています.

Multiple Dilated Convolutional Blocksによるセマンティクセグメンテーション
車載カメラ映像のセマンティックセグメンテーションは,歩行者や車両等の物体とカメラまでの距離により大きさが変動します.そのため,様々な物体の大きさに対応したMulti Dilated Convolution Blocksを提案します.Multi Convolution Blocksを構成している複数のDilated Convolutionにより,大局的な特徴と局所的な特徴を抽出することが可能です.車載カメラにおけるセマンティックセグメンテーションのベンチマークであるCityscape Datasetで評価した場合,Multi Dilated Convolution Blocksを導入することで一般的なセマンティックセグメンテーション手法より精度が向上していることが確認できます.

HP_japanese2.010HP_japanese2.011

2D-QRNNを導入したセマンティックセグメンテーションの高精度化と高速化
セマンティックセグメンテーションの高精度化を実現した手法として,DAG-RNNsが提案されています.DAG-RNNsは,2次元に拡張したRecurrent Neural Network (RNN)をDCNNに導入することで,広範囲の空間領域を文脈として捉えることが可能です.しかし,RNNの中間層はGPUの並列演算が不可能なため,識別時間が増加する問題が発生します.そこで,並列に時系列情報を扱えるQuasi-Recurrent Neural Network (QRNN)を2次元に拡張した2D-QRNNを提案することで,高精度かつ高速なセマンティックセグメンテーションを実現しました.

HP_japanese2.012HP_japanese2.013

前の研究 次の研究