機械知覚&ロボティクスグループ
中部大学

Human Detection Deep Learning

Deep Convolutional Neural Networkを用いた歩行者検出の高精度化

従来の歩行者検出法では,Histogram of Oriented Gradients(HOG)特徴量をベースとしたSupport Vector MachineやDeformable Part Modelsが一般的に用いられてきました.しかし,2012年に行われた1,000クラスの物体認識コンテストでHintonらのグループが提案したCNNを用いた手法が高い性能を出しました.その後,CNNを用いた手法が様々な認識問題において用いられています.歩行者検出においても、CNNをベースとした手法が2013年の歩行者検出のベンチマークにおいてトップの性能を出しています.しかし,ベンチマークでトップの性能を出しているCNNベースの手法は,構造が複雑になっており識別処理において計算コストが高いデメリットがあります.そこで,我々はシンプルな構造のCNNを用いて歩行者検出をすることで高精度な歩行者検出を実現しました.

Dropoutのアルゴリズムをベースとした歩行者検出の高精度化

ニューラルネットワークの汎化性能を向上させる手法としてDropoutがあります.Dropoutは,学習の際に識別部の結合重みを限定する手法であり,単純な手法でありながら高い汎化性能の向上を実現しています.そこで,我々はDropoutのアルゴリズムに着目し,Dropoutの学習処理と識別処理に対するアルゴリズムを改良したRandom DropoutとEnsemble Inference Networks(EIN)を提案することで高精度な歩行者検出を実現しました.

RDEIN_Ver2

従来のDropoutを用いた学習時は,出力を0とするユニットの数を各更新で一定にしています.しかし,提案するRandom Dropoutは,各更新において出力を0とするユニットの数を常にランダムで指定する手法です.また,もう一つの提案手法であるEINでは,識別処理においてDropoutにより層間の結合重みをランダムに取り除いた複数の識別部のネットワークを構築し,各ネットワークの応答値から最終的な出力値を算出するアルゴリズムです.複数の異なる全結合層を持つネットワークから応答値を統合することで、誤検出を減らす効果があります.
歩行者検出のベンチマークであるCaltech Pedestrian DatasetとDaimler Mono Pedestrian Datasetを用いて評価したとき,2つのベンチマークの結果において,従来の歩行者検出法と比べて高精度な歩行者検出を実現をしました.

Comp_OtherMethods_CComp_OtherMethods_D

Comp_OtherMethods_CComp_OtherMethods_D

前の研究 次の研究