MPRG : 機械知覚&ロボティクスグループ／中部大学

03 Apr 2015

Deep Convolutional Neural Networkを用いた顔画像の理解

顔画像解析は，デジタルカメラやスマートフォンの顔検出やセキュリティシステムの顔認識、顧客分析やマーケティングにおける性別年齢推定など様々な場面で用いられています．顔画像解析の研究は古くから行われていますが、表情や顔向きの変化などが課題としてあります。このような課題に対して、特徴量の改良や識別器の高精度化が取り組まれていますが、特徴量や識別器の設計は研究者の知識に基づいており、問題に応じた設計が必要となります。そこで，我々は特徴量を自動的に設計して学習するConvolutional Neural Networkを用いることで，様々な変化に対して頑健な顔画像解析を実現します．

Separation Multi-task Networksによる顔器官点と顔属性の同時推定
Convolutional Neural Networkの手法の1つであるマルチタスクラーニングは，学習するタスクに共通する低次特徴と各タスク固有の高次特徴を学習します．しかし，従来のマルチタスクラーニングでは，浅い層で獲得できるタスク固有の低次特徴を利用することができません．そこで，我々はタスク固有の低次特徴も利用するマルチタスクラーニング手法を提案します．
顔器官点検出と顔属性推定を同時に学習および評価した結果，タスク固有の低次特徴を利用することで，高精度な顔器官点検出を実現しました．また，特徴マップを可視化してみると，顔器官点検出と顔属性推定では，タスク共通の特徴以外のそれぞれのタスクの推定に必要な特徴を獲得していることが確認できます．

顔器官点検出における最適なミニバッチ作成方法
顔器官点検出は，顔認証や表情推定などの顔画像処理における重要な前処理であり，顔画像認識分野で活発的に研究されている分野の1つです．我々は，Convolutional Neural Networkを用いることで，高精度な顔器官点検出を実現します．しかし，Convolutional Neural Networkの学習過程でパラメータ調節や学習サンプルの与え方など，まだ手探りな部分が多く，Convolutional Neural Networkの性能を十分に引き出すことは容易ではありません．
そこで，我々は4つのサンプルの与え方について比較をすることで，学習サンプルの与え方を検討しました．

実験の結果，学習サンプルをData Augmentationにより増幅させるAugmentation mini-batchが最も高精度に顔器官点検出ができており，顔の表情の変化や向きに対して頑健に顔器官点が検出できています．また，従来の顔器官点検出法であるConditional Regression Forestより24%高精度に検出が可能であることがわかります．シンプルな構造のConvolutional Neural Networkを用いているため，3.4GHzのCPU上で1枚の顔画像に対して約10msで検出が可能です．

FacePoint FacePoint_

重み付け誤差関数を導入したDeep Convolutional Neural Networkによる顔領域セグメンテーションの高精度化
顔領域のセグメンテーションは，顔の構造を理解する上で最も有効な処理とされています．我々は顔の構造を理解するために，顔の目，鼻，口，サングラス，帽子，肌，髪，背景の6クラスを割り振ったデータセットを作成しました．本データセットは，Labeled Face in the Wild(LFW) Datasetをベースにした13233枚のデータセットです．また，本データセットはこのリンク(207.5MB)からダウンロードが可能であり，文献情報は”Cost-Alleviative Learning for Deep Convolutional Neural Network-based Facial Part Labeling“の文献ページに記してあります．

HP_japanese2.005

しかし，従来のConvolutional Neural Networkによる顔領域のセグメンテーションでは，目などの小さな顔領域に対して本来の領域より小さくセグメンテーションされる傾向があります．そこで，我々は学習過程における学習誤差算出時に重みを付与することで，領域の小さな領域に対しても高精度にセグメンテーションを行います．実験の結果，学習誤差関数に対して0.8の重みを付与することで，従来のConvolutional Neural Networkより高精度なセグメンテーションが可能となり，領域の小さい目に対しては約20%以上の精度向上を実現しました．

FacLabel1 FacLabel2

Deep Convolutional Neural Networkによる認知症リスクの推定
日本の認知症患者数は年々増加しており，認知症の早期発見が求められる一方で医師による診断でしか認知症を発見できないという課題があります．そこで， C-Face.Dの認知症レベルを基準に，工学的なアプローチで自動診断するアプローチを提案します．
Deep Convolutional Neural Networkを用いることで高精度な認知症リスク推定を行います．また，学習に顔の目や口等の各器官の位置情報を付与することで認知症リスクの推定精度の向上を確認しました．

HP_japanese2.006

Heterogeneous Learningによる顔器官点と性別・年齢・顔器官点の推定
近年，性別や年齢などを用いた情報提供サービスが普及しつつあります．顔画像から性別や年齢を推定するには，性別や年齢のそれぞれのタスクに対して識別器を構築する必要があります．各識別器を用いて推定をした場合，タスクの数に比例して計算コストが膨大になるため，実用化が困難になります．そこで，我々はシンプルなDeep Convolutional Neural Networkを1つ用いることで，性別と年齢，顔器官点を同時に認識します．
実験の結果，様々な顔画像に対しても性別と年齢，顔器官点を高精度に推定ができることが確認できます．また，シンプルな構造のConvolutional Neural Networkを用いているため，3.4GHzのCPU上で4fpsの速度で推定が可能です．

recres

重み付きHeterogeneous Multi-task Learningによる顔属性認識の高精度化
Heterogeneous Multi-task Learningを用いることで，タスク数に比例して増加していた計算コストを削減しつつ複数タスクの認識が可能となりました．しかし，各タスクの学習誤差のばらつきが原因で各タスクの識別精度が低下する傾向があります．そこで，学習誤差のばらつきを抑制するために，学習誤差関数に対して重みを動的に付与することで，Heterogeneous Multi-task Learningの学習における悪影響を軽減し，学習を安定させます．これにより，各タスクの精度の低下を抑えることができます．

HP_japanese6.009