バイナリ型HOG特徴量による人検出
Histograms of Oriented Gradients(HOG)は、人検出の特徴量として利用されています。HOG特徴量は、9方向の勾配方向ヒストグラムをセル(局所領域)毎に並べたものを特徴量として記述するため、高次元となる場合があります。我々は、このHOG特徴量のメモリ量を削減するために、二値化したHOG特徴量について、以下の二つのアプローチに取り組んでいます。一つ目は、異なる領域の関係性より二値化する特徴量を提案しています。二つ目は、二値化の際に発生する量子化誤差を考慮した識別方法です。
Relational HOG特徴量とワイルドカードを用いたバイナリのマスキング
我々はHOG特徴量の情報量を削減するために、二つの局所領域から抽出したHOG特徴量の大小関係により二値化するRelational HOG特徴量(R-HOG)を提案しています。勾配強度そのものを二値化するのではなく、異なる領域の勾配強度の大小関係を利用することで、煩わしいしきい値設定が不要となります。しかし、大小関係が明確でない場合、不安定なバイナリパターンを出力する場合があります。そこで、Real AdaBoostを用いて学習する際に、“0”と“1”の二つのバイナリを許容するワイルドカード(*)を導入し、識別に悪影響を及ぼす一部のバイナリを観測しないようにAdaBoostの学習過程でマスキングする手法を提案しています。評価実験より、提案手法はメモリ量を削減したにもかかわらず、従来法であるHOG特徴量の検出性能と同程度以上であることを確認しています。
量子化残差に基づく遷移ゆう度モデルを導入した識別器の提案
HOGのように実数で表現される特徴量を2値化することで、特徴量に含まれる多くの情報が欠落するという問題がああります。我々は、特徴量を2値化する際に欠落する情報である“量子化残差”に着目したアプローチを提案しています。画像から観測される2値符号列が他の2値符号列へ遷移する可能性を考慮するために、量子化残差に基づき遷移を予測する遷移ゆう度モデルを識別器へ導入します。これにより、観測された2値符号列が何らかの影響により真に得たい2値符号列とは異なっても、本来得たい2値符号列への遷移を考慮した識別が可能となります。