機械知覚&ロボティクスグループ
中部大学

Machine Learning Deep Learning 口頭発表

単語画像の輪郭強調と複雑背景の合成による単語認識の高精度化

Author
阿知波千浩, 山下隆義, 中澤満, 益子宗, 山内悠嗣, 藤吉弘亘
Publication
画像センシングシンポジウム, 2017

Download: PDF (Japanese)

文字認識において,学習画像を生成して,学習サンプルの収集コストを抑える方法 [1] が提案されている.この手法は,単純背景下に文字がある場合を想定している.一方,インターネット上の商品画像や広告等の背景は非常に複雑であり,従来の生成手法では文字認識が困難である.そこで提案手法では,文字の輪郭を強調した文字画像と背景を合成して文字画像を生成する方法を提案する.生成した文字画像を学習に用いることにより広告上に印字された文字に対しての識別精度を向上させることが可能となる.また,本生成手法を単語の生成にも応用する.生成した単語画像を学習に用いることにより,生成した単語画像に対しての識別精度を向上させることが,広告上に印字された単語に対しても識別精度を向上させることが可能となる.さらに,誤認識した斜体文字やブラー含む文字を学習に加えることで誤認識の抑制も可能となる.

前の研究 次の研究