機械知覚&ロボティクスグループ
中部大学

Deep Learning Dataset Robotics 口頭発表

Transformer モデルを用いたスケッチ指示による把持位置推定

Author
野田修平, 平川翼, 山下隆義, 藤吉弘亘
Publication
日本ロボット学会学術講演会, 2024

Download: PDF (Japanese)

生活支援ロボットの容易な操作手法としてスケッチ指示がある.指示画像と把持対象物体の画像からロボットの把持位置を推定する従来手法では,スケッチ位置のみの変更に対応できない場合がある.本研究では Transformerモデルによる把持位置推定を提案する.Encoderでは,深度画像からシーンの中の各物体を解析し,Decoderでは,Encoder のシーン解析結果とスケッチ画像との関係性を Cross-Attention により求めることで,物体とスケッチの位置関係を正確に算出する.

前の研究 次の研究