機械知覚&ロボティクスグループ
中部大学

Vision Applications 口頭発表

講義イベント検出に基づく短縮講義ビデオの自動生成

Author
横井隆雄, 桐井孝嘉, 藤吉弘亘
Publication
画像センシングシンポジウム, pp. 535–540, 2006

Download: PDF (Japanese)

本稿では, 講義中のイベントを自動検出し, その結果から時間短縮講義ビデオを 生成する手法を提案する. 提案手法では, 時間短縮講義ビデオを生成するために, 発話区間と板書区間の検出を行う. 発話区間は, 事前に抽出した複数の講師の発話・無発話での音声特徴(16次LPC ケプストラム・パワースペクトル40Hz-900Hz) と, 入力された音声データとのマハラノビス距離を計算し判定する. 板書区間の検出では, 板書の変化を抽出するために講師領域を正確に求める必要がある. 本研究では, グラフカットによる講師領域の正確なセグメンテーション結果を用いて, 講師消去画像を生成する. 講師消去画像のフレーム間差分を毎フレーム 求めることで, 板書区間の検出が可能となる. 検出した講義イベントから必要のない区間はカット, 板書イベントのみの区間は3 倍速にすることで時間短縮講義ビデオを自動生成する. 評価実験の結果, 提案手法は従来手法に比べ, 人が編集したビデオと同程度の時間短縮ビデオを自動生成できることを確認した.

前の研究 次の研究