Learning Analytics
ここ数年で教育分野のデジタル化が急速に進み,電子教科書やネットワーク上での講義資料・提出物の管理が一般的となりました.
このようなシステムを通じて,教科書の操作履歴や学生の提出物など,講義への取り組みに関するデータが自動的に蓄積されます.
これらの学習履歴をデータマイニングの手法によって可視化・分析し,学習者の理解度を評価したり,将来的な能力を予測したり,隠された問題を発見したりする研究分野は,Learning Analytics(LA)と呼ばれています.
日本では2013年頃からLAに関するセッションやシンポジウムが各地で開催され,2016年には九州大学に「ラーニングアナリティクスセンター」が設立されるなど,活発に研究が進められている分野です.
こうした流れの中,私たちはデータサイエンスやAI技術を用いて,講義を十分に理解できていない学生を予測し,適切な指導を行えるシステムの構築を目指しています.
自由記述文による学生の講義理解度予測
大学の講義によっては,授業後に学生から感想や自己反省を自由記述形式のアンケートで募るケースがあります.
これらの自己反省には,学生が講義についてどう感じ,どの部分を理解でき,あるいは理解できなかったのかなど,多くの情報が含まれています.
そこで私たちは,学生の自己反省から将来の成績を予測し,成績が低下しそうな学生に対して指導方針を提示できるシステムを構築することで,学生の成績向上と教師の負担軽減を図ろうと考えました.
延べ370名の学生を対象に収集したアンケートを分析したところ,学生の成績とアンケートへの継続的な取り組み方には大きな相関があることがわかりました.
成績の高い学生ほど,毎回の講義でアンケートの内容に大きな変化がみられ,逆に成績が低い学生はほとんど同じ回答を繰り返す傾向が確認されたのです.
この分析結果を踏まえて成績予測AIを構築したところ,講義の7回目から8回目の段階で,成績が低くなる学生を7割以上の精度で予測できることが確認されました.
さらに,このときのAIの判断根拠を詳しく調べた結果,アンケート回答の変化の大きさに注目しており,同じ回答を何度も繰り返すなど,講義に対する意欲が低い学生は成績も低くなりやすいことが示されました.
差分パターンマイニングによる重みづけを利用した fastText 特徴による成績予測
従来の成績予測手法では,操作の種類と講義資料ごとに操作回数ヒストグラムを生成し,入力特徴とすることで,成績の分類予測を実現しています.
しかし,行動パターンを直接使用した特徴表現になっていないため,学生へのフィードバックに行動パターンを提案することができないという問題点があります.
そこで本研究では,E2vecの前処理・埋め込みモジュールを利用することにより,時系列を維持した操作ログの埋め込みベクトルを獲得します.
そこに,差分パターンマイニングにより検出した,成績間で差がある行動パターンをもとに重み付けを行うことで,学生の特徴ベクトルを生成します.
実験結果から,重み付けの有効性が確認でき,成績上位者と成績下位者それぞれに現れる行動パターンが判明しました.
ニューラルネットワークを用いた適切な学習行動の推奨
ニューラルネットワークを教育分野に応用する多くの研究は,生徒の成績予測と説明性に焦点を当てていますが,ニューラルネットワークは教師の代わりに生徒の学習を直接サポートすることはできません.
そこで本研究では,一般的なTransformerエンコーダを使用して,学生のパフォーマンスを向上させるための適切な学習アクションを推奨する方法を提案します.
成績の低い生徒のattentionの重みを高い生徒のattentionに近づけるように,学習教材と学習行動を推奨することで学生のパフォーマンスが向上することを期待します.
この手法の有効性を評価するために,九州大学から取得したデジタル教材上の学生の操作に関するプライベートデータセットでモデルを訓練しました.
各学習教材別,操作の種類ごとの操作回数ヒストグラム特徴をモデルに入力し,学生の成績を5段階評価で出力します.
この学習済みモデルを用いて,成績予測に成功したサンプルについて,推奨された学習教材やアクションに基づいてヒストグラム特徴を増やすことで生徒の成績がどのように変化するかを調べた結果,無作為の推奨よりも,教材ベースの推奨と操作ベースの推奨の両方で、より多くの学生のパフォーマンスが向上しました.成績が上がった生徒の割合は,成績の低い生徒ほど大きくなる傾向にありました.
具体的には,成績が最も低い2人の生徒の改善率は,90%以上であることを確認しました.