皆さん、こんにちは。
この記事では、今回の英語文献ゼミで読んだ論文とその感想について紹介します。
論文タイトル: Unpacking help-seeking process through multimodal learning analytics: A comparative study of ChatGPT vs Human expert
論文誌:Computers & Education
出版年:2024
著者名:Angxuan Chen, Mengtong Xiang, Junyi Zhou, Jiyou Jia, Junjie Shang, Xinyu Li, Dragan Gašević, Yizhou Fan
ヘルプシーキング(援助要請行動)は、自己調整学習における重要な学習戦略として知られています。学習者が課題に直面したとき、適切な支援を求めることは、学習成果の向上につながります。効果的なヘルプシーキングのためには、認知的・メタ認知的プロセスへの積極的な関与が必要です。しかし、実際の学習場面では、学習者は必ずしも適切にヘルプを求めているわけではなく、支援の乱用や回避といった問題が報告されています。さらに、近年登場したChatGPTのような生成AIは、従来の教師による支援とは異なる特徴を持っています。生成AIは人間のような知能を持ち、自然な対話が可能である一方で、その利用は学習習慣の悪化やメタ認知能力の低下、学問的不正の可能性増加といった懸念も指摘されています。
従来の理論では、ヘルプシーキングのプロセスは5つの段階で説明されています(Nelson-Le Gall, 1981)。まず、学習者はヘルプの必要性を認識し、次にヘルプシーキングを決定します。その後、潜在的なヘルプソースを特定し、ヘルプを引き出す戦略を実行します。最後に、ヘルプシーキングの試みに対する反応を評価します。このモデルでは、学習者が問題に直面した際に支援の必要性を認識し、適切な支援者と方法を選択し、支援を受けた後にその有用性を評価することが想定されています。さらに、ヘルプシーキングには様々な要因が影響を与えることが報告されています。例えば、メタ認知が不十分で先行知識が不足している学習者は、そもそもヘルプの必要性を認識できないことが多いとされています(Nelson & Fyfe, 2019)。また、ヘルプシーキングへの意思決定には、認識されたメリットとコストが大きく関わっています。アカデミックなヘルプシーキングは習得接近目標と関連する一方、ヘルプシーキングの回避行動は、遂行回避目標と正の関連、習得接近目標と負の関連を示すことが明らかになっています(Roussel et al., 2011)。
この研究は、学習者がChatGPTと人間の専門家に対するヘルプシーキングプロセスの違いを調査するため、38名の中国人大学生(平均年齢22.7歳)を対象に実験を行いました。参加者は、AIグループ(18名)と人間専門家グループ(20名)にランダムに分けられました。実験では、参加者は提供された3つの学習材料とルーブリックをもとに、教育の未来についての300-400wordsの英語エッセイ草稿を執筆しました。その後、トレーニングビデオを視聴し、利用可能なヘルプソースについての説明を受けました。その後、参加者は1時間かけてエッセイの修正に取り組みました。AIグループはChatGPT 4.0を使用し、人間専門家グループは英語ライティング指導の経験豊富な教師と対話を行いました。実験中は、マウスの動きやツールのクリック、ページナビゲーションなどの行動ログデータ、Tobii Nano Pro eye trackerによる視線追跡データ、そしてChatGPTまたは人間教師との対話テキストが収集されました。これらのマルチモーダルデータは、すべて画面録画の形式で統合され、同期された形で分析されました。
マルチモータル学習行動データを行動パターンマイニングで分析した結果から、AIグループと人間教師グループでは、明確に異なるヘルプシーキングパターンが見られました。AIグループの特徴的な点は、そのプロセスが非線形的であることです。具体的には、多くの学習者が理論モデルで想定される「問題診断」の段階を省略し、直接ChatGPTに質問を投げかける傾向が見られました。例えば、エッセイを十分に確認する前に「私のエッセイの問題点は何ですか?」といった質問を行うケースが多く観察されました。また、AIグループでは「ヘルプ要請」と「ヘルプ処理」の段階間で頻繁な遷移が見られ、「ヘルプ評価」の段階が省略されることが多いことも特徴的でした。この傾向は、ChatGPTの即時的な回答を提供することと関連している可能性があります。すぐに新しい質問ができる環境では、受け取ったヘルプの評価よりも、次の質問に移行しやすい傾向があるのかもしれません。一方、人間教師グループでは、理論モデルに近い線形的なプロセスが観察されました。学習者は問題を診断して、質問を行い、受け取ったヘルプを評価し、それを処理するという段階的な進行を示しました。特に注目すべきは、人間教師グループでは「ヘルプ評価」の段階が明確に見られ、受けたアドバイスについて積極的にフィードバックを行う傾向が強かったことです。活動の分析からも、両グループで違いが見られました。AIグループでは「実行的ヘルプシーキング」、つまり直接的な回答を求める傾向が強く見られました。これは情報通信技術の発展により、即時的な支援が容易に得られるようになったことを反映していると考えられます。例えば、「この段落を書き直してください」といった直接的な要求が多く見られました。対照的に、人間教師グループでは、過去に受けたヘルプを慎重に確認し、それを踏まえた上で新たな質問を行う傾向が強く見られました。これは社会的コストの影響を反映していると考えられます。教師に対して「無知に見える」ことへの懸念から、ヘルプを求める前に準備を行う傾向がありました。これらの知見は、教育実践に対して重要な示唆を提供しています。まず、ChatGPTを学習支援ツールとして活用する際には、メタ認知的スキルの向上を支援する仕組みが必要であることが示唆されています。例えば、受けたヘルプの評価を促す活動を意図的に組み込むことが有効かもしれません。また、人間教師による支援の特徴を活かしつつ、ChatGPTの利点も取り入れた統合的な支援環境の設計を検討すべきです。
以下は私の感想となります。この研究は、ChatGPTの機能検証に留まらず、教師による支援との差異や位置づけを実証的に検証しており、非常に示唆に富む研究アプローチを採用していると考えます。さらに、本論文の研究背景と先行研究のレビューが体系的かつ詳細に記述されており、議論の展開も論理的で理解しやすいものとなっています。一方で、ヘルプシーキングの効果測定において、学習効果をどのように評価すべきかという重要な観点について、より詳細な検証が必要ではないかと考えます。本研究では、プロセスの比較に焦点を当てていますが、学習成果との関連性についてもより深い分析が望まれます。また、生成AIによるチェックと教師からのヘルプについて、そのニーズや性質が本質的に異なる可能性があることも考慮すべきでしょう。特に言語学習の文脈においては、ライティングの修正などの言語内容に関するフィードバックが重要な観点となります。そのため、生成AIと教師によるヘルプの内容や質の差異について、より詳細な分析が求められると感じました。これらの課題は、今後の生成AIと人間教師の効果的な役割分担を考える上で、重要な研究課題となるのではないでしょうか。
文責:耿学旺