みなさん、こんにちは。博士課程の田中です。この記事では、先日の英語文献ゼミで読んだ論文を紹介します。
論文タイトル: Can GenAI-empowered feedback promote L2 learners’ self-regulation strategic behavior and writing performance?
生成 AI によるフィードバックは、英語学習者の自己調整学習方略行動とライティング・パフォーマンスを促進できるか?
著者: Lin Sophie Teng, Xinjie Deng, Jing Yang
掲載誌: System (2026 年)
1. 概要
この研究では、自己調整学習(SRL)理論に基づき、異なるタイプのフィードバックがEF学習者のSRL方略の使用とライティング能力に与える影響を検証しています。筆者らは、中国の大学における84名の学習者を、「比較グループ(フィードバックなし)」、「Bingoグループ(AWE: 自動採点ツール)」、「ERNIEグループ(生成AIによるフィードバック)」の3群に分けています。3ヶ月間にわたり3つの英作文課題への取り組みと修正プロセスを経て、混合要因分散分析(Mixed factorial ANOVA)を用いた分析などが行われました。その結果、生成AIによるフィードバックは、学習者の英語習熟度によってフィードバックタイプによりその効果が異なることが示されています。
2. イントロダクション
英語ライティングの指導において、フィードバックは学習者の言語発達とモチベーション維持などに不可欠な要素です。しかし、教師が全学生に対して個別化された質の高いフィードバックを即時に提供することは困難です。この課題に対して、これまではAWEツールが主に利用されてきましたが、これらは文法やスペルといった形式的な修正に偏る傾向があり、学習者の批判的思考や深い自己調整を促すには限界があることが指摘されています。筆者らは、大規模言語モデル(LLM)に基づく生成AIは、対話的なインターフェースを通じて文脈に応じたより細やかなフィードバックを生成できる点に注目しています。この研究では、このような「対話型フィードバック」が、単なるエラー修正を超えて、学習者のSRLにどのように影響するかを明らかにすることを目的としています。
3. 文献レビュー
・SRLとフィードバックの役割
Zimmermanのモデルでは、SRLは学習者が自身の目標達成のために、認知・感情・行動をコントロールする動的なプロセスであり、3つの循環的フェーズ(予見、遂行、自己省察)からなるとされています。筆者らは、ライティングにおける効果的なフィードバックが、学習者に自身の現状と目標のギャップを認識させ、適切な方略の選択を促す重要な外部刺激となると述べています。
・AWEとGenAIの比較
従来のAWEツール(Bingo EnglishやPigai等)は、パターン認識や統計的手法によって誤りを指摘する仕組みであり、言語の正確性向上には寄与する一方で、フィードバックが画一的になりやすく、学習者の深い関与を引き出しにくいとされています。これに対し、筆者らは、生成AIは内容の論理構成やアイデア展開、スタイルの改善といった高次の側面に対しても具体的な提案が可能であると述べています。この対話性が、学習者のメタ認知を刺激し、より高度なSRL方略の実行を支援すると考えられています。
また、フィードバックの有効性は学習者の英語習熟度にも依存するとされており、低熟達度の学習者は詳細なフィードバックに対して認知的負荷を感じやすく、高熟達者は生成AIの提案をよりクリティカルに受け取り、取捨選択できる傾向があると述べられています。
・研究のギャップ
筆者らは、AWEがライティングの正確性向上に寄与することは既に示されている一方で、生成AIがSRL方略とパフォーマンスの両面に与える影響をAWEと直接比較した研究は十分ではないと指摘しており、本研究は、この点を検証することを目的としています。本研究におけるリサーチクエスションは下記の3つです。
RQ1:AWE フィードバックと生成 AI によるフィードバックは、中国人EFL 学習者のSRL方略の使用にどの程度影響を与えるか。
RQ2:AWE フィードバックと生成 AI によるフィードバックは、中国人EFL 学習者のライティング・パフォーマンスにどの程度影響を与えるか。
RQ3:第二言語(L2)の熟達度は、フィードバックの種類が中国人 EFL学習者のライティング能力の発達に与える影響を調整するか。
4. 研究方法
4.1 参加者
中国の大学に在籍する非英語専攻の1年生84名を対象とし、以下の3群に分けられています。
・生成AI使用群:ERNIE Botを使用
・AWE使用群:Bingo Englishを使用
・比較群:フィードバックなし
4.2 実験デザインと手続き
本研究は、事前テスト、3ヶ月間の介入、事後テストから構成されています。
・事前テストでは、ライティング課題とSRL質問紙(WSSLQ)が実施されています。
・トレーニングでは、各ツールの使用方法に関する指導が行われています。
・介入期間中、学習者は3つのエッセイの課題に取り組み、フィードバックを基に複数回の修正を行っています。
・事後テストでは、同様の測定が再度実施されています。
4.3 測定の方法
SRL方略はWSSLQにより測定され、ライティング能力は内容・構成・言語運用・メカニクスの4観点で評価されています。採点にはGPT-4による自動評価が用いられ、人間評価との高い信頼性が確認されています。習熟度はEF SETに基づき分類されています。
5. 結果・考察
・SRL方略への影響(RQ1): 混合要因分散分析の結果
分析の結果、時間の経過に伴うSRL方略の効果は見られた一方で、フィードバックの種類だけでは大きな差は確認されませんでした。ただし、一部の方略(例: Goal monitoring: η² = 0.09)においては交互作用が認められ、フィードバックの種類によって成長のパターンが異なることが示されています。また、生成AIによるフィードバックを受けた群では、下記のように複数の認知的方略の向上が確認された一方で、フィードバックの処理や感情の調整といった側面の低下が報告されています。
• ERNIE(GenAI):
・有意に伸びた項目: Idea planning(d = 1.78),Text processing(d = 0.76), Knowledge rehearsal(d =0.64), Interest enhancement(d = 0.48)
・有意に低下した項目:Feedback handling(d = 0.45) , Emotional control(d = 0.52)
筆者らは、この結果について、外部ツールへの依存や認知的負荷の外部化の可能性に言及しています。
・ライティングの成績への影響(RQ2)
すべての群においてライティング成績の向上が見られましたが、その伸び方に差がありました。下記に示されるように、生成AI群は最も高い成績の向上を示し、特に、内容面での改善が顕著であったと報告されています。一方で、AWEは文法やメカニクスなどの改善に寄与することが示唆されました。
• Content ERNIE > Bingo(MD = 0.97, p Comparison(有意)(Table 5)→ 正確さにも一定の効果
・ライティングの熟達度の影響(RQ3)
フィードバックの効果は学習者の熟達度によって異なり、群間に有意な交互作用が確認されました。
・上級者に関しては、Bingo(AWE)条件において中級者よりも大きな伸びが確認され(t(24) = 2.82, MD = 4.68, p = .010)、この結果は、AWE によるフィードバックが上級者においてより大きな効果を示す可能性を示唆しています。
理由としては、
1) 中級者は AWEフィードバックを処理するために必要な十分な言語能力を備えていない可能性があり、その結果、リビジョン活動への関与が低くなること。
2) 高熟達度の学習者はより高いSRLを有しており、AWE フィードバックを内在化するために、認知的方略やメタ認知的方略など多様なライティング方略を活用できる点が挙げられています。
・中級者においては、ERNIEは Bingoよりも有意に大きな伸びを示し(MD = 5.67, p < .01)ました。理由としては、中級の学習者は内容面などでより多くの支援を必要とする可能性があり、個別化された支援は ERNIE Bot との対話(フォローアップの質問など)を通じて実現されうると述べられています。
6. 結論
この研究では、フィードバックがEFLライティングの発達に有効であり、特に生成AIはライティングの内容(アイデアの発展)において有用であることが示されています。一方で、その効果は学習者の熟達度によって異なることも明らかになっています。具体的には、中級者においては 生成AIが有効である一方、上級者においては AWE が相対的に適合する可能性が示唆されています。筆者らは、GenAIとAWEは競合するものではなく、補完的に活用すべきであり、習熟度などの学習者の特性に応じたフィードバックの選択が重要であると述べています。
また、生成AIの活用はSRLの一部の側面に影響を及ぼす可能性も示唆されました。特に、フィードバックの処理や感情の調整といった側面において、学習者の主体的関与が弱まる可能性があるため、教育的に慎重な設計が求められると結論づけられています。
感想
この論文では、自身の研究テーマである“GenAIxSRLxEFL writing”に関わる先行研究として、レビューの観点から選択しました。特に、今学期は習熟度別のSRL方略の使用などを検証したいと考えており、この研究で示されている「フィードバックのタイプにより、成績やSRLに与える効果が習熟度に応じて異なった」という結果は大変有用な知見でした。
この研究の背景では、「従来のAWE ツールはスペルなどの形式的修正に偏り、学習者の批判的思考やSRLを十分に促すことができない」という課題が指摘されていました。しかし、検証の結果、生成AIがライティングにおけるSRL 方略の一部を低下させる可能性も示されており、生成AIを活用したフィードバックデザインの重要性を再認識しました。筆者らは、「中級者は 生成AIが有効である一方、上級者には AWE が相対的に適合する可能性がある」と述べていましたが、今後は両者の利点を統合し、多様な習熟度・SRLの学習者に対応可能なフィードバックを設計することが重要だと考えます。特に、SRL意識・方略をより効果的に促進するための足場かけとなるようなフィードバックを設計をしていきたいと考えています。
文責: 田中早代




