九州大学 山田研究室

音声認識技術が「語彙力」と「発音能力」に与える影響についての論文を読みました

2023年05月29日

修士2年の平田です。
読んだ論文は、以下になります。

 

論文名:Look I can speak correctly learning vocabulary and pronunciation through websites equipped with automatic speech recognition technology
著者:Muzakki Bashori, Roeland van Hout, Helmer Strik and Catia Cucchiarini
発行年:2022
論文誌:Computer Assisted Language Learning (DOI: 10.1080/09588221.2022.2080230)

 

音声認識技術(Automatic Speech Recognition)を利用した英語学習ウェブサイトに関して、単語の意味と発音に対する学習効果を検証した論文になります。

語彙力と発音能力の不足は、スピーキングの向上を阻害することが分かっています。上記問題に対して、本研究ではILIとNOVOという、2種類の音声認識WEBアプリの効果が検証されました。
2つのアプリ内では、英単語の学習機能と単語の発音確認、音声認識よる評価機能があります。ILIは、発音に対するフィードバックとして、「素晴らしい」(正解の場合)と「もう一回発音しよう」(不正解の場合)の2つを表示するに対して、NOVOは、「発音が間違えている音素」を指摘し、「その音素の発音の仕方」を文章で解説するという、ILIよりも詳細な発音フィードバックを与えます。

146人を対象に、ILI群、NOVO群、統制群の3群実験が実施され、介入前後に語彙力と発音能力が計測されました。この研究では、語彙力を「認識」と「生成」の2側面に区別した上で、「認識語彙力」と「生成語彙力」、「発音能力」の3つのデータが収集されました。認識語彙とは、英単語からその意味を回答する語彙力であり、対して生成語彙は、意味から正しい英単語を回答する語彙力になります。一般的に、「認識語彙」よりも「生成語彙」の方が、難易度が高いとされています。
実験は2週間行われ、ILI群はILIを、NOVO群はNOVOを使って学習を行い、統制群は、学習時間が実験群と同じ分だけ与えられ、課題単語を学習しました。

実験の結果、WEBアプリを使用した実験群において、「認識語彙力」と「発音能力」が向上しました。
具体的には、単語の認識を計測するテストにおいて、ILI群とNOVO群は統制群よりも上回り、単語の生成に関しては、有意な群間差は示されませんでした。また、発音能力に関しては、発音得点の事前事後差分を分散分析した結果、実験群(ILI群とNOVO群)が統制群と比較して、有意に発音得点が高いことが示されました。一方で、ILI群とNOVO群の間には、有意な差は見られず、統制群は事後において有意に発音得点が向上しませんでした。

以上の結果を踏まえて、ILIとNOVOは「認識語彙」の向上に有効であると考えられます。一方で「生成語彙(=意味から英語を答える)」に関しては、郡間差が見られず、認識と比較して、単語の生成は難易度が高いと考えられます。また、発音能力に関して、ILI群とNOVO群が有意に向上したのに対して、統制群では発音能力が全く向上しませんでした。この理由として、統制群で行われた自主学習で、発音練習が不足していたことが考えられます。システムでは音声認識による発音評価環境によって、発音練習が促されたと考えらえます。

以上が論文の内容となります。
ここからはこの論文を読んだ私の感想について話したいと思います
この論文は、語彙力と発音能力の両方を計測している点で自分の研究と共通点があり、次の実験に向けて評価方法と分析方法を参考にしたいと思い選びました。

良いと思った点としては2点あります。
まず、この研究では先行研究に依拠した単語テスト設計により、「認識」と「生成」という2点の語彙力を区別してシステムの効果を検証しています。この点にオリジナリティがあるなと思いました。さらに、「生成」に関しては、「意味」と「発音」に分けて語彙力を計測しており、この評価方法を自分の研究でも実践したいと思いました。
2点目に、被験者数が146名と非常に多いため、この論文の結果は、信頼性があると考えられます。また、ILI群とNOVO群といった発音のフィードバック方法が異なる2つの実験群を設定していて、フィードバックの違いによる効果の差を検証している点も新奇性がありました。

一方で、疑問に感じた点もありました。
まず、ILIとNOVOについて、研究の目的である「語彙力」と「発音能力」にどのようにアプローチしているのかについて疑問が残りました。例えば、実験の結果から、本システムは認識語彙力の向上に有意性があることが示されていましたが、システムでは認識語彙力を支援する機能について説明が無いので、なぜ語彙力が向上したのかが分かりません。また、システムに関する説明を読む限り、語彙の生成を支援する機能は無いように感じます。
さらに、発音能力に関して、NOVO群の方がILI群よりも、詳細な発音のフィードバックを提供しているのにもかかわらず、有意に発音能力が向上しませんでした。この点についても疑問に感じました。

実験での結果とシステムの設計・機能に絡めた考察があれば、この論文はさらに興味深いものなると思います。
自分の研究でも、学習効果に対して、どういった理論・機能・設計による効果なのかをしっかり議論できるようにしたいと思います。

PAGE TOP