1. 引言
1.1. 研究背景
近年来,英语口语在大学生群体中所受关注日益增长。无论是因为出国深造、考研面试,还是因为专业需求,如何掌握良好的英语口语能力成了众多大学生亟待解决的难题。对于大学生来说,和真人外教进行对话是一种常见的口语习得方式,但是这一过程通常伴随着比较高昂的学习费用,一定程度上并不能满足所有大学生的需要。在目前AIGC迅速发展的时代背景下,部分软件开发者发现了这一痛点,推动了大量AI口语陪练软件问世,为大学生的英语口语学习提供了更加实惠、便捷的途径。
然而,在调研了市场上具有代表性的几款AI口语陪练软件、体验了线上真人外教口语课之后,研究小组将两者的学习体验进行对比,发现在带动大学生学习情绪方面,AI口语陪练软件尚无法达到和真人外教一样的效果。面对真人外教时,大学生会有更加强烈的学习和沟通兴趣。研究小组决定基于真人外教和AI口语陪练软件学习体验的比较分析,对大学生的英语口语学习动机进行研究和探讨。
1.2. 研究问题
在探讨AI口语学习软件与真人外教之间的差异以及如何利用最新技术缩小这些差异的过程中,本研究试图回答以下几个核心研究问题:
1) AI口语学习软件与真人外教之间存在哪些主要差距?
此问题旨在深入了解AI口语学习软件在模拟真人教学效果(如互动性、反馈质量和教学个性化)方面的具体不足。
2) 目前的AI技术,特别是大模型技术和AI生成内容(AIGC),在教育领域尤其是英语口语学习方面,能够提供哪些新的可能性?
通过回答这个问题,研究将探索现有的AI技术如何改善口语学习软件的教学效果,以及这些技术在教学中的具体应用案例。
3) 以前因技术限制而未被应用于英语口语教学的理论和方法,目前哪一些可以通过AI技术得到实现?
该问题着眼于识别过去由于技术限制而未能实现的教学策略或功能,探索如何通过最新的AI技术克服这些限制。
1.3. 研究意义
通过对研究问题的探讨,本研究旨在从理论上丰富AI在语言教育领域的应用研究,同时在实践层面为AI口语学习软件的开发和优化提供具体的策略和方向,为基于大模型的口语陪练产品提供策略支持。一是从用户价值视角,提高大学生用户的使用体验和学习效果,二是从商业价值视角,提升用户留存率以及用户粘性,并反作用于用户价值,形成商业飞轮。
2. 动机理论
自二十世纪五六十年代起,许多从事外语教学方面的教师和相关学者开始研究情感因素对第二语言习得的影响。在影响二语习得的诸多情感因素中。学习动机无疑是十分重要的一个方面。以加拿大学者Gardner为代表的许多相关研究人员都对二语习得中的动机因素作过比较系统的分类和研究 [1] 。在Gardner的动机理论中,学习动机分为整合性动机(integrative motivation)和工具性动机(instrument motivation)。整合型动机是指学习者对目的语社团有真正的兴趣,希望能够使用目的语同目的语社团交流,渴望参与目的语社团的社会活动,甚至融入到目的语社团的文化之中。而工具型动机是指学习者为了某一特殊的目的,如通过某种考试、找份好工作、获取某一职位、取得某种资格、获取目的语国家的某方面的信息等而去学习目的语 [2] 。从研究小组视角来看,工具型动机这类依赖于考试、深造、职业要求等客观压力的动机是因人而异的,非人为能够影响和掌控,故此次研究不讨论这一类型的动机点。小组主要分析整合型动机在英语口语学习中的影响和作用,研究如何维持或提高学习者的整合型动机以及其对英语口语的学习兴趣。
3. 研究方法
3.1. 漏斗原理
本研究采用漏斗原理作为指导思想,旨在从宏观的市场调研入手,将研究问题逐步细化到能够通过技术手段进行解决,并提出相应的技术实现思路。这种方法类似于漏斗的形状,从宽广的入口开始,通过层层筛选和聚焦,最终达到狭窄的出口,即找到可行的技术解决方案。以下是研究步骤的详细介绍。
步骤一:市场调研与分析。
首先,研究团队对现有的真人外语陪练服务和AI陪练应用程序进行了广泛的产品调研。通过调研,我们了解到市场上各类产品的能力和服务范围,深入分析了AI陪练应用与真人外教陪练在功能和效果上的差异。这一阶段的目的是识别市场上存在的空白和提升的空间,为后续的研究指明方向。
步骤二:动机与心理因素研究。
本研究聚焦于口语对话能力提升和学习动机的激发,探索促进语言学习的关键动机和心理因素。通过调查研究和理论分析,我们确定了能够在AI口语陪练产品中实施的功能点,这些功能点旨在满足用户的内在需求,从而提升学习效率和用户体验。
步骤三:技术实现与合作。
在明确了AI口语陪练产品中可以实现的功能点后,研究团队与技术部门紧密合作,探讨这些功能点的技术可行性。在这一阶段,我们不仅关注功能的实现,还注重用户交互和体验,确保所开发的解决方案既能合理运用现有技术,又易于用户接受和使用。
通过这种层层递进的研究方法,我们能够系统地识别并解决AI口语陪练产品开发中的关键问题,从而推动产品的创新和优化。漏斗原理不仅帮助我们聚焦于最终的技术解决方案,还确保了研究过程的系统性和全面性。
3.2. 产品调研方法
小组的成员分为三组,分别调研了大模型AI口语工具、小模型AI口语应用和真人在线外教APP等共计十余种软件,每组成员都会参与到三种类型软件的测评中并给出学习体验、优缺点分析以及改进意见。调研结束后,小组开会讨论并将所调研的软件存在的优缺点进行了整合,最终得出调研结论。
3.3. 大学生学习动机的调研方法
关于大学生英语口语学习动机这一核心研究课题,小组采用的是内部调研和文献查阅相结合的方法。一方面,本小组人员结构均为大学生,在口语陪练产品对于大学生口语学习的影响方面,小组收集到的结论具有一定的可参考性。另一方面,我们设置了三个调研小组,在调研结束后将三组结论进行对比整合也增加了研究的可信度。此外,通过查阅前人的文章和期刊,小组也获得了一些关于学习动机的理论支撑和指导。
4. 产品调研与分析
在本项研究中,我们调研了十余种AI软件,以下是部分调研产品的结果,见表1:
Table 1. Part of research product table
表1. 部分调研产品表
如表2,在本项研究中,我们细致选取了数款代表性强的AI口语学习软件进行深入分析,旨在揭示这类软件在模仿及逼近真人外教教学效果方面的显著特性与存在的问题。首先,我们专注于市场份额较大且用户反响积极的“流利说”AI英语口语课程。该软件利用独家研发的语音识别技术和人工智能算法,实现对用户发音错误的即时纠正,并依据个人能力水平定制学习路径。根据最新的统计数据,截至2021年底,“流利说”注册用户数已超过一亿。然而,根据用户反馈显示,该软件在处理复杂对话情境理解及情感交流方面,仍难以与真人外教相媲美。
本研究还考察了全球知名的Duolingo English Test (DET)及其附属的口语练习模块。该模块采用深度学习模型来模拟真实口语对话场景。尽管DET已被全球众多高等教育机构认可为英语能力测试的标准之一,部分用户报告其在即时反馈和个性化教学方面存在局限,特别是在理解非标准口音和方言的能力上,与真人外教相比,存在显著不足。
此外,我们还关注到一款以“一对一AI模拟实战”为主打的口语学习软件——Rosetta Stone。通过训练海量语料库构建的人工智能模型,该软件能够模拟各类生活、商务等真实对话场景。然而,尽管其提供了高度仿真的互动体验,但仍难以复现真人外教提供的即时、灵活、针对性的教学指导,特别是在文化背景阐释和语言习俗教授方面,AI的功能尚不能完全取代人类教师。
Table 2. Typical research product table
表2. 调研典型产品表
在AI口语陪练领域,目前大模型AI口语工具就整体来看胜过小模型软件。大模型AI口语陪练基本都能实现主题对话、实时翻译、在线测评等功能,可以让学生认识到自身口语发音、用词、造句等方面存在哪些提升空间。而小模型产品相对来说功能更简单,本研究调研的小模型软件之中有些甚至只提供课程,而不具备实时对话功能。但是小组发现小模型口语工具在口语入门方面可以提供更为基础的课程或训练,辅助大模型口语工具的使用。
至于真人外教课,小组在真人外教APP上进行了约课,通过远程的方式进行真人外教课的体验和反馈。目前这种线上外教课程也是学生寻找外教的主流方式之一。在这类APP上可以进行外籍教师选择和预约上课,采用的远程面对面交流的方式打破了空间上的限制,不过线上外教课也存在时差、教师课程排期不够等缺点,容易出现时间上难以对齐的问题。
除去这两类口语陪练方式客观层面的优缺点分析,此次研究重点在于研究这两种不同口语陪练方式带给大学生用户主观学习体验的区别,以及对大学生学习动机的影响。经小组调研,真人外教相比于AI口语陪练软件更能调动大学生用户的学习兴趣和动力,并且这种影响不但体现在学习质量和效率的提高方面,还表现在持续推进口语学习的意愿方面。三个小组的调研成员一致认为真人外教带给人更加鲜活、灵动、开心的学习感受,而AI则稍显单调和沉闷,难以提供持续的学习激励作用。由此可见,AI口语陪练产品能否激发大学生学习动机是提高其教学质量和用户留存率的一大核心问题。
5. 学习动机的研究
本小组以Gardner的动机理论为依据,认为学习动机中的整合性动机是提高大学生学习兴趣的关键因素,整合性动机越强,那么学习效果就会越好。所以,如何提高大学生英语口语学习的整合型动机是本研究首要考虑的问题核心。基于组内调研结论和文献查阅,小组认为影响大学生口语学习动机的要点如下:
1) 肢体动作。面对面交流的三个主要要素是语言、声音和肢体动作,这三种因素在面对面交流中的影响比例是语言占7%、声音占38%、肢体语言55% [3] 。AI口语陪练可以设置虚拟口语陪练人物形象,在对话过程中辅以人类化的肢体动作和表情,提升学习者交流兴趣。
2) 口语陪练形式多样性。目前常见AI口语陪练就是大模型输出问题、体验者回答,单一的问答形式使得口语学习者容易感到枯燥和无聊。AI产品可以增加一些交流形式,例如辩论、访谈、歌曲等,并让体验者自行选择口语陪练形式,以此带给使用者更好的学习体验。
3) 提问中的文化背景知识输入。在提问时加一些前置拓展知识补充再进行提问,能有效增强体验者交流兴趣。AI口语产品可以设计提问的前置补充内容,给体验者带来知识输入,从而激发口语交流兴趣。
4) 口语强化功能。Krashen (1985)指出语言学习者需要接受适当超出学生水平的语言输入,也就是I + 1,才能进行语言习得。输入强化是由SharwoodSmith (1981)提出,在此基础上,Wynne Wong (2005)结合实践提出四种输入强化方法,分别为输入流、篇章强化、结构化输入和语法意识提升任务 [4] 。AI产品可以利用强大的数据库和螺旋式教学帮助学生更好地理解和巩固知识。
5) 适当情绪支持。AI缺乏真人外教在对话中提供给用户的情绪反馈,包括安慰和鼓励等,通过加强AI的情绪反馈,可以延长用户使用AI练习口语的意愿。例如,AI软件自动检索用户的回复中存在的负面情绪性词汇,如我不会、我很疑惑、我不清楚等词语,然后在接下来的提问中添加一些鼓励、表扬的话语进行情绪带动。
6) 讨论式教学。用户一对一口语练习容易产生紧张、不自在的情绪,影响学习体验感,可以效仿现代网络聊天社群的方式,为口语练习设置一个聊天室作为场所,在多人讨论中练习口语,营造一个自由交流的氛围。例如,设置模拟聊天室,内含角色包括主导话题的老师和其他AI学员,用户也是学员之一,可以积极和老师、其他学员讨论对话从而达到学习口语的目的。
7) 基于PBL教学法的产品设计 [5] 。以PBL教学法为基础,设计的英语口语学习产品,通过解决实际问题激发学生的学习兴趣和动机,提高口语交际技能。AI产品可以将PBL教学法纳入应用设计。
8) “以写促说”法的应用 [6] 。研究表明“以写促说”法在英语口语教学中的应用是有效的,通过写作活动能够有效促进学生口语表达能力的提升,增强语言输出能力和学习动机。
9) 情境体验模式 [7] 。情境体验模式在英语口语教学中十分有效,通过创造情境和情感体验,可以激发学生的学习兴趣,提升口语交际能力和学习动机。
10) TPRS教学法 [8] 。TPRS (Teaching Proficiency Through Reading and Storytelling)教学法在英语口语互动教学中,主要通过故事讲述和游戏互动,采用循环提问和可理解性输入的形式,向学习者传达目标语言,此方法可以显著提高学习动机和口语能力。
在对现有文献的深入研究与分析中,我们发现AI口语学习软件增强学习动机的策略大致可以归纳为三类:工具式、情景式和交互式。
工具式策略关注于利用具体的工具和方法来辅助语言学习,如移动学习应用(App)、“以写促说”法等。这些工具和方法通过提供便捷的学习资源和系统化的学习路径,帮助学习者有效组织和加强学习内容的吸收。工具式策略强调了技术手段在语言学习过程中的辅助作用,特别是在提升学习效率和促进学习自主性方面的潜力。
情景式策略着重于创造丰富多元的学习背景,以提升学习者的兴趣和参与度。这包括引入文化背景知识以拓展学习者的视野,采用口语强化技术以提高语言吸收率,以及提供形式多样的交流活动(如辩论、访谈、歌曲等),使学习过程更加生动有趣。情景式策略通过模拟真实生活场景,激发学习者的好奇心和探索欲,从而有效提升学习动力。
交互式策略则强调人机交互的质量和深度,旨在通过模拟真人交流的方式增强学习者的语言实践能力。具体来说,包括模拟肢体动作和表情来增强非语言沟通的学习,提供情绪支持以建立积极的学习态度,以及设置模拟聊天室等多人交互环境,以增加学习者的参与感和交流机会。交互式策略通过提高AI口语学习软件的人性化和互动性,促进学习者的语言输出和社交能力的发展。
通过对这些策略的分类与分析,我们得出一个重要发现:AI口语学习软件的最大潜能在于其能够综合情景式、交互式和工具式策略,创造一个全方位、多维度的学习环境。这不仅能够更全面地满足不同学习者的需求,也为AI口语学习软件的未来发展指明了方向,即通过综合应用多种策略来最大程度优化学习效果和用户体验。
6. 技术实现与功能建设
6.1. 技术背景
研究小组依据漏斗原理将可能影响大学生英语口语学习的11个动机点进行了筛选,如下图1所示,在共11个动机点中,可以迁移到口语场景中的有5个,最后技术可实现的仅为3个:口语陪练形式多样性、口语陪练提问中增加文化背景知识输入、提供情绪支持。这也反映了依据目前的技术,在众多可提高大学生学习动机的方法中,可以运用到AI口语陪练软件中的相对有限。
结合学习动机和现有技术,当前可充分支持实现的学习动机点如表3:
Table 3. Learning motivation points
表3. 学习动机要点
6.2. Prompt工程与自动化拼接
关于具体的技术实现方式,在prompt工程技术方面:
1) 精确的提示设计:根据所需的输出,设计提示语来指导AI输出特定的文化知识和提问。例如,“向学习者介绍感恩节的由来,并询问他们的国家有什么类似的节日和习俗。”
2) 输出格式设定:确保提示语包括了关于输出格式的指导,比如要求AI先给出一个简短的节日介绍,然后是一个开放式的问题。
3) 上下文融合:提示语应该能够使AI理解所讨论的文化背景,并在此基础上生成问题,而不是孤立无关的信息。
4) 迭代优化:根据学习者的反馈和AI的表现,不断优化提示语。例如,如果学习者对特定的问题反应不佳,可能需要调整问题的复杂度或是背景知识的深度。
5) 多样性和包容性:在设计提示语方面,鼓励AI在生成回复时尽可能具有多样性和包容性,确保提供的回答对所有学习者都是友好的。需要对各个prompt库进行拼接;保留用户字段和对话记忆字段的空缺,必要时再进行送参操作,如图2所示:
Figure 2. Prompt combination diagram
图2. Prompt组合示意图
prompt示例:
需要你和用户一起来聊聊一个美国的传统节日——感恩节。感恩节源于1621年,当时的新英格兰殖民者与美洲原住民共同庆祝丰收。这个节日是为了表达对大自然、亲人以及生活中一切美好事物的感激之情。在这一天,家家户户通常会围坐在一起享用丰盛的晚餐,包括烤火鸡、南瓜派和其他传统食物。人们也会通过参加感恩节游行、观看橄榄球比赛或一起看电影来庆祝这个节日。现在,你需要逐步引导用户回答相关的问题:在你的国家有没有类似的节日?如果有的话,它是怎样的呢?人们通常是如何庆祝的?你个人对这个节日有什么特别的感受或回忆吗?注意:不能一次性提问所有的。
6.3. 知识库建设
在知识库建设方面:
1) 知识库构建:首先需要建立一个涵盖不同国家和文化的节日及习俗的知识库。这个知识库可以包含节日的历史背景、庆祝方式、相关的食物、传统习惯等。
2) 文化背景知识输入:在进行口语练习之前,AI可以从知识库中提取相关的文化背景知识,例如介绍美国感恩节的历史和传统习俗。
3) 提问设计:设计相关的提问环节,这些问题可以是关于学习者所在国家的节日和习俗,或者要求比较不同国家的节日差异。
4) 前置拓展知识补充:AI在提问前,可以根据提取的知识库内容,给出一段简短的介绍,这不仅为学习者提供了一个答题的模板,也增加了学习者的知识储备。
6.4. 模型微调
在模型训练–微调(SFT)方面:
1) 定义问题:首先,需要明确希望AI能够回答的问题类型,以及这些问题的上下文信息。例如,如果你希望AI能够回答有关天气的问题,那么你可能需要提供的前置内容包括地理位置、日期和时间等。
2) 数据收集和处理:根据定义的问题,收集和处理相关的数据。这可能包括从各种来源收集数据,然后清洗、格式化和标注这些数据,使其适合用于训练AI。
3) 模型训练:使用处理过的数据来训练AI。这通常涉及到选择一个合适的基座大模型,然后使用数据来训练这个模型,使其能够在某些场景下,表现更加优异和妥帖。
4) 测试和优化:在模型训练完成后,需要进行测试以确保其性能满足要求。
6.5. 基于情绪识别的回复策略功能建设
Figure 3. Emotional feedback flow diagram
图3. 情绪反馈流程示意图
在回复策略方面:
1) 输入处理:读取用户的输入,并将其转化为可分析的格式,如分词或向量化。
2) 情绪分析:利用大模型本身具备的情绪分析能力(prompt工程),来判定用户输入的情绪倾向。
3) 策略选择:根据情绪分析的结果,选择一个相应的答复策略。
4) 个性化调整:根据用户历史数据和当前会话的上下文,个性化调整回复内容。
5) 输出生成:根据选定的策略,生成一个回复并输出给用户。
6) 反馈学习:收集用户对AI回复的反馈,以便持续优化策略。情绪反馈流程示意图如图3。
7. 研究总结
7.1. 研究限制
在本研究中,我们集中探讨了AI口语学习软件在对齐真人外教方面的现状、挑战与实现路径,尽管取得了诸多有价值的研究成果,但同时也存在一定的局限性和未来值得进一步探索的方向。
研究样本的代表性是本研究面临的一大挑战。由于受到时间和资源的限制,我们在选取AI口语学习软件和真人外教的教学案例时,虽已尽可能覆盖各类典型情境,但无法囊括市场上所有相关产品和服务,这可能会影响研究结论的普适性 [9] 。未来的研究可以尝试扩大样本容量,引入更多样化的教学环境与软件类型,以便更全面地揭示AI口语学习软件与真人外教在教学效果上的异同。
7.2. 研究发现
在全球化背景下,大学生英语口语的学习十分重要,以AIGC为背景,众多AI口语陪练软件应运而生。AI口语陪练软件以其实惠的价格、使用方便快捷等优点吸引了一批大学生用户,但是在其在学习体验方面相比真人外教仍然存在差距。查明导致这一差距的深层原因,并借鉴转化,运用到基于大模型的AI口语陪练软件中进行升级迭代是本研究的核心所在。依据Gardner的动机理论、漏斗原理,以及小组调研和文献资料的查证,本研究搜集11个有利于提高大学生英语口语学习动机的功能点,并逐个分析、筛选,最后得出3个技术可实现的功能点并提出了技术实现路径的具体思路,希望能为基于大模型的口语陪练产品提供技术策略支持。
基金项目
本论文文章由“中国矿业大学(北京)大学生创新训练项目资助(校级项目编号202308032)”和“中央高校基本科研业务费专项资金资助”资助。