1. 引言
1.1. 研究背景
在当今全球高等教育数字化转型的浪潮中,信息技术与教育教学的深度融合已成为时代趋势。对于通过培养高素质应用型人才服务区域经济发展的应用型高校而言,这一转型尤为关键。大学英语作为通识教育的核心课程,其教学质量直接关系到学生跨文化交际能力与国际化视野的构建。其中,英语写作能力不仅是语言综合应用水平的集中体现,更是学生未来在职场中撰写商务函件、技术报告及学术文档的基础能力。
然而,长期以来,应用型高校的英语写作教学面临着严峻的现实困境。随着高等教育大众化的推进,应用型高校普遍面临师生比失衡的问题,大班授课成为常态。在传统的教学模式下,一名英语教师往往需要承担数个班级、近百名学生的教学任务。这种高强度的教学负荷导致教师难以对每一篇学生作文进行细致、及时的批改与反馈。研究表明,写作反馈的滞后性严重削弱了教学效果——当学生在提交作文两周甚至更久之后才收到反馈时,其写作时的思维逻辑与语言语境已基本遗忘,反馈的修正与强化功能也大打折扣。此外,传统的人工批改往往侧重于词汇和语法的纠错,难以在语篇结构、逻辑连贯性及内容深度上提供个性化的指导,导致学生陷入“写多错多、越写越怕”的恶性循环,严重挫伤了学习积极性。
在此背景下,以iWrite (爱写作)英语写作教学与评阅系统为代表的智能化教学平台应运而生。iWrite平台由外语教学与研究出版社与北京外国语大学中国外语测评中心共同研发,依托强大的语料库资源与先进的自然语言处理技术,能够从语言、内容、篇章结构及技术规范四个维度为学生提供即时的智能评阅与反馈。对于应用型高校而言,iWrite不仅是一个技术工具,更是一种能够重构写作教学生态的可能性方案。通过“人机协同”的模式,iWrite平台能够解决传统教学中反馈不及时、评价标准不统一、训练量不足等痛点,从而为应用型人才的语言能力培养提供新的路径。
1.2. 应用型高校英语写作教学现状
应用型高校的学生群体往往具备较强的实践动手能力,但英语基础相对薄弱,尤其是语法知识体系不够牢固,词汇量匮乏。在英语写作中,普遍存在中式表达、逻辑混乱、语篇衔接生硬等问题。当前,受制于合班教学、学习动力、教学资源等因素的限制,在应用型高校英语写作教学中,教师无法做到全批全改,多采用抽查或仅给分数的粗放式评价,学生缺乏针对性的修改建议,难以通过写作实践实现语言能力的内化。在缺乏即时激励的环境下,学生将写作视为应付考试的枯燥任务,缺乏反复修改、打磨文章的主动性。此外,应用型高校往往缺乏针对专业英语写作的足够师资与资源,通识英语教师难以兼顾不同专业背景下的写作规范指导。
2. 文献综述
2.1. 英语写作教学的理论图景与现实挑战
作为二语习得中最复杂的认知活动之一,英语写作不仅涉及词汇、语法等语言知识的调用,还包含了构思、组织、监控与修改等高阶思维过程。在传统的结果导向法教学中,重点在于模仿范文和语法纠错,忽视了写作的认知过程。随后兴起的过程导向法虽然强调了构思与修改的重要性,但在大班教学环境下,教师难以全程监控并指导每个学生的写作过程。对于应用型高校而言,挑战更为具体,现有的教学资源配置难以支撑高频率、高质量的写作训练,学生普遍面临输入匮乏与输出焦虑的双重困境。
2.2. 技术赋能语言学习
计算机辅助语言学习(CALL)经历了从行为主义模式到交际模式,再到如今的整合模式的演变。作为CALL的重要分支,自动写作评价技术的发展尤为迅速。早期的自动写作评价系统如美国的PEG主要基于表层语言特征进行评分,常被诟病忽略内容质量。后来出现的Criterion和MyAccess引入了自然语言处理技术,开始关注篇章结构。
近年来,随着深度学习与大数据技术的发展,自动写作评价系统进入了智能化新阶段。自动写作评价工具不仅能减轻教师负担,还能通过即时反馈促进学生的注意机制。Swain的输出假设认为,学习者在产出语言时会注意到自己想表达的内容与现有语言能力之间的差距,这种认知冲突是语言习得的关键动力[1]。自动写作评价系统通过高亮错误和提供建议,即时触发了这一机制,促使学生进行假设检验和元语言反思[2]。
2.3. iWrite平台
iWrite平台是我国本土化自动写作评价系统的代表,其核心优势在于针对中国英语学习者的语言特征进行了算法优化。目前学界关于iWrite的研究主要集中在评分信度、反馈有效性及教学模式重构三个方面。在评分信度方面,有实证研究表明,iWrite平台在语言、词汇和篇章结构等显性维度上的评分与人工评分具有高度一致性,但在内容相关性和思想深度的判别上仍存在局限[3]。在一项针对国内外25项实证研究的元分析显示,自动写作评价系统对学生写作质量的提升具有中等效应,且反馈效果受干预次数和平台类型的显著影响[4]。在具体纠错效能上,有研究通过对比56篇作文的修改痕迹发现,iWrite在识别主谓一致、非谓语动词、名词单复数及冠词错误方面准确率最高,学生对这些表层错误的采纳率也最高,但在处理复杂的句法逻辑时仍需人工干预[5]。
随着研究深入,相关研究开始关注不同反馈来源对不同群体的影响差异。有研究揭示了英语写作自动反馈的群体差异,自动反馈对英语专业学生的写作效应更显著,而对于非英语专业学生而言,“同伴 + 教师”或“系统 + 教师”的混合反馈效果更佳[6]。这可能是因为非英语专业学生元认知能力较弱,难以独立消化机器生成的抽象评价。针对这一现象,有学者在英语专业学术写作中探索了“AWE + 教师 + 同伴”的线上多元反馈模式,发现该模式能促进写作表现,但学生对不同来源反馈的吸收程度存在显著差异[7]。
综上所述,现有研究虽然证实了iWrite在辅助纠错方面的有效性,但仍存在有待挖掘的领域。多数研究聚焦于英语专业或研究型大学学生,针对应用型高校非英语专业学生的研究相对匮乏。这部分学生英语基础薄弱,对“人机协同”中教师指导的依赖度更高。现有研究多关注总体分数或语法准确性,缺乏对词汇复杂度、句法成熟度等微观能力维度的细致考察。虽然有学者提出混合反馈对非专业学生更有效,但针对应用型高校大班授课背景下,如何构建可操作的“iWrite智能反馈 + 教师精准指导”模式,仍需实证数据的支撑。基于此,本研究主要聚焦应用型高校情境,探究iWrite平台介入下的人机协同模式对学生多维度写作能力的提升效果。
3. 研究方法
3.1. 研究对象
本研究选取了中国江苏某省属应用型本科高校的大学二年级学生作为研究对象。为了控制变量,研究采用了整群抽样法,选取了两个教学班,共计124名学生。实验组(iWrite组)有62人,来自土木工程专业,男生38人,女生24人。控制组(传统组)有62人,来自土木工程专业,男生40人,女生22人。所有学生均已通过大学英语四级考试,英语水平处于中等偏下区间,符合应用型高校学生的特征。两个班级由同一位英语教师授课,确保教学风格和进度一致。前测数据表明,两组学生在英语写作起始水平上无显著差异(p > 0.05)。参与者平均年龄为20.5岁,英语学习年限平均为9.5年。大多数学生表示在大学之前的英语写作训练主要为了应试,缺乏系统的写作指导。
3.2. 研究设计
本研究采用准实验设计,具体为前后测控制组设计,辅以个案文本分析的混合研究方法。
3.2.1. 实验分组与干预
为了确保实验的内部效度,本研究严格控制了教师的教学投入变量。两组学生均由同一位英语教师授课,教学大纲、教学进度及课堂讲评时长(均为每次作文课45分钟)完全一致。
实验组采用“iWrite智能反馈驱动的精准指导”模式,具体实施流程为:1) 学生在iWrite平台上完成初稿,平台即时提供包含语法、拼写及搭配错误的纠错报告。学生需根据反馈自主进行至少两轮修改,直至分数达到预期。2) 教师不进行全员逐字批改,而是利用iWrite后台记录的写作过程数据,包括分析共性错误分布和客观特征统计。教师将原本用于人工批改的时间转化为数据分析与典型案例筛选。3) 在课堂讲评环节,教师依据平台数据展示“错误云图”和“优秀句式榜单”,针对全班共性的句法逻辑问题进行集中解析,并选取典型样本进行改写示范。
控制组采用“纸笔写作 + 教师人工全批全改”模式。具体实施流程为:1) 学生课后完成纸质作文。2) 教师投入与实验组备课等量的时间,对每一份作文进行人工纠错、评分并书写评语。3) 在课堂讲评环节,教师主要依据批改时的主观印象和个人记录,选取部分典型习作进行朗读或板书讲解。
3.2.2. 持续时间与频率
实验持续一个完整的学期(12周)。期间共进行6次写作任务训练,频率为每两周一次。每次写作任务要求字数不低于200词,体裁涵盖应用文、议论文和说明文,紧扣大学英语六级考试及现实场景的英语需求。
3.3. 数据收集
在实验开始前和结束后,分别进行一次限时写作测试。题目选自历年CET-6真题,采用iWrite智能评分与两名资深教师人工评分相结合的方式。人工评分依据CET-6作文评分标准,从内容切题性、语言准确性、连贯性与词汇丰富度四个维度打分。最终成绩取三者(iWrite、教师A、教师B)的平均值,以确保评分的客观性与信度。利用iWrite平台内置客观特征统计提取学生作文的文本特征数据,包括词汇统计、词汇难度、句子分析以及可读性四个维度。
4. 研究结果
本研究利用SPSS 26.0软件对实验数据进行了描述性统计分析与推断性统计分析,结果主要分为总体写作成绩变化和基于iWrite平台内置特征的写作能力多维度分析两个部分。
4.1. 总体写作成绩变化
为了检验iWrite平台对于学生写作能力的提升,研究首先对实验组(iWrite组,N = 62)与控制组(传统组,N = 62)的写作总体评分进行了对比。评分采用百分制,取智能评分与两名人工评分的平均值。
4.1.1. 实验前水平差异
检验独立样本t检验结果显示,实验前两组学生的英语写作水平无显著差异。实验组的前测平均分为71.52分(SD = 6.84),控制组为72.10分(SD = 6.55)。统计结果表明两组处于同一基线水平(t = −0.482, p = 0.631 > 0.05),满足实验研究的同质性要求。
4.1.2. 实验后总体成绩对比
经过12周的教学实验,两组学生的写作成绩均有所提升,但幅度不同。独立样本t检验显示,实验组的后测平均分达到78.45分(SD = 5.92),显著高于控制组的74.20分(SD = 6.15),差异具有统计学意义(t = 3.91, p < 0.001)。配对样本t检验进一步证实,实验组组内前后测成绩提升显著(t = 8.12, p < 0.001),且效应量大于控制组。这一结果表明,基于iWrite平台的人机协同反馈模式能有效促进应用型高校学生写作总体水平的提升。
4.2. 写作能力维度分析
为探究学生写作能力提升的具体路径,本研究提取了iWrite平台生成的文本客观特征数据,从词汇、句法及可读性三个维度进行了深度分析。
4.2.1. 词汇统计与难度
词汇是衡量二语写作质量的基础指标。实验后两组在词汇关键指标上的差异如表1所示。
Table 1. Post-experiment comparison of vocabulary metrics between the two groups
表1. 实验后两组词汇指标对比
指标(Metric) |
实验组(Mean ± SD) |
控制组(Mean ± SD) |
t值 |
p值 |
Tokens (总词数) |
358.42 ± 75.20 |
315.12 ± 81.33 |
3.08 |
0.003 |
Types (不同词数) |
218.65 ± 38.40 |
192.30 ± 42.15 |
3.64 |
<0.001 |
TTR (类符/形符比) |
0.67 ± 0.07 |
0.63 ± 0.08 |
2.95 |
0.004 |
Academic Words (%) |
10.85% ± 3.55% |
8.12% ± 3.90% |
4.02 |
<0.001 |
Active Words (%) |
69.50% ± 6.80% |
65.85% ± 7.25% |
2.89 |
0.005 |
数据显示,实验组在Tokens (总词数)和Types (不同词数)上均显著高于控制组,表明iWrite平台的使用与学生写作产出量的增加呈正相关。更为重要的是,代表词汇丰富度的TTR (类符/形符比)也呈现显著优势,说明学生并非单纯重复简单词汇。在词汇难度方面,实验组的学术词汇占比提升至10.85%,显著高于控制组的8.12%及实验前的平均水平(约8.0%)。同时,实验组的积极词汇占比也有所提高,反映出学生正逐渐从使用基础词汇向使用更精准、更学术的词汇过渡。
4.2.2. 句子分析
句法复杂度和篇章长度反映了学生构建复杂思想的能力。统计结果表明(见表2),实验组在句法维度上的表现优于控制组。
Table 2. Post-experiment comparison of sentence analysis metrics between the two groups
表2. 实验后两组句子分析指标对比
指标(Metric) |
实验组(Mean ± SD) |
控制组(Mean ± SD) |
t值 |
p值 |
Avg Sent Len (平均句长) |
22.15 ± 4.10 |
19.35 ± 3.85 |
3.92 |
<0.001 |
Clauses (从句数量) |
11.50 ± 4.20 |
9.25 ± 4.50 |
2.88 |
0.005 |
Syntactic Complexity |
1.78 ± 0.85 |
1.35 ± 0.98 |
2.61 |
0.010 |
Avg Para Len (平均段长) |
4.25 ± 1.80 |
3.75 ± 1.90 |
1.50 |
0.136 |
实验组的平均句长达到22.15词,长于控制组的19.35词。这种增长主要源于句法结构的扩展,具体表现为从句数量的显著增加以及句法复杂度分值的提升。数据表明,iWrite提供的句法纠错反馈降低了学生使用长难句时的心理负担,鼓励他们在写作中尝试定语从句、状语从句等复杂结构,从而改善了语篇的逻辑严密性。
4.2.3. 文本可读性
在可读性指标上,实验组的年级等级从前测的12.2上升至13.45,高于控制组的12.30 (p < 0.05)。这表明实验组学生的作文语言水平已接近更高年级或受过良好教育读者的阅读标准,符合大学英语六级及学术写作的要求,而阅读易读性数值略有下降,从约39降至35左右,这一变化与词汇难度增加和句法复杂化呈正相关,也从侧面印证了写作深度的提升。
4.3. 学生修改行为的个案分析
为了进一步探究“人机协同”模式在微观层面如何促进学生的语言习得,本研究选取了实验组学生的写作样本The advantages of university graduates working in small towns进行定性分析。该生作文在iWrite平台经历了从初稿(V1)到终稿(V7)的迭代,机评成绩由78.5分提升至88.2分。通过对比初稿与终稿的文本特征(见表3),可以清晰地观察到学生在词汇精准度与句法成熟度上的进步。
Table 3. Comparison of the first draft and the final version in a typical case
表3. 典型个案初稿与定稿修改对比分析
修订层级 |
错误类型 |
初稿 |
终稿 |
分析 |
表层纠错 |
拼写错误 |
…in large morden cities.. |
…in large modern cities… |
平台精准识别拼写错误,
扫清初级错误 |
主谓一致 |
…graduates… has advantages… |
…graduates… have advantages… |
修正了基础语法错误,
确保了语言的准确性。 |
深层优化 |
词汇升级 |
…choosing to work in small towns is easier for graduates to feel felicity. |
…working in small towns can lead to a greater sense of satisfaction and well being. |
初稿中的“felicity”虽为高级词汇
但语体生硬。在平台反馈和教师引导下,学生将其替换为更符合学术语境的“satisfaction and well being”,
展现了一定的语体意识。 |
句法修正 |
College graduates return to small towns can make the town more dynamic…, boosting… andnarrow the gap… |
College graduates returning to small towns can make the town more dynamic…, boosting… andnarrowing the gap… |
初稿存在典型的谓语动词混用和
并列结构失衡。终稿正确使用了
非谓语动词来构建复杂的修饰成分,句法结构更加严谨。 |
逻辑重构 |
People are lived to feel good about life instead of competing with others all the time. |
This gives them the opportunity to relax and focus on personal fulfillment, rather than constantly competing with others. |
初稿受母语思维干扰出现了
“People are lived”的中式表达。
终稿不仅修正了语法,更通过使用“This gives them…”建立了句间
逻辑衔接,提升了语篇的连贯性。 |
该生的修改轨迹体现了iWrite平台介入后的学习路径。在第一阶段,平台自动识别并提示了显性错误,如拼写错误(“morden”改为“modern”)和基础语法错误(如主谓一致“has advantages”改为“have advantages”),这在一定程度上降低了学生的认知负荷。在第二阶段,解决了表层错误后,学生将注意力转移到了意义的表达上。如表3所示,终稿中并未止步于纠错,而是对“People are lived to…”这样的句子进行了彻底的重写与润色。这种从“纠错”向“优化”的转变,正是“人机协同”教学模式的核心所在,也就是技术工具通过即时反馈提供了语言形式的脚手架,从而赋能学生去追求更高阶的语言复杂性和思想深度。
5. 讨论
本研究通过对比实验,证实了基于iWrite平台的教学模式能够提升应用型高校学生的英语写作能力。基于第四部分的数据结果,本章从总体质量提升机制、语言特征演变及其对应用型人才培养的启示三个维度展开讨论。
5.1. 即时反馈对写作质量的驱动作用
研究结果显示,实验组在后测中的总体成绩显著高于控制组(p < 0.001)。在传统教学中,反馈周期的延迟往往导致学生错失最佳的纠错窗口。在本研究中,iWrite平台提供的即时反馈充当了“脚手架”的角色。iWrite的高亮纠错功能即时触发了学生的注意机制,促使他们在提交终稿前进行了至少两次的自我修正。这种“尝试、反馈、再尝试”的迭代过程,将写作从单一的测试行为转变为动态的认知构建过程,从而对文章的准确性和连贯性产生了积极影响。此外,实验组词汇量和篇幅的增加,也印证了技术工具降低了学生的输出焦虑。对于基础薄弱的应用型高校学生而言,机器评分的非惩罚性特征营造了一个低情感过滤的写作环境,鼓励他们敢于写得更多、写得更长。
5.2. 智能化反馈对语言复杂度的影响
本研究在语言特征上的发现,结合实验组在学术词汇占比和句法复杂度上的优势,反映了iWrite平台对学生中介语发展的具体影响路径。第一,学生语言向学术英语转变。数据表明,实验组的学术词汇占比提升,且积极词汇的使用率得到提高。这主要得益于iWrite的同义词推荐和搭配建议功能。应用型高校学生往往受限于词汇匮乏,习惯使用“good”,“think”等通用词。平台提供的进阶词汇选项,不仅扩充了学生的词汇储备,更在潜移默化中培养了语体意识,使其写作风格更符合大学英语六级及未来职场环境中写作的正式性要求。第二,句法结构得到优化。在传统写作中,学生为避免犯错,倾向于使用简单句。然而,iWrite对语法错误的精准捕捉,充当了语法安全网。这种安全感鼓励学生跳出舒适区,尝试使用定语从句、分词状语等复杂句式来承载更密集的逻辑信息。
6. 结论
6.1. 研究总结
本研究聚焦于应用型高校英语写作教学的现实困境,通过为期12周的准实验研究,实证考察了“iWrite平台辅助 + 教师指导”的人机协同教学模式对学生英语写作能力的影响。研究表明,人机协同模式能够提升学生的写作成绩。实验数据显示,相较于传统的“纸笔写作 + 教师批改”模式,基于iWrite平台的教学干预能提高学生的后测成绩。iWrite平台的即时反馈机制有效缩短了从产出到修正的认知周期,帮助学生克服了写作焦虑。此外,智能化反馈能够促进语言特征的多维优化。通过对文本客观特征的深度分析发现,该模式不仅增加了学生的词汇产出量和丰富度,更关键的是在一定程度上优化了学术词汇占比和句法复杂度。这表明,在技术的辅助下,应用型高校学生能够突破“生存英语”的桎梏,尝试使用更复杂的语言结构来表达思想,实现了从基础表达向学术书面表达的转变。
6.2. 教学启示
基于上述发现,本研究对应用型高校的英语写作教学具有一定的借鉴意义。应用型高校可以推广“人机协同”的混合式评价体系,利用智能技术的规模化优势,解决反馈缺失问题。另外,教师可以利用iWrite等数字化平台提供的数据,定位学生在词汇运用或句法结构上的共性短板,在课堂上进行针对性的强化训练,实现从经验教学向证据教学的转变。需要强调的是,在引入技术的同时,教师需引导学生正确看待智能评分,明确机器评分在语篇逻辑和文化内涵判断上的局限性,避免学生产生“唯分数论”或为了迎合机器算法而堆砌辞藻的倾向。
6.3. 局限与展望
尽管本研究取得了一定的成果,但仍存在局限。本研究仅选取了江苏某省属应用型高校的两个班级作为样本,样本数量和专业背景相对单一,结论的普适性有待在更多学科背景和不同层次的高校中进一步验证。另外,12周的教学干预虽然显示出即时效果,但学生写作能力的提升是否具有长期保持效应,尚需通过延时后测来考察。本研究主要侧重于客观文本特征的量化分析,未来研究可结合深度访谈、问卷调查等质性研究方法,探究学生在使用智能平台时的心理认知过程及情感态度的变化。
基金项目
基金项目江苏高校外语教育“高质量发展背景下外语教学改革”研究课题(项目编号:2024WYJG069);江苏省高等教育外语教学研究会“人工智能时代高等教育数字创新”研究项目(项目编号:JSJG2023-004)。