1. 引言
英语写作教学是高中英语教学的重要组成部分,对高中生写作素养和英语素养的培养有着极其重要的作用。《普通高中英语课程标准》(2017) (下文简称《课标2017》)对高中生的英语写作能力提出了新要求:明确指出学生要能掌握记叙文的基本结构和续写他们所读的语篇[1]。近年来,越来越多的省份开始将读后续写纳入高考英语试题中,并且更加注重学生英语读写结合能力的培养。因此,作为读后续写重要载体的记叙文,应该受到高中英语教师的广泛关注。但在实际教学中,写作教学存在着师生两方面的困境。一方面,部分学生缺乏英语写作兴趣、写作过程无序化、语言知识匮乏、评价自己和他人习作水平的能力较弱、只关注教师评语和分数[2];另一方面,教师容易将写作教学功利化、重视句子的平面训练而忽视文章的内在一致性,注重结果而对写作过程指导不足,对写作重视程度不够,批改效率低,对评价多持负面情绪[3]。
同时,《课标2017》还指出,教师要处理好教、学、评的关系,将课堂评价活动贯穿于教学全过程。而在实际英语写作评价中,教师评阅反馈模式(教师批阅每一位学生的作文并给予反馈意见)一直占据主导地位,学生被动接受作文任务、完成写作、等待分数,对作文写作如何改进缺少思考,且评价结果大多数时候在课后以分数的形式呈现。以上要求和问题足以说明评价在英语写作教学中的重要程度和改进的迫切需要。本文提出在高中英语写作课堂中应用师生合作评价模式,原因有两点,一是师生合作评价的理念与课标的要求和理念相契合,都主张教学评一体化;二是当前英语写作教学存在的问题与师生合作评价模式所提供的解决方法相契合。最后,本文选取句酷批改网并将其融入师生合作评价体系之中,主要基于《课标2017》所倡导的理念,即积极将AI赋能应用于课堂教学实践,以切实提升师生合作评价效能,提高评价质量,实现教学目标。
2. 研究背景
就高中英语作文讲评教学现状对高中生做了问卷调查。该问卷收集了来自所任教学校班级的98位高中生的数据。如表1可知,本问卷的克隆巴赫Alpha系数为0.841,达到了信度检验的标准。由表2可知KMO值为0.805,表明所收集的数据比较适合因素分析,且Bartlett的球体检定p值为0.000,说明代表显著。以下选取了调查问卷的部分数据反馈。在回答问题15“老师会详细地标出我作文中出现的问题”时,62%的学生选择了“比较不同意”和“完全不同意”。在回答问题17“老师会再次对我修改过的作文进行评改”时,只有32%的学生选择了“比较同意”和“完全同意”,有15%的同学选择了“不清楚”,53%的学生选择了“比较不同意”和“完全不同意”。在回答问题19“我觉得教师的修改对提高我的写作能力帮助很大”时,14.2%和17.3%的同学选择了“完全同意”和“不同意”,有44.8%的学生选择了“比较不同意”和“完全不同意”。可见,教师对作文的批改和再批改投入的精力并不多,学生从教师批改中获益较少。
Table 1. Questionnaire reliability test
表1. 问卷信度检验
克隆巴赫Alpha |
基于标准化项的克隆巴赫Alpha |
项数 |
0.841 |
0.862 |
23 |
Table 2. Questionnaire validity test
表2. 问卷效度检验
KMO和巴特利特检验 |
KMO取样适切性量数 |
0.805 |
巴特利特球形度检验 |
近似卡方 |
1526.916 |
自由度 |
253 |
显著度 |
0.000 |
根据在学校的实习经历,再结合以上数据说明,由于教学任务繁重、学生学习主动性不高等原因,教师对作文评改的重视程度相对较低,作文训练的有效性不高,评价手段也只限于教师评改这一种,没有发挥学生作为评价主体的作用,也没有发挥评价的促学作用。为了改善这一写作现状,很多学者开展了围绕“同伴评价”“教师评价”“机器评价”“师生合作评价”等评价方式的有效性研究、对比研究以及实践研究,结果表明,这些评价方式各有优劣。比如,机器评价采用过于直接的纠错方式,容易让学习者产生依赖,不利于自主学习能力的提升[4],同伴评价较为复杂,操作时间长,从实践意义的角度来看缺乏实用性[5]。如何有效改进英语作文评价方法,提高英语写作教学的质量,是广大教师亟需探索的重要课题。基于以上高中英语写作及评讲教学现状,开展了英语作文讲评教学实践,把“师生合作评价”这一评价方式应用到日常写作教学中,探究如何在高中英语写作教学中构建有效的作文讲评模式。
3. 师生合作评价的内涵与有效性
师生合作评价,Teacher-Student Collaborative Assessment (下文简称TSCA),是由文秋芳教授(2016)在产出导向法的评价环节提出的一种新的评价形式,是为了解决产出导向法(下文简称POA)要求学生完成的产出任务频次高、类型多,而大学英语班级大,教师课程负担重,难以保证反馈及时有效的难题。关于师生合作评价的定义,文秋芳教授(2016)从评价主体、方式等各方面进行了详细的介绍。TSCA的评价对象是学生课外完成的产出任务,评价主体由学生、教师、机器自动评分系统构成;课内的评价方式是学生与学生、教师与学生的合作评价,课外还有学生自评、互评、机器自动评分等其他补充评价形式;评价内容以单元教学目标为参照点,既关注交际目标的实现质量,又考查学生在促成阶段所学的语言形式和话语结构的应用效果。孙曙光(2017)在此基础上归纳出,TSCA是指课前教师对典型样本进行详批,然后课内学生之间合作、教师与学生合作共同评价典型样本的评价方式[7]。总的来说,师生合作评价是一种由课前准备、课中实施、课后活动三个环节构成,以教师为主导、学生为主体,注重师生合作、生生合作、学生评价主体和写作过程的新型评价方式。
各位学者也致力于探索师生合作评价对学生能力提升的有效性。首先,“师生合作评价”能更显著地提高学生的英语写作水平、更有利于进行针对性训练、更能增加生生之间的互动[8]。其次,师生合作评价可促进教师自主、有效落实写作教学目标、提升学生自主学习意识、自我效能感和对评价反馈意见的吸收率[9]。最后,师生合作评价能有效提高高中生英语记叙文写作能力和写作兴趣,其中,对作文内容、语法和结构成绩的提升较大[10]。
以上证明了师生合作评价应用于英语写作记叙文写作教学中的有效性,但结合AI将师生合作评价应用于高中英语记叙文写作中的实践案例较少,结合AI技术的仅有一例,缺少针对记叙文展开研究的,因此,本文以此为研究焦点,旨在探究基于句酷批改网的师生合作评价对高中生英语记叙文写作能力的影响,对其词汇、语法、内容和结构的影响。
4. 基于句酷批改网的师生合作评价应用于高中英语记叙文写作中的实例分析
本研究在实验班开展了为期四轮的实验教学,这里主要选取第三轮的教学实践进行详细分析。本次写作任务选自期中测试的读后续写:科技(Face Time)如何改变我们的日常生活。续写材料主要讲述了纽约独居女子Kwapong与妹妹视频时中风,妹妹通过视频发现其面部异常、言语不清,坚持让其就医,最终Face Time技术救了她一命的事。此次的评价焦点是语法、结构和内容。
4.1. 课前准备
课前阶段,教师收集学生的答题卡并将其录入句酷批改网进行机器评阅。得出评改结果后,再结合本年级英语教师的打分和评价进行综合赋分,选出评价样本,并根据学生写作的优点和不足确定了此次的评价焦点聚焦于语法、结构和内容三个方面。最后,教师将评价样本按照授课班级的学生数量进行打印,并根据学生的错误设计了词汇辨析和宾语从句两类练习题。此次评价涉及内容的丰富与拓展,教师在上课之前还准备了参考范文和例句。
4.2. 课中评价
课中评价阶段又分为以下几个步骤。
首先,教师向学生简要阐述本节课的教学目标,对此次作文写作学生的发光点和进步进行表扬,提出存在的不足并引入到本次评价的焦点。
其次,教师将评价样本分发给学生,分析续写材料,开展师生合作评价。
活动一:学生两两合作,找出评价样本中存在的词汇和语法错误,如表3。针对学生未找出或未正确修改的语法错误,教师先定位,尝试引导学生自己发现和改正,最后才直接点出,并对相关语法点进行讲解。在修改了基础的语法错误后,呈现部分练习题,学生的答题正确率为百分之百。
Table 3. The lexical and grammatical errors in the sample text
表3. 评价样本中的词汇和语法错误
词汇和语法错误 |
学生找出并正确修改的 |
未找出的 |
未正确改正的 |
误用hang的过去时态 |
√ |
|
√ |
“Rush to”将to省略 |
|
|
|
Hospital拼写错误 |
√ |
|
|
Worried和Worriedly误用 |
√ |
|
|
Luck和Lucky词性用混 |
√ |
|
|
If条件句使用错误 |
|
√ |
√ |
部分动词时态不统一 |
√ |
|
|
A lot of 后面的可数名词未用复数 |
√ |
|
|
直接引语和间接引语使用不当 |
|
√ |
√ |
Not only...but also句式使用不当 |
√ |
|
|
How引导的句子在从句中仍使用疑问语序 |
|
√ |
√ |
活动二:四人小组讨论评价样本的结构和内容。在讨论前,教师组织学生复习了记叙文的六大要素:人物、时间、地点、事件、起因和结果。学生讨论后发现,在评价样本中,存在事件交代不清楚和过程描述缺乏逻辑性两大问题。就此,教师组织学生再次头脑风暴故事的事件和过程,并将小组讨论的想法写在样本的背面,为后续内容的更正和丰富打下基础。学生所讨论出的续写线索主要有两种。一种是紧急送医——医生诊断——本人感慨——科技作用——对比升华,另一种是紧急送医——诊断中风——恢复过程——对家人的感谢——感叹科技的重要性。
活动三:小组合作更正样本内容。由续写材料所给出的提示和第一段句首内容“Kwapong女士挂断了电话,然后拨打了紧急服务电话”可知,本段可描写Kwapong挂掉电话后拨打急救电话,救护车赶到送医,经检查确诊中风需住院,妹妹照顾她,医生称及时治疗救了她。由第二段句首内容“Kwapong女士自己也感到很幸运”。可知,本段可描写Kwapong自述幸运,强调网络和技术救了她,FaceTime不仅救命还让她继续生活,指出科技在日常生活中的帮助。根据学生之前讨论出的续写线索,将学生分为了两大组,每组各选择一种续写线索来丰富相关内容。讨论期间,学生要将大纲、要点和相关表达用英语写在纸上,教师来回巡逻提供帮助。最后,教师从两个大组里分别邀请了两个小组的发言人,来分享他们的续写大纲,这个过程可以让学生相互吸收彼此的观点,完善自己的写作大纲。
活动四:独立二次写作。学生根据总结出的大纲、要点和相关表达进行二次写作,并在下课的时候提交,教师将未做的练习题布置成家庭作业。
4.3. 课后再评价
在二次写作过后,教师将学生的作文再次录入句酷批改网,采用机器评阅和人工评阅相结合的方式进行了批改,发现大部分学生的作文,不仅内容丰富了很多,词汇和语法错误犯得也较少。批改完成后,教师选出比较优秀的作文在全班展示,并对二次写作进步显著的同学进行表扬。同时,对那些写作效果依旧不好的同学进行了谈话。
5. 实验成果
5.1. 作文成绩前后测分析
通过对采用教师评价的8班和采用师生合作评价6班学生的学期初和学期末作文成绩进行独立样本T检验分析可知以下信息。在表4和表5中,A指学期初作文成绩,B指学期末作文成绩。学期初6班写作得分平均值略高于8班,差距较小,期末6班平均值则显著高于8班,且两班级在各阶段成绩都存在一定个体差异。独立样本检验中,学期初写作得分的莱文方差等同性检验显示可假定方差相等,平均值等同性t检验表明两班级写作得分无显著差异,效应大小也几乎可忽略不计;而期末写作得分的莱文方差等同性检验同样可假定方差相等,平均值等同性t检验呈现出两班级写作得分存在显著差异,且效应量绝对值较大,说明6班成绩明显优于8班。此外,由表6可知,所有效应量都是负值,且绝对值都大于0.77 (Cohen’s d = −0.821)。根据Cohen的标准,|d| = 0.821远大于0.8,属于大效应量。所有效应量的95%置信区间都为负值且不包含0,这与t检验“存在极其显著差异”的结论一致,并且表明效应量显著不为0。以上结论表明,期末时,6班写作成绩显著高于8班(统计显著),并且这种差异具有很大的实际意义或实际影响力。综合分析,学期初两班写作成绩无显著差异,但期末6班成绩显著高于8班,这表明师生合作评价方式在提升学生写作成绩方面有积极效果。
Table 4. Statistical analysis of composition scores between the experimental class and the control class
表4. 实验班和对照班作文成绩组间统计
班级 |
个案数 |
平均值 |
标准差 |
标准误差平均值 |
A |
8 |
48 |
5.135 |
2.5490 |
0.3679 |
6 |
50 |
5.190 |
2.9947 |
0.4235 |
B |
8 |
48 |
6.896 |
2.1952 |
0.3168 |
6 |
50 |
8.830 |
2.5023 |
0.3539 |
Table 5. Independent sample T-test for composition scores of the experimental class and the control class
表5. 实验班和对照班作文成绩独立样本T检验
独立样本T检验 |
|
莱文方差等同性检验 |
平均值等同性t检验 |
F |
显著性 |
t |
自由度 |
显著性(双尾) |
平均值差值 |
标准误差差值 |
A |
假定等方差 |
1.543 |
0.217 |
−0.097 |
96 |
0.923 |
−0.0546 |
0.5629 |
不假定等方差 |
|
|
−0.097 |
94.659 |
0.923 |
−0.0546 |
0.5610 |
B |
假定等方差 |
0.523 |
0.471 |
−4.061 |
96 |
0.000 |
−1.9342 |
0.4763 |
不假定等方差 |
|
|
−4.072 |
95.241 |
0.000 |
−1.9342 |
0.4750 |
Table 6. Effect size for independent samples
表6. 独立样本效应大小
独立样本效应大小 |
|
标准化量 |
点估算 |
95%置信区间 |
下限 |
上限 |
学期初写作得分 |
Cohen d |
2.7854 |
−0.020 |
−0.416 |
0.377 |
Hedges修正 |
2.8074 |
−0.019 |
−0.412 |
0.374 |
Glass Delta |
2.9947 |
−0.018 |
−0.414 |
0.378 |
期末写作得分 |
Cohen d |
2.3569 |
−0.821 |
−1.231 |
−0.406 |
Hedges修正 |
2.3755 |
−0.814 |
−1.222 |
−0.403 |
Glass Delta |
2.5023 |
−0.773 |
−1.194 |
−0.345 |
5.2. 实验班作文各项成绩前后测分析
5.2.1. 实验班内容得分
从表7可以看出,实验结束后,学生英语写作的内容得分提高5.38,配对样本t检验结果显示,提高显著(Sig-0.000 < 0.05),说明师生合作评价可以有效提高学生英语叙事写作的内容得分。
Table 7. The score of content in experimental class
表7. 实验班内容得分
|
前测 |
后测 |
|
|
评价焦点 |
平均值 |
标准差 |
平均值 |
标准差 |
自由度 |
显著性(双尾) |
内容 |
5.18 |
2.647 |
10.56 |
2.517 |
49 |
0.000 |
5.2.2. 实验班词汇得分
从表8可以看出,实验结束后,学生英语写作的词汇平均分提高了3.56,配对样本t检验的结果表明,提高显著(Sig-0.000 < 0.05),说明师生合作评价可以有效提高学生英语叙事写作的词汇得分。
Table 8. The score of vocabulary in experimental class
表8. 实验班词汇得分
|
前测 |
后测 |
|
|
评价焦点 |
平均值 |
标准差 |
平均值 |
标准差 |
自由度 |
显著性(双尾) |
词汇 |
5.08 |
2.717 |
8.64 |
2.472 |
49 |
0.000 |
5.2.3. 实验班语法得分
从表9可以看出,实验结束后,学生英语写作的语法平均分提高了3.64,配对样本t检验的结果表明,提高显著(Sig-0.000 < 0.05),说明师生合作评价可以有效提高学生英语叙事写作的语法得分。
Table 9. The score of grammar in experimental class
表9. 实验班语法得分
|
前测 |
后测 |
|
|
评价焦点 |
平均值 |
标准差 |
平均值 |
标准差 |
自由度 |
显著性(双尾) |
语法 |
5.08 |
2.947 |
8.72 |
2.548 |
49 |
0.000 |
5.2.4. 实验班结构得分
从表10可以看出,实验结束后,学生英语写作的结构平均分提高了4.9,配对样本t检验的结果表明,提高显著(Sig-0.000 < 0.05),说明师生合作评价可以有效提高学生英语叙事写作的结构得分。
Table 10. The score of structure in experimental class
表10. 实验班结构得分
|
前测 |
后测 |
|
|
评价焦点 |
平均值 |
标准差 |
平均值 |
标准差 |
自由度 |
显著性(双尾) |
结构 |
6.96 |
3.123 |
11.86 |
2.928 |
49 |
0.000 |
通过以上分析可知,师生合作评价能从词汇、语法、内容和结构四个方面提升学生的写作成绩。其中,内容平均得分提高了5.38,词汇平均得分提高了3.56,语法平均得分提高了3.64,结构平均得分提高了4.9。可见,基于句酷批改网的师生合作评价对学生的内容平均得分提升作用最显著,其次是结构、语法和词汇。
6. 教学反思
结合在高中英语记叙文写作教学中应用师生合作评价的教学实践来看,该评价方式具有一定的积极作用——从前期检验结果来看,采用师生合作评价的班级在期末写作成绩上已显著优于采用传统教师评价的班级,这初步印证了其有效性,且可以推测,若能突破教学实验周期的限制,将其更持久地融入日常教学,效果可能更为明显;同时,句酷批改网的使用在一定程度上缓解了教学任务重带来的压力,提高了批改效率与质量。不过,实践中也暴露出诸多问题。第一,部分学生配合度不足、主观能动性欠缺(小组合作中有学生“搭便车”,不参与讨论过程,直接采用小组成员的成果)且学习态度不够端正,仍依赖死记硬背,导致写出的记叙文存在逻辑混乱、内容单薄、中式英语频发等问题。第二,学生整体英语基础较差,各科作业压力又使其难以投入足够时间高质量完成写作任务,对修改后的作文也缺乏重视。第三,教师教学任务重,在作文评讲上的时间投入有限,学生的写作训练次数也因此不足。第四,句酷批改网需要学生线上完成作文写作,这可能会导致学生从网上直接获取答案,导致作文价值缺失,且学生若不在线上操作,就需要教师手动录入,增加了教师的压力。这些因素共同制约了师生合作评价效能的充分发挥。综上,师生合作评价在高中英语记叙文写作教学中具有应用潜力,但需在延长应用周期的基础上,针对性地解决学生态度、能动性、时间分配及教师评讲与机器操作等问题,才能更好地实现教学目标。
7. 对策思考
7.1. 有效发挥机器评价的作用
要让机器评价(如句酷批改网)成为师生合作评价的“前置助力”,而非简单的纠错工具。机器评价可先聚焦学生普遍存在的语法错误(如时态混乱、主谓不一致)、词汇拼写及基础搭配问题,学生完成初稿后先通过机器进行首轮修改,快速减少“低级错误”,这既能缓解教师在基础纠错上的时间压力,从而有更多时间用于点评更高层次的写作要素,如叙事逻辑、情感表达和篇章衔接,也能让学生直观看到自己的基础短板。同时,需建立“机器初评–教师校准”的衔接机制,教师可针对机器难以识别的问题(如语境适配性、逻辑连贯性)进行二次把关。此外,教师要汇总机器评价的高频错误数据(如“连接词缺失”“中式英语短语”),将其转化为后续写作训练的重点,让机器评价的“数据价值”直接服务于教学目标。最后,针对句酷批改网只能线上操作的问题,笔者的解决办法是,每次作文完成之后,再让学生回家再手动或语音录入,教师保留其原稿,这样能保证作文完成的有效性,但该软件若能推出可上传字迹规范的图片作业功能,效率会更高。
7.2. 师生合作评价过程效益化
要让师生合作评价从“被动配合”转向“主动参与”,构建“有目标、有方法、有反馈”的评价流程。首先需明确评价的核心维度,结合记叙文特点制定“基础 + 高阶”评价框架——基础维度含语法准确性、词汇恰当性,高阶维度含情节逻辑(如时间线索是否清晰)、内容丰满度(如是否有细节描写)。在此基础上,设计“三级互动”流程:学生先对照框架进行自评,标注“不确定的表达”,留存评改记录,让学生切实参与到评改课中;再以小组为单位开展互评,用“具体问题 + 改进建议”替代模糊评价(如不说“写得不好”,而说“这里缺少‘then’这样的连接词”),且每位同学都必须发表一条意见,注明姓名,在小组呈现时,教师随机抽取同学进行解释,以检测参与程度;最后,教师针对小组互评中的共性问题(如“如何用细节描写体现人物情感”)进行示范评价,结合范文展示“好的细节”。最后,整个评改流程中,教师要切实扮演好监督者的角色,及时拉回走神或不专心学生的注意力。此外,教师还可以通过精准分组的方式提高学生参与程度,即任命合适的学生为小组组长,代替教师监督小组成员。
7.3. 再次评价功能化
再次评价的核心是让“修改”成为能力提升的“关键一步”,解决学生“改后不重视”的问题。可建立“修改痕迹追踪 + 针对性反馈”机制:学生提交修改稿时,需附带“修改说明”,注明“修改了哪些内容、参考了哪些评价建议”,教师据此判断修改是否“对症下药”——若仅修改了表面错误(如把“go”改成“went”)却未解决逻辑问题(如情节仍断层),则在再次评价中明确指出“需补充‘为什么他突然决定出门’的过渡句”,并提供具体范例。同时,将再次评价与后续写作关联:把学生修改中暴露的“顽固问题”(如反复出现的“中式英语”)列为下一次写作的“必避雷区”,让再次评价不仅是对“上一篇”的收尾,更是对“下一篇”的铺垫,形成“评价–修改–提升”的闭环。
7.4. 评价周期长期化
突破“短期实验效果有限”的局限,需将评价融入日常教学,形成“持续积累”效应。可制定“学期周期计划”:每周固定“1次短写作 + 1次轻评价”,写作篇幅控制在150词内(避免学生因任务重放弃),评价聚焦1个核心点(如周一练“时间线索”,周五评“时间线索”);每月设置“主题串联”(如“家庭故事”“校园小事”),让评价焦点随主题深化(写“家庭故事”时练细节,写“校园小事”时练逻辑)。同时,建立“个人写作档案袋”,收录每次的初稿、修改稿、评价记录,学生每月对比自己的作品,标注“进步处”(如“从不会用‘first…then…finally’到能清晰串联情节”),教师用数据(如“班级情节完整率从50%升至85%”)直观呈现长期效果。此外,控制单次评价时长(小组互评不超过20分钟),将评价任务“轻量化”,避免占用学生过多课外时间,让长期评价在“可坚持”的节奏中实现能力沉淀。
总之,提升师生合作评价效能的关键在于“多元化”“精准化”与“可持续”:通过机器与人工评价的合理分工、差异化焦点调整、功能化二次评价及多轮循环,最大化师生合作评价的效益。
基金项目
喀什大学校级科研项目KD2025KY031。