1. 引言
中共中央办公厅、国务院办公厅在2021年7月24日印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”),明确指出“坚持以学定考,进一步提升中考命题质量,防止偏题、怪题、超过课程标准的难题[1]”。为深入贯彻“双减”工作要求,湖南省教育厅于2023年7月12日发布《权威解读湖南中考改革》,指出“合理设置试题结构,提高试题探究性、开放性、综合性,不出偏题怪题[2]”。在此基础上,湖南省教育厅印发《关于湖南省初中学业水平考试有关事项的通知》(以下简称《通知》),明确规定自2024年起,语文、数学、英语等科目的中考命题与考试将由全省统一进行,而长沙市则需按照省里的统一要求,独立组织其中考命题工作[3],这标志着湖南省的基础教育课程深化改革进一步推进。
难度模型在近年来逐渐成为教育数学领域内备受关注的议题。鲍建生首次阐述了数学课程综合难度的理念,并据此确立了包含背景、探究、运算、推理以及知识含量在内的五个难度因素[4],进而构建了习题的综合难度模型。陈志辉建立包含六情境的三维特征分析框架来确定数学问题情境水平,从“数学特征”、“表征特征”和“任务特征”三个维度方面对中美数学教材进行了比较[5]。张怡等人对传统综合难度系数模型进行了适当调整,从背景因素、运算水平、推理能力、知识含量、思维方向以及知识水平这六个维度出发[6],重新构建了综合难度系数模型,并据此对试题进行了深入分析。武小鹏等人则运用层次分析理论(AHP)来确定不同因素及其在同一维度内不同水平的权重[7],从而建立了更加贴近实际的综合难度系数模型,这是对前人模型的进一步优化。在此基础上,文尚平等人则依据综合难度系数模型,从情境、参数、运算水平、推理能力、思维方向、知识含量、认知水平以及阅读量这八个方面对高考数学试题进行了全面评析[8]。
中考是我国独有的普通高级中学招生考试,在选拔学生进行职高分流、继续升学上起着重要作用,以此最大化地促进教育公平。分析中考数学试题不仅能评估学生的数学能力,还能考量教学质量、促进教育改革,同时其难度水平也是衡量某地区整体数学及教育水平的重要指标。因此,落实新课标导向教与学的关键问题与时俱进地变成了如何去科学地评价数学问题、评定数学难度,并受到教育界的普遍关注。然而众多学者大多对高考数学试题进行研究,目前针对地方中考数学试题难度的专项评价研究尚显不足。鉴于此,对中考数学试题难度进行评价研究显得尤为重要。本研究运用试题综合难度系数模型对中考数学试题进行深入剖析,进而得到一些关于试题背景、试题整体难度、试题设置上的一些建议,促进中考数学试题综合难度合理的设置。
因此,本研究聚焦于湖南省近四年中考数学试题,参考鲍建生的试题综合难度系数模型,采用定量与定性分析相结合的研究方法。通过对比分析“双减”政策实施前后中考数学试题的变化,旨在揭示当前中考数学试题设置的现状,并准确把握未来的发展趋势。这一研究将为湖南省中考数学试题的编制以及一线教师教学策略的优化提供一些参考和启示。
2. 研究设计
2.1. 研究对象
从2024年起,湖南省中考科目由全省统一命题考试,长沙市则按要求单独组织中考命题[3]。长沙是湖南省教育的中坚力量,也是湖南中考综合改革试点中心地区。由于2022~2024年长沙中考试卷的比较、分析具有深刻意义,因此研究选取了2022年~2024年的3套长沙中考数学试卷,24年湖南中考试卷(以下分别简称为22年卷、23年卷、24年卷和24年湖南省卷)合计4套试卷作为研究对象。表1为2022~2024年各年份中考数学试卷的具体情况。
Table 1. Comparison of the number, types and scores of math test questions in Hunan Province from 2022 to 2024
表1. 2022~2024年湖南省中考数学试题的数量、类型和分值对比
年份 |
选择题 |
填空题 |
解答题 |
2022年 |
10 (30) |
6 (18) |
9 (72) |
2023年 |
10 (30) |
6 (18) |
9 (72) |
2024年(长沙卷) |
10 (30) |
6 (18) |
9 (72) |
2024年(省卷) |
10 (30) |
8 (24) |
8 (66) |
由表1可知,2022年卷、2023年卷和2024年的长沙卷都在题型、题量及题型分值方面保持不变;而统考后的2024年湖南省卷与之前的试卷总分尽管不变,但在其他方面发生了一定改变,主要表现在:1) 试卷总题量增加一道;2) 填空题单道分值不变,选择题增加2道;3) 解答题上单道题目平均分值增加,解答题量减少1道。
2.2. 研究工具
基于鲍建生的综合难度模型,确定了影响数学试题综合难度的5个因素,分别是:背景水平、知识与技能数量、运算水平、推理水平、认知水平[4]。在此基础上,笔者补充表征水平因素,确定了数学试题难度的基本框架模型。之后,再对各因素进行赋值(详情见表2)。
为确保统计结果的精确性和科学性,我们专门成立了一个编码小组。该小组的成员构成包括1名统计学博士、3名数学专业硕士研究生,以及1位在省市联考命题方面拥有丰富经验的资深高中数学教师。在具体实际操作中,小组成员首先依据评价框架,从中考试卷中挑选出涵盖所有题型的部分试题进行独立编码。随后,对评价框架的科学性进行了深入测试、论证,并据此进行了必要的调整和完善。在此基础上,小组成员对四套试卷的所有试题进行了全面的编码工作。最后,针对编码过程中存在的任何异议,小组成员都进行了充分的讨论,并最终达成共识。
Table 2. The difficulty frame model of mathematics test questions
表2. 中考数学试题难度框架模型
难度因素 |
水平 |
赋值 |
赋值 |
背景水平 |
无背景 |
单一知识模块的纯数学问题 |
1 |
生活背景 |
现实生活或社会文化的数学问题 |
2 |
关联背景 |
科学和技术或者其他数学模块关联的数学问题 |
3 |
知识与技能水平 |
一个知识点 |
|
1 |
二个知识点 |
|
2 |
三个及以上知识点 |
|
3 |
运算水平 |
无运算 |
不需要运用运算法则 |
1 |
简单符号运算 |
直接运用运算法则解决问题 |
2 |
复杂符号运算 |
综合应用多种运算法则解决问题 |
3 |
推理水平 |
无推理 |
不需要进行推理 |
1 |
简单推理 |
简单单一的类比推理、演绎推理 |
2 |
复杂推理 |
综合应用多种推理方法解决问题 |
3 |
认知水平 |
理解 |
能够理解数学概念、性质、公式、定理和公理等的基本含义与特征 |
1 |
应用 |
将问题转化为熟悉的数学问题,并选择恰当的方法求解 |
2 |
创造 |
在应用的基础上,将来源于不同的数学知识点整合运用形成整体 |
3 |
表征水平 |
单一型表征 |
纯数字、文字表征或单一图表 |
1 |
组合型表征 |
数字、文字与符号组合表征 |
2 |
复合型表征 |
符号与简单图形或与表格复合表征 |
3 |
2.3. 实例分析
本研究针对2022年至2024年间湖南省中考的4套数学试卷进行了分类与编码工作。在操作过程中,我们首先依据表2所提供的综合难度模型框架,对试卷中的难度因素进行了明确界定。随后针对等级变量,我们按照从低到高的顺序,分别赋予了自然数1、2、3的数值。下文以2023年卷第3题、第16题为例说明如何应用评价框架对中考试卷中的数学试题进行结果量化。
例1:第3题 (2023年长沙中考数学试卷)下列计算正确的是( )
A.
B.
C.
D.
试题分析:本题考察了整式的乘法计算。根据同底数幂的乘法与幂的乘方、完全平方公式、整式的乘法对每个式子一一判断即可。A选项根据同底数幂的乘法法则
,正确。根据分析框架可得量化结果(见表3)。
Table 3. Quantification results of example 1
表3. 例1的量化结果
背景水平 |
知识与技能水平 |
运算水平 |
推理水平 |
认知水平 |
表征水平 |
无背景 (赋值1) |
三个及以上知识点 (赋值3) |
简单符号运算 (赋值2) |
无推理 (赋值1) |
理解 (赋值1) |
组合型表征 (赋值2) |
例2:第16题 (2023年长沙中考数学试卷) 从古代诗人屈原发出的《天问》,到如今我国首次火星探测任务被命名为“天问一号”,太空探索无止境,伟大梦想不止步。2021年5月15日,我国成功实现火星着陆。科学家已经探明火星的半径大约是地球半径的
,若把经过火星球心的截面看成是圆形的,则该圆的周长大约为__万里。
试题分析:本题考察了圆的周长应用,熟练掌握圆的周长公式是关键。先求出地球的半径,再根据火星的半径大约是地球半径的
,即可求出答案。根据分析框架可得量化结果(见表4)。
Table 4. Quantification results of example 2
表4. 例2的量化结果
背景水平 |
知识与技能水平 |
运算水平 |
推理水平 |
认知水平 |
表征水平 |
生活背景 (赋值2) |
一个知识点 (赋值1) |
简单符号运算 (赋值2) |
简单推理(赋值2) |
应用 (赋值2) |
组合型表征 (赋值2) |
3. 研究结果的比较与分析
首先,编码小组的四位成员遵循上述评价框架,独立地对四套试卷中的101道试题从六个不同因素进行独立编码。在初步比对阶段,确保编码结果的一致性达到了92%以上。随后,编码小组进行了深入的讨论,通过集体协商,最终使得所有编码的一致性达到了100%。在此基础上,研究采用了鲍建生的加权平均值法,对六个因素的水平进行了精确的量化统计。计算公式是:
。
其中
,i从1取到3,j从1取到6,结果汇总如表5所示。最后,对4套试卷从6个因素方面分别进行比较分析。
Table 5. Summary of evaluation results
表5. 评价结果汇总
难度因素 |
水平 |
22年卷 |
23年卷 |
24年长沙卷 |
24年省卷 |
背景水平 |
无背景 |
16 |
15 |
14 |
15 |
生活背景 |
7 |
8 |
8 |
7 |
关联背景 |
2 |
2 |
3 |
4 |
加权平均值 |
1.44 |
1.48 |
1.56 |
1.57 |
知识与技能水平 |
一个知识点 |
12 |
12 |
14 |
17 |
二个知识点 |
6 |
8 |
4 |
4 |
三个及以上知识点 |
7 |
5 |
7 |
5 |
加权平均值 |
1.8 |
1.72 |
1.72 |
1.54 |
运算水平 |
无运算 |
4 |
4 |
4 |
6 |
简单符号运算 |
18 |
19 |
17 |
17 |
复杂符号运算 |
3 |
2 |
4 |
3 |
加权平均值 |
1.96 |
1.92 |
2 |
1.88 |
推理水平 |
无推理 |
7 |
11 |
12 |
15 |
简单推理 |
13 |
11 |
10 |
9 |
复杂推理 |
5 |
3 |
3 |
2 |
加权平均值 |
1.92 |
1.68 |
1.64 |
1.5 |
认知水平 |
理解 |
10 |
12 |
10 |
12 |
应用 |
12 |
11 |
13 |
13 |
创造 |
3 |
2 |
2 |
1 |
加权平均值 |
1.72 |
1.6 |
1.68 |
1.58 |
表征水平 |
单一型表征 |
11 |
9 |
8 |
10 |
组合型表征 |
11 |
13 |
12 |
9 |
复合型表征 |
3 |
3 |
5 |
7 |
加权平均值 |
1.68 |
1.76 |
1.88 |
1.88 |
3.1. 背景水平的比较分析
四套试卷的“背景水平”从高到低依次是24年省卷、24年长沙卷、23年卷和22年卷;图1为四套试题在背景维度各个层次上的具体分布。从图中可以看出,这四套试题在整体难度设置上保持了较高的一致性。具体而言,纯数学背景的试题占据了约60%的比例,生活背景试题则占据了接近30%的比例,而关联背景试题相对较少,大约只占10%。总体占比大约为6:3:1;相比22年卷和23年卷,24年长沙卷和24年省卷关于无背景的比重减少,24年长沙卷生活背景的比重走向基本不变,而24年湖南省卷则比重降低,关联背景总体增加,整体上三种背景水平更加均衡。这说明在一定程度上,“双减”背景下中考数学试题考察强调知识的“交互性”,对学生关于题干的理解能力提出了更高的要求;关联背景增加说明试题开始重视新时代数学与科学和技术相关的问题,培养学生的数学应用能力。
Figure 1. Proportion distribution of background level
图1. 背景水平占比分布
3.2. 知识与技能水平的比较与分析
四套试卷的“知识与技能水平”从高到低依次是22年卷、23年卷、24年长沙卷和24年省卷;图2是这四套试卷在知识点数量上的分布情况。大体上,四套试卷均倾向于重点考察单一知识点,其占比均超过40%;前三套试卷难度走向较为稳定,考察知识点数量明显多于湖南省卷;23年卷关注对两个知识点的考查,占比为32%。三个及以上知识点考查所占比重最高的是22年卷及24年长沙卷,占比为28%,难度较大;湖南省卷适用学生范围广,考虑到不同地区教育水平差异,从而减负提质;知识点数量的变化不仅映射出教育系统的目标与价值观,还深刻揭示了教育者对于学生所需数学技能和知识的看法及其设定的优先级。
Figure 2. Proportion distribution of knowledge and skill level
图2. 知识与技能水平占比分布
3.3. 运算水平的比较与分析
四套试卷的“运算水平”从高到低依次是24年长沙卷、22年卷、23年卷和24年省卷;由图3可知,四套试题难度呈阶梯状分布,难度水平均在1.8以上。其中,22年卷、23年卷和24年长沙卷这几年无运算水平保持不变、简单符号运算水平下降,复杂符号运算水平上升;与前三套试卷相比,24年省卷考查无符号运算占比最高、简单符号运算比重最低。此外,关于无运算与复杂运算的考查,四套试题展现出相似的趋势,但整体上更偏向于无运算。然而,这实则反映了“双减”政策下对复杂运算能力要求的提升,强调了对学生运算水平的考查。试题的整体设置更为均衡,旨在适应全体学生的学习需求。
Figure 3. Proportion distribution of the operational level
图3. 运算水平占比分布
3.4. 推理水平的比较与分析
四套试卷的“推理水平”从高到低依次是22年卷、23年卷、24年长沙卷和24年省卷;由图4可知,四套试题均侧重于无推理及简单推理的考察,其占比均超过50%,这显示出命题具有高度的一致性。同时,复杂推理类的题目往往被安排在最后的关键位置,并且这些题目通常要求综合运用多个知识点,如二次函数、圆、四边形以及三角形等。值得注意的是,与22年试卷相比,23年及24年长沙卷在复杂推理的占比上有所减少,与22年近20%的比例相比呈现下降趋势,而24年省卷更是达到最低。这一调整映射出在“双减”政策的导向下,对复杂推理能力的要求有所放宽,其目的在于保障学生拥有充裕的答题时间,并更加侧重于评估学生的运算技能。
Figure 4. Proportion distribution of reasoning level
图4. 推理水平占比分布
3.5. 认知水平的比较与分析
四套试卷的“推理水平”从高到低依次是22年卷、24年长沙卷、23年卷和24年省卷;由图5可知,四套试题均高度重视对应用能力的考察,其占比约为50%,并呈现出先降后升的趋势。此外,与2022年和2023年的试卷相比,24年长沙卷在应用水平题目数量上有所增加,而在理解水平和创造水平题目数量上则有所减少。这一变化反映了“双减”政策背景下教育重心的转移,即更加强调回归基础知识与基本技能的学习,适当降低了对创造能力考察的比重,更加聚焦于数学在实际生活中的应用。
Figure 5. Proportion distribution of cognitive level
图5. 认知水平占比分布
3.6. 表征水平的比较与分析
4套试卷的“表征水平”从高到低依次是24年省卷、24年长沙卷、23年卷和22年卷;由图6可知,22年卷和23年卷单一型表征和组合型表征水平相等,复合型表征水平相当。此外,显而易见的是,24年长沙卷与24年省卷复合型表征数增加。试题中的表征水平是衡量其难度的一个关键指标。因此,这一现象反映了在“双减”政策的影响下,中考数学试题的编制严格遵循课程标准,更加注重对试题难度进行合理而审慎的控制,力求使试题的难易程度保持在一个相对均衡的状态,从而确保命题的科学性和合理性。
Figure 6. The proportion of representation level
图6. 表征水平占比
3.7. 综合难度系数的比较与分析
利用计算公式
计算湖南中考各年份试卷的综合难度系数和,我们得出了22年卷、23年卷、24年长沙卷和24年湖南卷的综合难度系数,分别为
、
、
、
。
为了更直观地展示这四套试题在六个维度上的难度差异,我们绘制了雷达图(见图7)。从图中可以分析得出以下结论:1) 在背景、运算、认知以及表征等维度上,四套试题的综合难度系数较为接近;2) 在知识与技能水平和推理水平这两个维度上,四套试题的难度则存在一些差异。总体而言,22年卷在知识与技能水平及推理水平上的难度均居首位,其次为23年卷和24年长沙卷,而24年省卷的难度相对较低。
Figure 7. Radar diagram of the comprehensive difficulty coefficient
图7. 综合难度系数雷达图
4. 研究结论与启示
以“双减”政策为指导的评价体系,应当着重展现学生在解决数学问题时所展现出的多样化能力层次。我们可以将上述提到的六种水平视为评价中考数学试卷的六个核心维度。基于之前的比较与分析,我们可以得出以下结论与启示。
4.1. 适当增加情境性背景试题,培养跨学科应用意识
《新课标》明确提出:“试题命制应设计合理的生活情境、数学情境、科学情境,关注情境的真实性,适当引入数学文化,让学生感受到数学在现实世界的广泛应用[9]”。四套试题在数学史、数学文化和课程思政方面的背景设置方面较为薄弱,背景水平单一,多为纯数学背景,不利于学生综合能力的发展。因此,可适当增设与物理、化学、生物等领域交叉的背景试题,促进学科间大融合,培养学生跨学科的应用意识和模型观念。考虑到长沙地区的教育水平,长沙卷可以从此着力,丰富试题的背景水平,提高试卷“区分度”。教师还可以开设以跨学科课题为主要内容的项目式学习[10],在真实的情境中培养学生运用数学知识与方法来解决现实中的问题,增强动手能力和创新精神,体验到数学的应用价值。
4.2. 增强试题的开放性和探究性,注重与学科思政有机融合
试卷难度量化结果表明,湖南中考试卷在知识与技能水平、运算水平、表征水平等因素上难度一直较高,特别是22年卷和23年卷的知识与技能水平,24年长沙卷运算水平难度系数达到2.0。在中考命题背景日益丰富的背景下,如果继续维持或进一步提高运算水平和表征水平的难度系数,将很可能导致试卷整体难度过度提升,进而影响试卷的有效区分度。因此,对于中考命题而言,对于运算水平和表征水平等关键因素的考查,不应再过度增加难度。参考高考评价体系的做法,“设计结论开放、解题方法灵活多样、答案非唯一的试题,以增强试题的开放性和探究性”[11],这是探索适度降低运算水平和表征水平考查难度的一个可行方向,同时也为构建中考评价体系提供了新的思考角度。
4.3. 依照课程标准命题,科学设置数学试题综合难度
中考数学试题的命制工作应当以《新课标》为指引,确保试题的难度大体保持平衡,从而保障命题的科学性。特别地,2024年的中考作为“湖南统考”后的首次中考,其试题的综合难度对于未来几年湖南省中考数学试题的命制具有重要的参考价值。与前几年的试卷以及2024年的长沙卷相比,2024年的省卷在运算、推理和认知水平上的难度有所降低,而在背景水平的难度上则有所提升。这一变化更加注重对“四基、四能”和“通性通法”(即普遍适用的数学方法和规律)的考察,与《新课标》的命制原则高度契合。因此,命制数学试题时可回归教材,不出偏题、怪题、超过课程标准的难题,关注数学知识的本质,进一步提升中考命题的质量。
基金项目
2024年度湖南省普通本科高校教学改革研究重点项目(202401000940);湖南省普通高等学校教育改革研究项目资助(HNJG-2021-0675)。