1. 引言
伴随着信息化的发展与进步,大数据时代浪潮势不可挡,物联网与云计算有关的“互联网+”的大数据技术正在引领生产方式的变革,也深刻地改变着人们的生活方式与思维方式[1]。数据分析是数字时代下数学应用的重要方法,也是处理“互联网+”有关行业信息的重要数学方法,只有具备数据分析能力,社会公民才能在数智时代获得更好的生存和职业发展空间[2]。《义务教育数学课程标准(2022年版)》(以下简称“课程标准”)明确提出了数学课程要培养的学生核心素养,其中就包括数据分析能力[3]。此外,课程标准在内容结构上进行了调整,以促进学生核心素养的养成,其中包括对与数据分析能力息息相关的统计与概率领域的重视[4],这表明数据分析能力作为学生核心素养的一部分,在义务教育阶段的数学教学中占有重要地位。而中学阶段是学生完成基础教育、步入职场或继续深造前的关键学习时期,是培养学生适应未来社会挑战所需核心素养的重要阶段[5]。此外,根据皮亚杰的认知发展理论,初中生的认知发展处于形式运算阶段,其思维已达到抽象逻辑的水平,他们的思维形式不再受思维内容的束缚,能够进行假设–演绎推理[6],这恰好为数据分析能力的发展奠定了认知基础。因此,揭示当前我国初中生数据分析能力的发展现状具有重要研究价值。
构建科学、完善的数据分析能力指标体系,对指标进行数量化的解释并形成测评模型,可以使教师有效地评估学生数据分析能力现状,帮助教师明确数据分析能力的重点,丰富课堂教学内容,把握教学核心,从而系统、全面地培养学生的数据分析能力;使学生更明确地认识数据分析能力的内容,为其数据分析的学习提供一定参考和方向。因此,深入探究初中生数据分析能力的结构与测评模型具有重大时代意义。
本研究的核心概念是“数据分析能力”,国内外相关文献大多涉及“统计观念”、“统计素养”、“数据分析观念”、“数据分析素养”,这些概念与数据分析能力的内涵是一致的[7] [8]。大卫·摩尔(David S. Moore)认为统计思维是个体在面对数据、变量、概率情境下所持有的一种思维方法。统计思维是一个连续的、互相连接的过程,它需要个体认识到统计调查的价值、具体实施的方式以及数据分析的方法,并时刻保持对变异的觉察[9]。史宁中认为数据分析观念包含三个要点,一是认识到数据在解决某些问题时的价值,个体要有意识地通过做调查研究、收集数据、处理数据,通过数据分析做出决策;二是要了解多种数据分析的方法,可以在具体情境中选择最合适的方法,三是要了解数据的随机性。统计思维是通过对生活中的随机现象情境背后的数据收集、整理、解释、计算分析、判断和推理的认知过程[10]。惠琦娜认为统计思维是人们主动运用数字对事物的数量特征和规律进行描述、分析、判断和推理的认知活动[11]。从现有研究来看,虽然对数据分析能力的定义尚未达成共识[12],但大多数研究者对数据分析能力的核心定义相似[7] [8],这也与数学课程标准中的数据分析概念相一致。在已有资料基础上,本研究认为初中生数据分析能力是指:具有数据分析观念,能够针对研究对象收集数据,运用数学方法对数据进行整理、分析,并对分析结果进行解释以及做出判断和预测的能力。
此外,目前尚无统一的数据分析能力指标体系,但一般可以分为两类:一类是从能力过程的角度构建指标体系,这与数据分析能力的内涵相契合,是其具体表现,更便于理解和评估[13]-[15];另一类是从课程标准中关于数据分析的概念角度构建指标体系,侧重从宏观认知层面评估数据分析能力[16] [17]。使用上述两种方法构建的指标体系大多采用定性分析,参考资料不够全面,缺乏广度。有研究发现,中国香港和新加坡的数学课程标准有许多值得借鉴的方面[18]-[20],可以完善指标体系。此外,以往的研究很少结合定量方法来明确不同指标的权重,难以突出数据分析能力的重点[16],缺乏深度。为弥补现阶段初中生数据分析能力指标体系研究的不足,并构建出符合当下时代的初中生数据分析能力测评模型,为后续的准确测量与评价提供重要抓手,本研究从数据分析能力的操作性定义出发,结合以上两类指标体系以及中国大陆及香港地区数学课标和新加坡数学课标中数据分析内容,采用定性和定量相融合的研究方法,按照“测评指标体系确定→测评模型构建→测评工具开发→测评工具应用”的研究思路,构建初中生数据分析能力测评模型并进行应用,以期丰富初中生数据分析能力的理论研究,并为教师明确数据分析能力重点与把握教学核心提供有益指导。
2. 初中生数据分析能力指标体系的确定
2.1. 初拟测评指标体系
基于对国内外相关文献和课程标准的研究,以及对国内外广泛使用的数据分析能力框架的分析,进行了本土化的优化和改进,初步勾勒出了中学生数据分析能力的指标体系,共包含6个一级指标和19个二级指标。其中6个一级指标分别是:数据认识能力、数据收集能力、数据整理能力、数据描述能力、结果运用能力和软件操作能力。“数据认识能力”包括数据价值认识能力、数据时效性认识能力、数据随机性认识能力和数据规律性认识能力4个指标;“数据收集能力”包括收集指标的选择、媒体数据获取能力、收集方式和抽样能力4个指标;“数据整理能力”包括数据分组能力、数据排序能力和数据检查能力3个指标;“数据描述能力”包括统计图表描述能力、统计量描述能力和统计量比较能力3个指标;“结果运用能力”包括结果解释能力、推断预测能力和结论质疑能力3个指标;“软件操作能力”包括非编程操作能力和编程操作能力2个指标。
2.2. 修正测评指标体系
为了进一步完善中学生数据分析能力的指标体系,采用了德尔菲法征求专家意见。基于最初构建的数据分析能力指标体系,形成了《中学生数据分析能力指标体系专家咨询问卷》,其中详细介绍了本次调查的目的和任务、问卷填写说明以及指标体系等内容。咨询问卷分为三部分。第一部分收集专家的基本信息,包括年龄、性别、学历、工作年限和专业领域。第二部分涉及专家对构建的一级和二级指标的合理性进行评定,并对各级指标的修改提出建议。评分采用5级李克特量表,包括:非常不重要、稍微不重要、不明确、相当重要和非常重要,分别对应数值1、2、3、4和5。第三部分则由专家通过自我评估来评价其判断依据的影响。
为了确保研究中收集视角的全面性,本次访谈的专家由大学教师和中学一线数学教师组成。专家的基本信息如下:共有15名专家,均具有学士及以上学位,其中7人拥有硕士及以上学位。10名专家专攻初中数学教学,其余5名为数学教育研究领域的教授。12名专家具有超过10年的工作经验。对每位专家的问卷进行了数据分析,并采用界值法对指标进行筛选,根据各指标的重要性评分计算了重要性均值、满分频率和变异系数。重要性均值和满分频率界值的计算方法为:“界值 = 均数 − 标准差”,评分高于界值的入选;变异系数界值的计算方法为:“界值 = 均数 + 标准差”,评分低于界值的入选。需要注意的是,为了防止重要指标被剔除,指标只有在未达到上述三种衡量尺度的所有要求时才会被淘汰。对于未达到一项或两项尺度要求的指标,将在讨论后根据全面性、科学有效性和可行性等原则作出决定[21]。
经过两轮的专家意见征询,各位专家对指标体系的看法趋于一致,不再需要调整,最终形成包括5个一级指标和16个二级指标的初中生数据分析能力指标体系,详见表1。
Table 1. Indicator system for junior high school students’ data analysis skills
表1. 初中生数据分析能力指标体系
一级指标 |
二级指标 |
二级指标解释 |
A. 数据认识能力 |
A1. 数据价值认识能力 |
能意识到生活中有许多问题应先做调查收集数据,通过分析做出判断。 |
A2. 数据时效性认识能力 |
能认识到数据仅在一定时间段内对决策具有价值,例如每几年要进行人口普查。 |
A3. 数据随机性认识能力 |
能认识到对于同样的事情每次收集到的数据可能会不同。 |
A4. 数据规律性认识能力 |
能认识到可以从足够多的数据中发现规律。 |
B. 数据收集能力 |
B1. 收集指标的选择 |
能根据实际问题,选取适当指标进行收集。 |
B2. 收集方式 |
能采用资料查询、调查、实验等方法收集数据。 |
B3. 抽样能力 |
能使用简单随机抽样。 |
C. 数据整理能力 |
C1. 数据分类能力 |
能将数据按一定标准分类,如按性别分类。 |
C2. 数据排序能力 |
能按某种要求对数据进行排序,如按年龄排序、按地区首字母排序等。 |
C3. 数据检查能力 |
能发现原始资料中存在的不合理数据。 |
D. 数据描述能力 |
D1. 统计图表描述能力 |
能读取条形图等常见统计图表中的信息,根据实际情况用统计图表呈现数据。 |
D2. 统计量描述能力 |
能通过各种统计量如平均数和方差等表示数据。 |
D3. 统计量比较能力 |
能认识极端值对不同统计量的影响,区别不同统计量的适用情境,并说明为什么在此情境下该统计量比其他统计量更好。 |
E. 结果运用能力 |
E1. 结果解释能力 |
能根据具体情境,对数据分析结果进行解释。 |
E2. 推断预测能力 |
能根据数据分析结果做出判断和预测。 |
E3. 结论质疑能力 |
能辨别媒体报道中错误信息或误导信息。 |
3. 构建初中生数据分析能力测评模型
为明确指标体系中各指标的重要性并形成测评模型,本研究采用层次分析法,如图1所示构建层次结构模型,邀请4名研究中学数学教育的高校教授以及9名初中数学教师,分别构建中间层和最底层的判断矩阵,要求专家们分别对一级指标和二级指标的重要性进行两两比较并打分。
Figure 1. Hierarchical model of data analysis skills for middle school students
图1. 初中生数据分析能力层次结构模型
本研究使用R软件中的mvstats包,调用CI_CR()函数对评分矩阵进行计算和处理,同时对13位专家的判断矩阵进行一致性检验(CR < 0.1)。CR值大于0.1的判断矩阵不满足一致性要求,其中3位专家的不一致矩阵过多,1位专家矩阵的CR值过高,直接剔除;4位专家的不一致矩较少,且CR值仅略微超出,采用骆正清的方法[22]对其不符合要求的判断矩阵进行调整,直到CR值小于或等于0.1为止。
调整完专家的判断矩阵后,计算剩余专家对指标赋予权重的平均值,作为最终权重(见表2),得到初中生数据分析能力测评模型的数学表达式为:Y = 0.15 * A + 0.13 * B + 0.17 * C + 0.20 * D + 0.35 * E,其中:A = 0.36 * A1 + 0.16 * A2 + 0.19 * A3 + 0.29 * A4;B = 0.34 * B1 + 0.20 * B2 + 0.46 * B3;C = 0.36 * C1 + 0.31 * C2 + 0.33 * C3;D = 0.27 * D1 + 0.34 * D2 + 0.39 * D3;E = 0.28 * E1 + 0.38 * E2 + 0.34 * E3。(Y表示初中生数据分析能力;A~B和A1~E5含义参见表2)。
Table 2. Evaluation index system and weights for data analysis ability of junior high school students
表2. 初中生数据分析能力评价指标体系及其权重
一级指标(权重) |
二级指标(权重) |
综合权重 |
A. 数据认识能力(0. 15) |
A1. 数据价值认识能力(0.36) |
0.054 |
A2. 数据时效性认识能力(0.16) |
0.024 |
A3. 数据随机性认识能力(0.19) |
0.029 |
A4. 数据规律性认识能力(0.29) |
0.044 |
B. 数据收集能力(0.13) |
B1. 数据收集指标的确立(0.34) |
0.044 |
B2. 收集方式(0.20) |
0.026 |
B3. 抽样能力(0.46) |
0.060 |
C. 数据整理能力(0.17) |
C1. 数据分组能力(0.36) |
0.061 |
C2. 数据排序能力(0.31) |
0.053 |
C3. 数据检查能力(0.33) |
0.056 |
D. 数据描述能力(0.20) |
D1. 统计图表描述能力(0.27) |
0.054 |
D2. 统计量描述能力(0.34) |
0.068 |
D3. 统计量比较能力(0.39) |
0.078 |
E. 结果运用能力(0.35) |
E1. 结果解释能力(0.28) |
0.098 |
E2. 结果推测能力(0.38) |
0.133 |
E3. 结果质疑能力(0.34) |
0.119 |
4. 初中生数据分析能力指标体系的初步应用
为了进一步实证检验初中生数据分析能力测评模型的科学性、有效性和可操作性,编制了《初中生数据分析能力测试试卷》。选取重庆和云南省的四所中学的学生,共发放试卷1,227份,收回1,109份,回收率为90.38%。经过数据清理与分析,获得有效问卷1008份,有效率为90.89%。其中,七年级学生268人,占26.59%;八年级学生119人,占11.81%;九年级学生621人,占61.61%。
4.1. 编制测试试卷
邀请两位重庆优秀高中教师,基于此前开发的初中学生数据分析能力测评模型,结合PISA及相关数据分析能力范题,并参考人民教育出版社、北京师范大学出版社和苏州教育出版社的初中数学教材,分别编制七、八、九年级《数据分析能力测试试卷》共三份。为了提高测试的科学有效性和可行性,邀请了两名专攻中学数学教育的大学教授、两名专攻心理统计与测量的教师以及三名心理计量学研究生,共七人对试卷进行了三轮讨论和修改。最终,开发了三份《初中学生数据分析能力测试卷》。七年级和八年级的试卷各包含24道题,九年级试卷包含21道题。题型包括单选题、多选题、填空题和主观题。填空题和单选题的评分为0或1分,多选题采用多级评分,分值分别为0、1、2、3、4或0、1、2、3或0、1、2;主观题也采用多级评分,分值由低到高为0、1、2、3或0、1、2分。
4.2. 验证性因素分析
验证性因素分析(CFA)可以检验理论模型与实际数据之间的拟合程度,并广泛用于评估结构效度[23]。在CFA中,模型拟合通常通过以下指标进行评估:卡方自由度比、比较拟合指数(CFI)、非规范拟合指数(TLI)、标准化残差均方根(SPMR)和近似误差均方根(RMSEA)等。卡方自由度比在1到3之间表示模型拟合良好[24]。CFI值大于或等于0.90表示模型拟合较好[25]。TLI大于0.9同样表示模型拟合良好。SRMR小于0.08提示模型拟合良好[25]。RMSEA值小于0.01表示模型拟合非常优秀,小于0.05表示拟合良好,小于0.1表示拟合可接受。三个年级试卷的Cronbach’s Alpha系数分别为0.701,0.729和0.703,一般来说,Cronbach’s Alpha系数应大于0.7,不应低于0.6 [26],本次研究三个年级的信度都大于0.7,证明试卷信度较好,三个年级CFA模型拟合结果如表3所示,各年级指标均符合标准,证明模型拟合较好,试卷结构效度良好。
Table 3. Confirmatory factor analysis fit results
表3. 验证性因素分析拟合结果
指标 |
χ2 |
df |
p |
χ²/df |
RMSEA |
CFI |
TLI |
SRMR |
七年级 |
288.521 |
225 |
0.003 |
1.282 |
0.030 |
0.921 |
0.914 |
0.045 |
八年级 |
335.814 |
224 |
0.000 |
1.499 |
0.044 |
0.885 |
0.874 |
0.062 |
九年级 |
280.273 |
138 |
0.000 |
2.031 |
0.030 |
0.917 |
0.903 |
0.046 |
4.3. 初中生数据分析能力的总体水平
采用项目反应理论中的多维等级反应模型1,通过R软件中的mirt包对学生能力进行估计,得到学生在五个维度上的能力值。基于测评模型,将五个维度的能力合成数据分析总能力值,最终计算出数据分析各维度能力的均值和标准差,并绘出各年级数据分析能力折线图(图2)及分布直方图(图3~5)。
总体而言,七年级学生的数据分析总能力总体在[−1.5, 1]之间,呈现负偏态分布,均值为−0.015,标准差为0.427;八年级学生的数据分析总能力总体在[−1, 1]之间,呈现负偏态分布,均值为0.028,标准差为0.395;九年级学生的数据分析总能力总体在[−1, 1]之间,呈现负偏态分布,均值为−0.008,标准差为0.426。由表4可见,初中生数据分析总能力以及在数据认识能力、数据收集能力、数据整理能力、数据描述能力和结果运用能力5个一级指标上的发展均处于中下水平,亟待进一步提升。这主要是因为传统教学过于强调具体知识的学习,而缺乏在真实情境中培养学生数据分析意识。结果,学生无法与数据产生共鸣,更重要的是,数据分析的实践训练被忽视,导致学生无法真正掌握数据分析的核心技能。此外,教材中关于数据分析的一些教学内容已经略显陈旧,这限制了初中生数据分析能力的整体发展与培养。
Figure 2. Line chart of data analysis skills of middle school students
图2. 初中生数据分析能力折线图
Figure 3. Seventh grade data literacy distribution histogram
图3. 七年级数据能力分布直方图
Figure 4. Eighth grade data literacy distribution histogram
图4. 八年级数据能力分布直方图
Figure 5. Ninth grade data literacy distribution histogram
图5. 九年级数据能力分布直方图
Table 4. Descriptive statistics of middle school students’ data analysis abilities
表4. 初中生数据分析各项能力的描述性统计
指标名称 |
七年级 |
八年级 |
九年级 |
平均值 |
标准差 |
平均值 |
标准差 |
平均值 |
标准差 |
数据分析总能力 |
−0.015 |
0.427 |
0.028 |
0.395 |
−0.008 |
0.426 |
数据认识能力 |
−0.020 |
0.466 |
−0.083 |
0.660 |
−0.065 |
0.727 |
数据收集能力 |
−0.007 |
0.607 |
−0.032 |
0.639 |
0.039 |
0.533 |
数据整理能力 |
0.006 |
0.654 |
0.086 |
0.637 |
−0.004 |
0.625 |
数据描述能力 |
−0.062 |
0.702 |
0.030 |
0.703 |
0.021 |
0.560 |
结果运用能力 |
0.001 |
0.662 |
0.069 |
0.558 |
−0.018 |
0.692 |
注:横坐标为学生能力值,值越小代表学生能力越低。纵坐标代表频数,值越大说明学生人数越多。
5. 研究结论与建议
5.1. 研究结论
本研究采用文献分析法和德尔菲法构建了包含数据认识能力、数据收集能力、数据整理能力、数据描述能力和结果运用能力5个一级指标和16个二级指标的初中生数据分析能力指标体系,并运用层次分析法确定了初中生数据分析能力测评模型:Y = 0.15 * A + 0.13 * B + 0.17 * C + 0.20 * D + 0.35 * E。在测评模型的基础上编制七、八、九年级的《数据分析能力测试试卷》并施测,结果表明试卷信效度良好,初中生数据分析总能力和各分维度能力中等偏下。
5.2. 研究建议
首先,本研究探索了初中生数据分析能力指标体系,教师可根据此指标体系针对性地制定学生数据分析能力的培养目标,增强学生的数据分析意识,更新学生的数据分析知识;学校可根据此指标体系组织教师进行数据分析能力教学实训,提升教师的相关教学能力,进一步做好初中数学教师职前培训;初中数学教育管理部门可根据此指标体系做好数据分析教育的顶层设计,做好初中数学教师的数学教学综合规训,促使初中数学教师更新数据分析理念,跳出学科桎梏,最终达到全面提升学生数据分析能力的目标。
其次,基于初中生数据分析能力测评模型,本研究运用项目反应理论中的多维分层反应模型对五个维度的能力进行估计,从而实现了能力维度的诊断功能。研究发现,不同年级学生的弱项在不同能力维度上有所体现,同一年级内的学生能力结构也存在差异。针对七年级学生数据描述能力相对较弱的情况,由于他们正处于从具体运算阶段向形式运算阶段的过渡期,思维开始从具体事物和事实转向更抽象的概念和逻辑。因此,教师可以通过提供更多直观、具体的教学材料和实践活动,帮助学生逐步向抽象思维过渡。例如,教师可以通过图表、真实数据和日常生活中的具体实例,引导学生理解统计指标的实际意义,同时帮助学生掌握在真实情境中如何描述和总结数据。此外,教师应侧重于培养学生的归纳和推理能力,引导他们从具体数据中提取规律和趋势,帮助他们逐步掌握数据描述的方法和技巧。鉴于八、九年级学生的数据素养普遍较低,更依赖对数据的理解和直观感受,而不仅仅是掌握概念和公式,教师应强调数据的实际应用和情境化教学,引导学生通过真实的数据情境去体验数据背后的意义。教师可以设计基于项目的学习活动,让学生通过实际调查、收集和分析数据,在真实情境中理解数据的生成、转化与应用。针对同年级学生之间存在的个体差异,教师应遵循“以学生为中心”的教学理念,整合教学资源,为不同情况的学生制定个性化教学方案,实现教育优化。
5.3. 不足与展望
本研究尽管成功构建了初中生数据分析能力的测评模型,并基于实际应用验证了模型的科学性、有效性和可操作性,但仍存在一些不足之处。首先,在构建指标体系时,专家建议删除软件操作技能,实际上已经包含在许多国家的数学课程标准中。在当今时代,计算机和各种分析软件在数据分析过程中扮演着不可或缺的角色。这表明软件操作技能已成为数据分析能力的重要组成部分,但由于学校纸笔测试的限制,本研究无法有效调查这一方面。其次,本研究仅选择了处于西南片区的重庆与云南地区的学校,并且由于八年级学生临近会考人数相对较少,因此未来的研究需要扩大样本群体,以增强样本的代表性。第三,本研究探讨了七至九年级学生的数据分析能力现状,但由于测试题目存在差异,无法进行等值比较,从而无法对不同年级的数据分析能力进行比较。未来需要考虑在测试中加入锚题,以实现跨年级能力比较。
基金项目
中央高校基本科研业务费专项资金(SWU2109222)、西南大学2035先导计划项目(SWUPilotPlan006)研究成果。
NOTES
1基于项目反应理论估计的能力值取值范围通常在−3~3之间,总体服从以0为均值,以1为标准差的正态分布,能力值为0表示该被试能力处于中等水平,取值越大,能力水平越高。