1. 引言
随着国际竞争的加剧和科学技术的迅猛发展,迫切要求高校既要培养学生系统的科学文化知识,又培养学生独立学习和自主创新的能力。《国家中长期教育改革和发展规划纲要(2010-2020)》中强调,要“优化知识结构,丰富社会实践,强化能力培养。着力提高学生的学习能力、实践能力、创新能力,教育学生学会知识技能,学会动手动脑,学会生存生活,学会做人做事,促进学生主动适应社会,开创美好未来。”
学习能力是指以快捷、简便、有效的方式获取准确知识、信息,并将它转化为自身能力的本事。学习能力表征了个体对外界变化的态度,体现了个体在社会生活中的生存能力,是大学生发现和解决问题的本质能力 [1]。因此,利用基于粗糙集的粒度约简算法发掘影响大学生学习能力的关键因素,帮助高校管理者更具针对性地提高大学生的学习能力,提高学生的综合素质,具有重要的研究意义。
粗糙集理论是波兰学者Z. Pawlak在1982年提出的一种能够有效处理不精确和不确定信息的数学工具 [2] [3]。它通过知识约简,导出问题的决策或分类规则,从而发现隐含的知识,揭示潜在的规律。粗糙集理论最突出的优点是不需要数据的额外信息,“让数据自己说话”,所以对问题的描述或处理较为客观 [4]。近年来,在数据挖掘、机器学习与知识发现、决策支持与分析等领域取得了广泛而成功的应用。然而,经典粗糙集是基于单粒度和单层次的,无法从多粒度和多层次对数据进行处理,因此钱宇华等 [5] [6] [7] 引入多粒度粗糙集,对数据进行处理。悲观多粒度粗糙集的约简算法强调“求同排异”,目标概念通过多个等价粒空间来近似描述,在多个独立的粒空间中,某个对象所处的信息粒只有全部包含在目标概念中才能将其放入下近似 [8] [9],其上近似则定义为目标概念补集的下近似的补集。乐观多粒度粗糙集的约简算法强调“求同存异”,在任意一个粒度空间上进行的决策与其他粒度空间没有关系,不会影响其他粒度空间上进行的决策,也不会受到其他粒度空间上决策的影响 [10] [11]。
我们首先设计学习能力调查问卷表,然后向大一到大四的在校大学生在线发放问卷以收集数据得到决策表,删除不完整数据。对于最终保留的有效数据,基于多粒度粗糙集,从乐观和悲观两个方面对数据进行约简,通过粒度约简删除了冗余的粒度,从多粒度的角度挖掘出影响大学生学习能力的关键因素,从而辅助学校优化现有的教学体制和制定相关学习策略,提高学生的核心竞争力。
2. 多粒度粗糙集的基本概念
在经典的粗糙集理论中,论域上的任一概念是由单个不可分辨二元关系导出的单个粒度空间中的知识粒来近似表示的,通过下上近似集的形式来逼近。多粒度粗糙集将单个不可区分二元关系导出的单个粒度空间,扩展到由一组二元关系导出的多个粒度空间,采用多个粒度空间中的知识粒来近似表示未知的概念 [12] [13] [14]。
定义1:设
是一个完备决策信息系统,U为论域,A为定义在论域上的条件属性集,
。对于任意
,乐观多粒度粗糙集下,上下近似的定义为(“O”为“乐观”):
定义2:设
是一个完备决策信息系统,U为论域,A为定义在论域上的条件属性集,
。对于任意
,悲观多粒度粗糙集下,上下近似的定义分别为(“P”为“悲观”):
3. 基于信息量的多粒度约简
实际应用中,多个粒度之间往往存在冗余。基于信息量的多粒度约简是通过计算每个粒度的信息量对粒度进行约简。
定义3:设
是一个完备决策信息系统,
,
,
,则悲观多粒度下的信息量为:
定义4:设
是一个完备决策信息系统,
,
,
,粒度
在粒度A中的定义为:
算法如下:
输入:决策信息系统
,U为全体对象,
,。
输出:决策信息系统的一个悲观下粒度约简C。
步骤1:对每一个
,计算
和
。
步骤2:对每一个基于单粒度的粒度空间
,和
,计算
。
步骤3:首先令B为空,然后对任意
,计算重要度
,将使
的
增加到粒度集B。
步骤4:如果
,则
,转到步骤5;否则令
,对
,计算信息量
,将使信息量增加到最大的粒度
增加到粒度集B中,
,转到步骤4。
步骤5:输出粒度约简结果C,算法结束。
乐观多粒度粗糙集算法和悲观的类似,在此不再赘述其算法步骤。
4. 实验分析
通过在网上查阅资料,阅读文献等途径收集总结了一些可能影响高校学生学习能力的因素,以此为基础,设计了高校大学生学生能力调查问卷。经过老师指导和部分被调研者的反馈,修改并确定了最终的问卷。问卷包括“基础信息”、“个人因素”、“家庭因素”和“社会因素”共四个粒度因子,“学习能力”一个决策因子。问卷采用线上分发的形式,共发放102份,实际使用73份。问卷设计方面,共28道选择题,选项1~2是基础信息,包含“性别”和“年级”;选项14~18是个人因素,包含如“自我标准”、“自我反思”、“自制力”“目标明确性”和“学习主动性”;选项19~23是家庭因素,包含“父亲文化程度”、“母亲文化程度”、“城市或农村户口”、“家庭和谐度”和“家庭月收入”;选项24~28是社会因素,包含“班级学习氛围”、“朋友学习状态”、“是否恋爱”、“老师关怀”和“学校关怀”;选项3~13是学生学习能力判定因素,各选项得分总和为决策值,代表高校学生学习能力的高低,粒度结构如表1所示。
基于乐观粗糙集的属性约简算法,结果显示:“个人因素”,“家庭因素”和“社会因素”是影响高校学生学习能力的关键因子。而基于悲观粗糙集的属性约简算法,只有“基础信息”是影响着高校大学生学习能力高低的,约简结果如表2。
在乐观多粒度粗糙集中,在任意一个粒度空间上进行的决策与其他粒度空间没有关系,不会影响其他粒度空间上进行的决策,也不会受到其他粒度空间上决策的影响,因此“个人因素”,“家庭因素”和“社会因素”都是影响高校学生学习能力的关键因子,数量较多。而在悲观多粒度粗糙集算法中,一个对象属于某个目标概念的下近似,要求粒度集合中的每个粒度上都要满足这个对象的等价类包含于目标概念,这个要求较为严格,所以关键因子仅有“基础信息”一个。
Table 1. Multi-granularity structure
表1. 多粒度结构
Table 2. Result of granularity reduction
表2. 粒度约简结果
5. 结束语
本文针对高校学生学习能力设计并分发调查问卷,收集和整理数据。分别使用基于多粒度粗糙集的乐观粒度约简算法和悲观粒度约简算法对数据进行处理,得出与学习能力相关的因素。基于乐观多粒度粗糙集的属性约简算法时,“个人因素”,“家庭因素”和“社会因素”对高校学生的学习能力影响显著;而使用基于悲观多粒度粗糙集的属性约简算法,只有“基础信息”这一因子影响较为显著。实验结果可以为高校在教育改革过程中更有针对性地提高学生的学习能力和学校的教学水平提供帮助。
基金项目
安徽省大学生创新创业训练计划项目(201910357474)。
NOTES
*通讯作者。