1. 引言
党的二十大报告中明确指出,要“办好人民满意的教育”,并首次将“推进教育数字化”作为一项具体举措纳入其中。这对于构建高质量教育体系和培养高素质人才具有重要的时代意义和价值,指明了改革的方向[1]。随着人工智能、大数据、云计算等数字技术呈加速度向经济社会各领域全面渗透融合,深刻改变了几千年来人类社会形成的生产生活方式。新一轮科技革命和产业变革带来前所未有的发展机遇,数字技术所蕴含的巨大潜力充分释放。高等教育与经济和社会发展是伴生关系, 数字技术的创新发展,加快推进高等教育转型升级,不断提升高等教育品质[2]。现阶段高校数字化转型主要集中在研究智慧课堂[3]、课程体系建设[4]、实验创新平台[5]、校园信息化和学生管理[6]等方面,缺少对数字化转型如何助力学生考研决策和管理方面的深入探讨。
随着就业形势的日益严峻和高等教育普及率的提高,越来越多的人希望通过提升学历来增加竞争力,考研已经成为了许多本科毕业生的必然选择[7]。考研是学生个人提高自身素质和竞争力、追求学术研究和职业发展的必要途径。升学规模与质量是评价高校人才培养效果和高质量发展的重要依据。近年来,考研热度不断加剧、考研人数逐年增长,考研的竞争激烈。研究生报考人数在2023年达到了474万,较2018年翻了一番,而全国平均录取率仅为24.2% [8]。近三年,我校计算机科学与技术/人工智能学院考研报名人数达大四学生的70%。
随着教育大数据技术的发展,众多学者在学生学业预测、学业预警、个性化教育等方面进行了初步的数字化探索。李梦莹等人[9]针对工程硕士与学术型硕士选拔机制差异,采用双路注意力机制分别构建模型,实现了考研预测的分类精细化处理。张懿等人[10]则发现传统线性模型难以准确描述考研复杂场景,通过在回归分析中引入纠偏项,结合考生本科表现与复试情况进行量化分析,改进了录取概率评估方法。秦丰团队[11]提出基于大数据构建大学生学业预警机制,结合本科生成绩波动、毕业论文进度及导师评估等动态指标,构筑了多源数据的一体化监控体系,通过实时干预降低学业脱轨风险。张明等人[12]提出基于校园上网行为感知的学生成绩预测方法,利用双层自注意力网络建模学生上网行为特征,有效解决了序列建模任务中的挑战,为学业预警系统提供了新的技术路径。卢宇等人[13]从技术层面入手,研究了“人工智能 + 教育”的关键技术,他们将机器学习、知识图谱和自然语言处理等算法应用到教学实践中,结合学生成绩、行为数据和解题过程,支持个性化学习和评价,为差异化教学设计提供了技术支撑。然而,现阶段研究更多注重于考研初试成绩预测和日常学习学业预警和个性化教育,缺少对考研预测和辅导数字化赋能的系统研究。
2. 高校学生升学指导现存问题
考研需要一个长时间系统性的备考过程,而目前高校学生主要通过自行搜集信息等方式进行复习规划和目标院校选择,缺少权威数据支持决策,且对自身情况无法进行客观评价。在考研辅导管理方面,高校教师主要通过组织高年级学生经验分享、宏观指导等方式进行,缺少对考研学生帮助的针对性。从“大水漫灌”到“精准滴灌”的深化、从定性分析到定量分析的转变,一直是高校对大学生考研指导的痛点和难点。具体而言,主要存在以下三方面问题:
(1) 高校考研数据管理缺乏系统性:学生在备考过程中,主要通过自行搜集目标院校官网、考研辅导机构、线上论坛社区、学长学姐线下讨论等方式获取备考相关信息。通过自行搜集的信息通常带有选择性偏见,导致信息茧房,缺乏多样化和全面性。此外,学生对于信息来源的真实性和客观性无法考证,容易被虚假信息蒙蔽。高校作为考研信息的权威来源,缺少对多源考研数据的有机整合与利用,导致学生获取信息的盲目性和片面性。
(2) 考生客观自我评估困难:考研学习过程中,由于缺乏一个集体的客观对照,学生很难实时客观评估自己的学习状态,进而无法及时调整复习策略和进度,盲目报考远高于自身能力的院校专业,导致考研失败。此外,除了价格昂贵的一对一考研辅导,大部分同学缺少针对自身复习情况和目标院校的个性化建议和辅导,导致考研决策失误。
(3) 教师辅导难以精准高效:考研复习主要由学生自主完成,因此专任教师和辅导员老师无法及时了解每个学生备考情况,只能采取考研学伴方式对有需求的同学进行帮助,或对全体同学进行阶段性考研动员,缺少对学生辅导的针对性和及时性。此外,师生双选是考研的最后一个环节,也是建立良性师生关系的重要基础。现阶段师生双选主要通过邮件联系和导师约谈等方式,存在一定的盲目性。
综上,广大考研学生亟需精准的数据分析、目标预测和提升建议,广大教师亟需准确的数据支撑、实时的学情分析和系统的决策参考,广大高校亟需高品质升学、数字化教育转型和内涵式发展建设。
3. 数字化赋能高校学生高质量升学措施
由于当前高校学生考研所面临的缺少数据资源支持、学生客观自我评估困难和教师难以开展精准高效辅导等问题,本文从高校数据资源集成、学生辅助决策和教师智能管理三方面实践数字化赋能高校学生高质量升学途径。
3.1. 集成多源信息的升学数字资源建设
整合学校信息化设备采集的行为习惯数据、教务处推送的学业能力数据以及问卷调查获取的主观规划备考数据等多源数据,整理并公开往届学生的升学情况、重点院校的报考人数、初试上线和录取情况等权威数据,为学生提供全面的考研信息支持(如图1所示)。此外,通过线上线下多种交流模式,将往届学生的备考和面试经验分享转化为数字信息资源,通过高效的大数据存储平台进行存储与管理,为考研学生提供可靠的备考指导。
考研学生数据:在校生考研学生是升学数字资源的主体和服务对象。考研学生数据来源主要分为三个方面:1) 学校信息化办公室提供学校信息化设备采集的行为习惯数据:寝室门禁、校园门禁、图书馆门禁、智慧体育等;2) 教务处推送学生学业能力:选课信息、成绩、等级考试、科创竞赛情况等;3) 通过问卷调查得到每个学生的主观规划备考数据:考研原因、考研进度、目标院校、复习进度等。其中,在问卷中加入客观能够考察的问题,与真实客观信息对比,从而评估问卷的准确性。
Figure 1. Multi-source student data collection
图1. 学生多源数据采集
考研历史数据:通过整理并公开在校学生目标学院或专业往届学生总体升学情况、重点院校的报考人数、初试上线和录取情况等权威数据,帮助学生客观地评估自己的实力和竞争情况,从而树立正确的考试心态,增强信心,减少焦虑和压力。协助学生更加合理地制定自己的升学规划,选择适合自己的院校和专业。
成功经验分享:组织往届学生通过线上线下多种交流模式,分享自己的初试备考和复试面试等考研经验。1) 线上文字经验贴:通过文字记录考研经历、备考心得、复习方法等,可以提供详细的信息和具体的建议,方便学生随时浏览观看。2) 线上视频音频分享:通过视听方式展示考研经验,更生动形象地呈现复习过程、备考技巧和心得体会,吸引应届考生更多关注和观看。3) 线下分享:通过小范围的面对面交流或大型的考研经验分享会或座谈会,与应届考生进行深入的交流和互动,直接解答同学们的问题,更具亲和力和交流效果。线下分享可以通过录像等方式,转化为线上视频资源,供学生随时随地反复观看,受时间和空间的限制,极大地提高了灵活性和便利性。将多种形式的经验分享转化为数字信息资源,通过搭建高效的大数据存储平台进行存储与管理,服务考研学生。
通过整合多种数据来源,包括学生的行为习惯数据、学业能力数据和主观备考数据,结合往届学生的升学情况和经验分享,提供全面、权威的考研信息支持,帮助学生做出更明智的决策。
3.2. 数字化赋能学生考研辅助决策
利用机器学习模型对学生多源数据进行特征交互和训练,对学生在多个目标院校的考研初试成功率进行预测,根据模型预测结果的可解释性,帮助学生更好地评价自身复习进度和效果,明确能力定位,提供个性化和实效性的备考指导和决策支持,提高他们的备考效率和考研成功率。
考研预测模型:利用学生行为、学业、备考情况三方面数据,对不同维度和来源的数据进行基础特征工程,并基于业务进行第一次交互,挖掘出有效的业务特征,构建面向多个目标院校的考研初试上线预测数据集。利用多层线性变换 + GLU 门控的深度学习模型进行深层抽象特征的提取,通过带掩码的多轮特征选择网络中的共享参数层挖掘特征共性、非共享参数层提取特征特性,是人工提取特征的有效补充(如图2所示)。最终通过深浅特征交融和多模型融合,对每位学生多个目标院校的考研初试成功率进行预测(如图3所示)。
Figure 2. Deep Learning based Postgraduate Entrance Examination (PEE) prediction model architecture
图2. 考研预测深度学习模型架构图
Figure 3. Sample output of the Postgraduate Entrance Examination (PEE) prediction model
图3. 考研预测模型输出结果示例
个性化备考建议:通过模型预测结果的可解释性,针对学生自身基础、复习进度和报考院校等情况,并结合往届成功升学学生备考经验,提供具有个性化、针对性和实效性的建议。让学生能够更好地了解自己的备考情况,并根据建议来有针对性地调整自己的备考策略和状态(如图4所示),从复习进度和策略方面提升备考效率和水平,从而提高学生考研成功率。
Figure 4. Personalized recommendations for PEE preparation
图4. 备考个性化建议
同水平学生考研去向推荐:依据学生备考进度,查看同水平学生的考研去向通常更具参考性。基于考生复习进度、个人基础等信息,将往届考生和应届考生数据映射为同一量纲空间,消除不同年份学生成绩等整体情况的差异性。通过聚类分析,找到具有同水平往届学生群体,并通过统计报考和上线情况,让学生了解到同水平学长学姐的升学去向(如图5所示),对学生的报考院校提供更具针对性的参考和建议。
Figure 5. Institution matching for PEE candidates with comparable academic standing
图5. 同水平学生考研去向推荐
利用先进的机器学习模型对多源数据进行深度分析和特征提取,预测学生在不同目标院校的考研成功率,提供个性化、实时性的备考建议。智能化辅助决策不仅提高了学生的复习效率,还增强了他们的备考信心和成功率。
3.3. 数字化教师升学智能管理
通过可视化展示和海量数据分析,优化教师升学管理过程,提高专任教师和辅导员老师对学生备考情况的监督与干预效率。通过考研学伴的智能匹配,充分利用往届升学毕业生的资源,为考生提供科学、合理的备考指导和建议。利用预训练的大语言模型,构建考生和导师双向推荐算法,实现师生双向推荐的精准匹配,助力学生考研过程最后一环,促进研究生培养资源的优化配置。
教师监督与干预:通过构建学生行为、备考进度、个人信息的可视化展示和海量数据分析(如图6所示),对于学生群体中的异常个体(复习进度远落后于报考同一院校的其他考生)和学生个体中异于历史行为习惯的情况(连续多天没有去教室或图书馆复习)进行检测和预警。专任教师和辅导员老师可实时了解全体学生和个体学生备考情况,为学生提供有针对性的指导和建议,更好地规划自己的考研计划和备考策略;对有困难的学生进行及时有针对性的干预,帮助学生度过考研焦虑期和瓶颈期。
考研学伴智能匹配:基于考研考生和往届升学毕业生行为、学业、复习规划、目标院校等多源数据基础,通过推荐模型对数据进行分析和匹配。用数字资源赋能“考研伴学”智能化匹配,充分利用本校研一学生资源,为考研学生提出科学、合理的备考指导和建议,进一步优化考试参考资料和复习材料,确定合适的研究方向和院校,提供必要的心理支持和帮助,减轻备考压力并增强自信心,同时做好后期的模拟面试与调剂指导。
Figure 6. Analytics for PEE candidate assessment on teacher’s dashboard
图6. 教师端学生考研评价分析
师生双向推荐:考生与导师的双向选择和优化匹配有助于贯彻“因材施教”原则和建立良性师生关系,促进研究生培养资源的优化配置。导师通过编辑个人简历和招生信息等详情,发布导师招生信息;学生则通过描述学习项目、和上传考研学业成绩,生成个人简介信息。通过对Qwen2-3B大语言模型进行垂域微调,构建感知语义信息和关键信息提取的考生和导师双向推荐算法,为师生双选提供较为精准的建议,并提供推荐结果的可解释性依据。基于大语言模型精排的师生推荐模型流程如图7所示。通过智能推荐,可有效避免了学生联系导师和导师约谈学生的盲目性,提升了师生双选的效率和准确性。
Figure 7. LLM based supervisor matching model flow chart
图7. 基于大语言模型的导师推荐模型流程图
通过可视化展示和大数据分析,优化教师对学生备考情况的监督与干预。项目还引入智能化的考研学伴匹配和师生双向推荐机制,利用大数据和预训练模型实现师生资源的精准匹配和优化配置,提升学生备考效果和资源利用效率。
4. 学生升学质量提升成效
高校学生高质量升学数字化建设于2022年基于我校原计算机科学与技术/人工智能学院实施,完善集成多源信息的升学数字资源平台,研发并上线考研智能决策管理系统,实现了更高质量更充分升学。具体成效如下:
(1) 使用范围广。平台和系统面向学院2023-2025届本科毕业生,高质量服务师生6000余人次。
(2) 升学率提升。在投用以来,使用单位2023届升学率(33.44%, 95% CI [29.82, 37.18] )较实施前三年平均水平(24.15%, 95% CI [22.20, 26.18] )显著提升9.29个百分点(95% CI [6.62, 12.96]; Z = 5.01, p < 0.0001),相对提升幅度为38.47%,升学率提升明显。针对典型专业和班级的升学率统计,2023届数据科学与大数据技术专业升学率达到54.89%,三个专业升学率超过32%;学生报考电子科技大学、重庆大学、西安电子科技大学、重庆邮电大学的复试成功率为100%;2024届数据科学与大数据技术专业超过46%,计算机科学与技术专业升学率超过35%;2025届数据科学与大数据技术04962101班升学率达到100%。
(3) 升学质量提升。如表1所示,不完全罗列了服务学生的考研录取院校,一大批学生升学至浙江大学、西安交通大学、中国科学技术大学、电子科技大学等人才培养契合度高的学校、专业深造。
Table 1. Partial postgraduate admission information of college students since platform implementation (alphabetically sorted)
表1. 平台和系统应用以来学院学生考研升学部分院校信息(按拼音字母排序)
高校名称 |
北京交通大学 |
北京科技大学 |
北京理工大学 |
北京邮电大学 |
电子科技大学 |
东南大学 |
复旦大学 |
哈尔滨工业大学 |
华南理工大学 |
华中科技大学 |
吉林大学 |
南京航空航天大学 |
南开大学 |
厦门大学 |
深圳大学 |
四川大学 |
武汉大学 |
西安电子科技大学 |
西安交通大学 |
西北工业大学 |
浙江大学 |
中国科学技术大学 |
中国科学院大学 |
重庆大学 |
5. 结语
本文立足教育数字化国家战略,聚焦高校考研指导痛点,通过构建“数据整合–智能决策–精准管理”三位一体的数字化赋能体系。海量多源数据的系统集成破解了信息碎片化难题,机器学习驱动的考研成功率预测与个性化建议增强了学生决策科学性,而师生双向推荐等智能管理机制则实现了资源优化配置。考研数字化平台的实施有效提升了升学率和升学质量,验证了数字化转型对高质量升学的有效支撑。该模式为高校以数字化推动育人方式变革提供了可复用的实践范式,对深化高等教育内涵式发展具有重要参考价值。
本研究的数据来源及模型构建主要基于特定单一学科与学院的学生样本,其普适性与迁移性尚需进一步验证。因此,未来的研究与实践应着力突破这一局限,将已验证的数字化赋能模式、数据整合方法及智能分析模型,拓展迁移至更多元化的学院、学科领域以及不同层次、类型的高校中进行应用与验证。
基金项目
本文得到重庆市高等教育教学改革项目“数字化赋能高校学生高质量升学途径研究”(244057)、“‘学练赛思’四维模式下新工科大数据专业实践型人才培养体系建设”(233210),重庆邮电大学教育教学改革研究项目(XJG24107、XJG24108、XWTJG2106、XJG23229、XJG24230、XJG23107、XJG23108、XJG23230)的资助。
NOTES
*通讯作者。