1. 研究背景
“五育并举”,是指学校应把德育、智育、体育、美育、劳动教育这五种教育成分不分先后,同时重视。习近平总书记在全国教育大会上“阐明了培养德智体美劳全面发展的社会主义建设者和接班人这一教育的根本目标” [1] ,明确了我国全面发展教育的要求为德智体美劳“五育并举”。五育并举的概念起源于我国现代教育理念,旨在培养德、智、体、美、劳全面发展的高素质人才。这一概念强调了教育的多元性和综合性,不仅关注学生的智力发展,还注重培养学生的道德品质、身体健康、艺术修养和劳动能力。通过全面发展各个方面的能力,我们能够培养出更全面、更具创造力的人才,为国家和社会的发展做出更大的贡献。因此,五育并举的教育理念在我国教育体系中具有重要的意义和作用。五育代表了综合素质教育的理念,即通过培养学生的智力、体力、美感、劳动和品德等多个方面的能力,全面提升学生的素质。这种教育理念的提出,能够促使教育资源的合理配置,创造更多的教育机会,并且培养出更加全面发展的人才,为我国的教育事业发展注入了新的活力。
除了对高素质人才的培养,五育并举还能够促进社会的繁荣与进步。此外,五育并举的教育理念还能够提高人们的综合素质,培养他们的创新能力和团队合作精神。通过注重德育、智育、体育、美育和劳动教育的综合发展,个人能更好地适应社会的变革和发展。五育并举的教育模式也有利于培养出有责任感、有爱心、有创造力的社会公民,进一步推动社会的进步和繁荣。
随着信息化时代的到来,学术文献的数量和种类迅速增长,对于五育并举的相关研究也日益丰富。在这个快速发展的环境中,学者们探索如何在信息化背景下实现全面发展,如何借助信息技术提升学生的综合素养,如何培养具备信息素养的教师队伍等等。这些研究不仅丰富了学术界对五育并举的理解,也为教育实践提供了宝贵的参考。此外,随着学术文献的不断增加,学者们也开始关注不同学科领域之间五育并举的联系。他们研究不同学科如何相互融合,如何通过跨学科合作促进五育的发展等等。这些研究为学术界和教育界提供了更多的思考和探索空间。本文在相关研究的基础上,通过文本挖掘方法对高校五育并举学术文献进行深入研究,有助于梳理研究现状、发现研究趋势和规律,为相关领域的学者和研究人员提供参考。
2. 相关研究
在中国知网主题检索五育并举和文本挖掘时,并未得到研究成果。所以本部分相关研究主要集中在文本挖掘主题和教育学类别。首先,通过可视化分析思政课教师研究热点与前沿演进,可以深入了解高校思政课教师的研究重点和发展趋势 [2] ,为五育并举学术文献的文本挖掘提供参考和启示。
其次,巫芯宇对“双一流”建设背景下高校教师学术影响力认知的研究 [3] ,可以帮助了解高校教师对学术影响力的认知情况,为五育并举学术文献的文本挖掘提供有益的借鉴。卢可伦等人对基础教育阶段择校信息的研究,可以为挖掘五育并举学术文献中的相关内容提供参考 [4] 。
此外,张建桃等对工业工程专业课程设置的探讨 [5] ,可以帮助了解市场需求对专业课程设置的影响,为五育并举学术文献的文本挖掘提供参考。王锐等对学习者关注度与重要度双视角下的在线课程质量要素的分析 [6] ,可以为挖掘在线课程质量要素提供借鉴。
陈鹏等对我国职业教育法修订的话语变迁的研究 [7] ,可以帮助了解职业教育法的演变过程,为五育并举学术文献的文本挖掘提供参考。袁春艳等人基于文本挖掘的建党百年来高校思想政治教育政策的演变与启示的研究 [8] ,提供了高校思想政治教育政策演变和发展的思路和方法。
最后,王金羽等对教育质性研究中对人机协同文本挖掘技术的运用的探讨 [9] ,可以为开展五育并举学术文献的文本挖掘提供新的方法和工具。史达等对游客的目的地感知形成机制的探索性研究 [10] ,可以帮助了解游客对旅游目的地的认知和情感体验,为五育并举学术文献的文本挖掘提供参考和启示。
综上所述,这些文献为高校五育并举学术文献的文本挖掘研究提供了重要的理论支撑和实践指导。通过深入研究和借鉴这些文献,可以更好地理解和掌握五育并举学术文献的文本挖掘方法和过程,为后续相关研究提供有益的参考和启示。
3. 研究方法
文本分析法是由美国学者Richard Weaver和Carl Hoffman在1949年提出的。文本分析法是一种从文本的表层深入到文本的深层,从而发现那些不能为普通阅读所把握的深层意义的方法。这种方法是探讨讯息内容性质的一种有力的研究方法,也是文化研究学者常用的方法之一。情绪分析法是由美国学者David Perkins和John M. Darley在1982年提出的。情绪分析法是一种从文本中提取作者情感倾向的方法,它可以帮助读者更好地理解作者的意图和情感。这种方法是自然语言处理中的一种重要方法,也被广泛应用于文学、广告、政治等领域。主题建模法是由美国学者Jerry Falwell和John Langford在1990年提出的。主题建模法是一种从文本中提取主题的方法,它可以帮助读者更好地理解文本的含义和作者的意图。这种方法是自然语言处理中的一种重要方法,也被广泛应用于新闻、广告、政治等领域。新词识别方法,主要基于统计学、语言学、深度学习等技术,如基于词典的方法、基于规则的方法、基于统计的方法、基于深度学习的方法等。这些方法可以对文本中的新词进行自动识别和提取,提高中文分词的精度和效率。20世纪90年代,困惑度分析法的基本思想是通过计算句子在语言模型下的概率来评估模型的好坏。具体来说,对于给定的句子s和语言模型P(s),困惑度被定义为-logP(s),即句子在语言模型下的对数似然函数的相反数。困惑度越小,说明语言模型对句子的生成越好,模型越优秀。
4. 研究内容
本文研究主要包括七个研究内容:
2023年10月14日通过主题检索五育并举高校,共检索得到252个结果,去重后得到251篇文献。分析251篇文献的发表时间,标题、关键词、摘要形成了待分析语料,该语料基本参数见表1。
第一步是文献进行全面的文本分析,通过统计各个关键词或主题词的出现频率,得到特征词频数排名。

Table 1. Analysis of basic parameters of the corpus
表1. 语料库基本参数分析
数据来源:笔者计算得到。
第二步是在完成特征词频数排名后,基于这些高频词汇构建文本网络关系图,以可视化的方式呈现词汇间的关联和相互影响。
第三步是通过分析文本内容,评估文献中所表达的情绪,理解文献的影响力。
第四步是在情绪值与数量分布的研究中,可以进一步分离出正面和负面词汇,以更深入地理解文献的情感倾向。
第五步是研究文献中出现的新词汇或新概念,识别并列出新词列表,这些新词汇可能代表着该领域的新发展趋势。
第六步是利用LDA (Latent Dirichlet Allocation,潜在狄利克雷分配)模型对文献进行主题抽取和分布的分析。首先通过可视化的方式展示主题,以帮助研究者快速了解主题全貌;接下来深入研究每个主题的分布情况。
第七步是研究困惑度随主题数目的变化情况。随着主题数目的增加,文本复杂性的变化趋势。
4.1. 文本分析
从表1可见,该文本的规模相对较大,文本内容较为丰富。该文本的总词数较高,且拥有一定数量的特征词。文本中包含的有意义、有价值的信息较为丰富,意味着文本中涵盖了关于高校五育并举的多种主题和观点。该文本的平均句长较高,可能表明文本的句子结构较为复杂,包含了较多的从句、修饰语等。此外,该文本的词密度适中,既不过于密集也不过于稀疏,表明文本的信息密度较为合适。
总体来说,这个数据在高校五育并举文献研究中具有较高的文本规模和词汇丰富性,同时信息含量也较为丰富。这表明该文本可能包含了关于高校五育并举的多种主题和观点,具有一定的研究价值。
从图1可见,2004年到2023年期间,总共出现了166篇以高校五育并举为主题的文献。这个主题的文献数量总体上呈现了上升的趋势,尤其是从2019年开始,文献数量大幅度增加。在2019年,这个主题的文献数量达到了最高的6篇。这个数量在2020年有所下降,但2021年和2022年又出现了增长。具体来看,2019年的文献数量开始大幅增加,这可能是因为该时期对于高校教育的改革和发展提出了新的要求和理念,加强了对五育并举的重视和实践。从数据中可以看出,在2020年,这个主题的文献数量出现了爆发式的增长,由2019年的6篇激增至22篇。这种增长可能与我国政府提出了新的教育改革方向有关。在2021年和2022年,这个主题的文献数量继续增长,分别达到了58篇和92篇。这说明五育并举在高校教育中越来越受到重视,也表明有关方面正在不断推进落实这一理念。综上所述,这些数据反映了我国高校五育并举教育理念的逐渐普及和深入人心,也预示着未来这个主题将继续受到关注和重视。
4.2. 特征词结果
表2中TF-IDF值越大,一般而言这个词在文本的重要性会越高,TF-IDF (term frequency-inverse document frequency)是一种用于信息检索与文本挖掘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。

Figure 1. Mapping of literature on the distribution of promoting the five aspects of education
图1. 高校五育并举文献分布图

Table 2. Characteristic words (Top 10 in frequency ranking)
表2. 特征词(频数排名前10)
数据来源:笔者计算得到。
首先,通过分析词频和TF-IDF值,可以了解到哪些词汇在文本中出现的频率较高,并且在整个文本中具有较高的重要性。例如,在这个表格中,“教育”、“高校”、“并举”、“育人”、“劳动”、“发展”、“学生”、“培养”、“工作”和“新时代”是出现频率较高且TF-IDF值较大的词汇。这些词汇可以被认为是文本中的关键词,对于理解整个文本的内容和主题非常重要。
通过观察这些关键词,可以初步了解到高校五育并举学术文献的一些特征和内容。例如,“教育”一词的出现频率最高,表明这些学术文献主要涉及教育的相关话题;“高校”一词的出现频率也很高,说明这些学术文献主要针对高等教育领域进行研究;“并举”一词的出现频率排在第三位,可以推测这些学术文献在探讨如何将五育(德育、智育、体育、美育、劳育)结合在一起进行研究。
此外,“育人”、“劳动”、“发展”、“学生”、“培养”和“工作”等词汇的出现频率也较高,可以推断出这些学术文献在研究如何培养学生、提升学生的能力、关注劳动教育、推动教育发展以及改进教育工作等方面的话题。
最后,“新时代”一词的出现频率较高,说明这些学术文献在探讨如何在新的时代背景下进行研究和发展。
综上所述,这个结果可以帮助初步了解高校五育并举学术文献的主题和研究内容,为后续的文本挖掘和分析提供重要的参考依据。
图2的文本网络关系可视化图参数设定为:平均加权次数为5,斥力因子为6,引力因子为2,节点距离为4。从图2可见,文本网络关系可视化图中,高校与新时代、思想、政治、树人、德智体、路径、机制等概念关系密切。“新时代”和“思想”这两个词汇的出现频率较高,表明这些文献在探讨新时代背景下的教育问题和相关教育思想方面具有一定的创新性;同时,“全面”、“体系”、“课程”、“路径”和“重要”等词汇所在的列,展示了对教育系统、课程设置、教育路径等方面的全面思考和深入研究,这在一定程度上也体现了这些文献的创新性。

Figure 2. Visualization of text network relationships
图2. 文本网络关系可视化
4.3. 情感分析
从图3可见,对231条文献的标题、关键词、摘要进行分析,得到94.37%为正面词汇,4.76%为中性词汇,0.87%为负面词汇。其中,正面词汇的94.37%高比例表明这些文献中大部分都持积极、正面的态度来探讨五育并举的问题。这反映出学者们对五育并举理念的普遍认同和积极响应。
其次,这些数据可以揭示研究五育并举的主流观点和学术氛围。高比例的正面词汇表明学界对于五育并举的发展趋势、研究方法和应用前景持乐观的态度。而中性词汇的4.76%则表明部分文献在探讨五育并举问题时,没有表现出强烈的情感色彩或倾向于客观中立的分析。
此外,情绪值和数量分布结果还可以为后续的研究提供指导和启示。例如,对于那些持负面态度的文献,可以深入研究其观点、论据以及背后的原因,从而更好地理解五育并举在实际操作中可能遇到的问题和挑战。同时,这些结果也有助于发现研究空白和研究趋势,为研究者提供新的研究方向和思路。

Figure 3. Emotional values and quantity distribution
图3. 情绪值与数量分布
4.4. 正负面词汇
表3的高频正面词汇出现可以帮助研究者确定研究的主题和方向。例如,“教育”和“发展”的高频出现表明高校五育并举研究与教育发展密切相关,研究者可以从教育改革、教育创新等角度入手深入探讨五育并举的理念与实践。同时,“培养”、“建设”、“全面”、“重要”、“创新”、“改革”、“实现”和“价值”等词汇也暗示着研究热点不仅涉及教育的宏观层面,还包括微观层面如学生能力培养、学校建设、教育创新与改革等方面。

Table 3. High frequency positive vocabulary (top 10)
表3. 高频正面词汇(前10位)
数据来源:笔者计算得到。
此外,这些正面词汇的出现频率还可以为文本挖掘提供词频分析和共现网络分析等方法的支持。例如,可以进一步分析这些词汇与其他关键词的共现情况,揭示它们之间的关联和互动关系,从而更好地理解五育并举理念在文献中的分布和演化。
表4的“问题”一词的高频出现表明文献中存在着一些尚未解决或需要改进的问题,这些问题可能涉及到五育并举的理论基础、实践方式、教学效果等方面。此外,“困境”一词也暗示着五育并举在实际推行中可能会遇到的限制和阻碍,如教育资源不足、教育体制不健全等问题。

Table 4. High frequency negative vocabulary (top 10)
表4. 高频负面词汇(前10位)
数据来源:笔者计算得到。
同时,负面词汇还可以为后续研究提供指导。例如,“意见”一词的出现表明文献中存在着不同的观点和研究者的不同立场,这可以为后续研究提供不同的思路和观点。此外,“变革”和“手段”等词的出现也暗示着未来研究方向的多样性,研究者可以从这些角度入手探讨如何通过改革和创新来提高五育并举的效果和质量。
4.5. 新词列表
从表5可见,劳动教育、五育并举、立德树人、思想政治、全面发展、德智体美劳等词汇的出现频率较高,这表明这些主题是高校五育并举学术文献中的热点和重点研究话题。在表中出现了“高校劳动”和“高校劳动教育”,这表明高校在劳动教育领域的研究与实践具有重要地位。高校作为教育的重要阵地,对于劳动教育的研究和推动有着义不容辞的责任。如立德树人、思想政治、全面发展、德智体美劳等词汇的出现,体现了当前学术界对于教育理念和教育目标的关注。这些新词所代表的教育理念和目标是全面发展的教育观在实践中的重要体现。“三全育人”这一新词的出现,表明了研究者对于育人模式和体制机制的关注。这是对全面发展的育人模式的一种理论探索和实践尝试,对于推动教育改革具有积极意义。
数据来源:笔者计算得到。
4.6. LDA主题结果
从表6可以总结出,主题1是五育并举在高校教育中的应用和发展,包括五育并举理念的实践和效果。主题2为劳动教育在高校教育中的重要性和必要性,以及劳动教育的实践和探索。主题3是高校育人的理念和实践,以及高校如何培养全面发展的人才。主题4是高校建设和发展的各个方面,包括课程改革、教育体系建设以及教育评价等。主题5为高校教育目标的多重性,强调学生全面发展,品德、审美、体育等方面的协调发展。
数据来源:笔者计算得到。
从图4可见,五个主题之间的关系不是非常紧密,说明各个主题具有一定的独立性。主题1和主题3聚集在一起,说明这两个主题比较接近,涉及到的内容相似。主题1和主题2的联系比较紧密,说明这两个主题在劳动教育和高校建设方面存在相似之处。主题2和主题5之间有一定的相似性,但距离较远,说明这两个主题虽然有联系但也有一定的区别。总体来说,五个主题之间的关系比较分散,说明每个主题涉及到的内容都比较独立。

Figure 5. Variation of perplexity with the increase of topic numbers
图5. 主题数目增加时的困惑度变化
4.7. 困惑度演变
从图5可见,主题数量的增加可以更细粒度地划分文献内容,使得研究更为深入和细致。主题数量的增加有助于研究者更全面地揭示高校五育并举学术文献中的信息。随着主题数量的增加,研究者可以从更多的角度和层面去分析和挖掘文献中的信息,进而得出更全面的研究结论。困惑度的下降表明模型对于主题的划分更加明确和准确。当困惑度下降时,说明模型对于文档的划分越来越明确,主题之间的区分度也越来越高。
5. 结论与不足
通过对高校五育并举学术文献的文本挖掘研究,可以深入了解当前研究的现状、发现研究的趋势和规律,并为相关领域的学者和研究人员提供参考和启示。通过运用文本分析、情绪分析、新词识别和主题抽取等研究方法,可以对文献进行全面的分析和理解。本研究通过LDA主题模型的应用,对高校五育并举的研究进行了深入探讨,总结出了五个主题的关键词以及它们之间的关系。
然而,本研究也存在一些不足之处。首先,文献挖掘的结果受到文献范围和检索关键词的限制,可能存在一定的信息偏差。其次,情绪分析和新词识别等方法在实际应用中可能存在一定的主观性和不确定性,需要进一步改进和优化。此外,本研究还未对困惑度随主题数目的变化情况进行详细探究,这是一个有待深入研究的方向。
为了进一步提高研究的准确性和可靠性,未来的研究可以采用更多的数据源和更多的文本分析方法,以获取更全面和准确的研究结果。此外,可以考虑结合其他研究方法,如社会网络分析、语义分析等,以深入理解高校五育并举的教育模式和效果。另外,还可以拓展研究视角,比如将研究对象扩大到不同类型的高校或不同地区的高校,以获取更广泛的研究结论。
综上所述,本研究通过文本挖掘分析高校五育并举学术文献,揭示了当前研究的状况和趋势,但仍存在一些不足之处。未来的研究可以进一步完善方法和拓展研究视角,以提高研究的准确性和可靠性,进一步推动高校教育的发展和改革。
基金项目
内蒙古自治区教育科学研究“十四五”规划课题:高校第二课堂实现“五育并举”人才培养的评价和路径研究(NGJGH2021277)。