模糊聚类分析在大学生综合素质评定中的 应用研究
Research on the Application of Fuzzy Cluster Analysis in the Evaluation of College Students’ Comprehensive Quality
摘要: 本文首先构建模糊聚类分析的模型,以大学生德、智、体、美、劳五个方面的成绩为原始数据,将原始数据标准化,构造模糊相似矩阵,并转化为模糊等价矩阵,然后通过不同的阈值,用编网法进行聚类分析,得到大学生综合素质评定的等级,从而更有利于高校对学生等级的评定、颁发奖学金和加强相对落后学生的综合素质的教育等。
Abstract: This article first constructs a fuzzy clustering analysis model, using the scores of college students in five aspects of morality, intelligence, physical fitness, beauty, and labor as raw data. The raw data is standardized, a fuzzy similarity matrix is constructed, and transformed into a fuzzy equivalent matrix. Then, through different thresholds, clustering analysis is conducted using the network method to obtain the level of comprehensive quality evaluation for college students, which is more conducive to the evaluation of student grades by universities awarding scholarships and strengthening the comprehensive quality education of relatively backward students.
文章引用:管露露. 模糊聚类分析在大学生综合素质评定中的 应用研究[J]. 理论数学, 2025, 15(10): 12-24. https://doi.org/10.12677/pm.2025.1510245

1. 引言

在当今社会中,大学生数量急剧增多,由第七次全国人口普查数据[1]观测到:2010年大专及以上的人数由8930万增长到2020年的15,467万人,十年内大学生人数增长了大约73.2%,所以大学生的综合素质也变得日益重要。

当今,在大多数学校中学生的综合素质评定主要由德、智、体、美、劳五个指标组成,但在评定过程中还存在许多问题[2]。例如,学生在社会工作中只是掌握了一些专业方面的知识,而不会运用于具体的实践中,缺少一些社会实践的经验与能力,从而出现一些学生学习成绩非常优秀,而工作能力与之非常不匹配,这就源于大学生综合素质评定与社会脱节了。同时,也会有一些学生因为工作方面的压力或者上级领导的批评等情况,而出现心理问题和一些极端的行为,这些都与心理健康教育的缺失有着不可脱卸的关系。所以对大学生进行综合素质评价刻不容缓。

大学生的综合素质评定的意义也越来越重要[3]:对大学生自己而言,更有利于自己的全面发展,丰富自己的大学生活,更加充分地了解自己,发现自己的特长,从而对自己以后工作的方向有更清楚的定位;对教师而言,科学、完善的综合素质评定有利于教师更全面地了解自己的学生,并及时为有需要的学生提供帮助,同时还可以对自己的教学方案进行优化;对国家而言,更有利于国家综合性人才的培养,有利于为国家科技、经济注入新的动力,使国家更加繁荣昌盛。

2. 模糊聚类分析方法

2.1. 基本原理

聚类分析是统计数据分析的一门技术,是以事物的特性为基础,对其进行分类。所以,聚类分析的关键就是选取不同的指标对事物进行划分。但是往往事物之间的划分,有一些是明确的,有一些是模糊的,这种方法更加符合我们的真实生活。但是,模糊聚类分析的方法所得到的分类结果,也不能绝对准确地反映事物是属于哪一类,而是在相似程度上更加接近于哪一类[4]

2.2. 计算步骤

本模糊聚类分析具体步骤如下[5]

本文主要运用模糊聚类分析模型对大学生综合素质的各项指标进行评定,并利用MATLAB软件进行计算,可以总结出相应步骤的流程图,如图1所示。

Figure 1. Flowchart of the fuzzy clustering analysis model

1. 模糊聚类分析模型流程图

(1) 数据标准化:

设有m个要进行归类的主体,它们具有n个指标,且每个主体可由一组数据 a i1 , a i2 ,, a in 来表示它的n个特性。从而得到一组原始数据矩阵为 Z= ( z ij ) m×n 。如果数值不在 [ 0,1 ] 之间,则要进行标准化处理。本研究采用最大值标准化法,旨在消除多指标量纲差异,并通过其保序性和结果可解释性,确保标准化后的数据在[0, 1]区间内保持原始序结构,且适用于本文所选取的正向指标的综合评价[6]。其公式为:

z ij = z ij max 1jn { z ij } ,j=1,2,,n (1)

从而得到标准化的模糊矩阵。

(2) 建立模糊相似矩阵:

模糊相似矩阵 R= ( r ij ) m×m ,可采用最大最小法来确定,该方法能通过计算样本间各指标交集与并集的比值,直观地度量多维整体相似性,并天然满足模糊矩阵的数学要求,适用于综合素质的多维度综合评价[7]。计算公式为:

r ij = k=1 n ( z ik z jk ) k=1 n ( z ik z jk ) (2)

(3) 转化为模糊等价矩阵

当模糊相似矩阵不具有传递性时,需要将它转化为模糊等价矩阵,这样矩阵便具有传递性了,然后,才能进行分类。可以采用传递闭包法进行转化: R R 2 L R 2k L ,经过有限次计算,可以求得k,使 R 2k = R 2( k+1 ) ,于是 R * = R 2k ,则 R * 即为模糊等价矩阵。

(4) 聚类:

可以采用聚类分析法中的编网法[8]进行聚类,选取不同的 λ 值,使 λ 属于0与1之间,对模糊相似矩阵 R λ 截矩阵 R λ ,令 R λ 矩阵主对角线的元素全为1,分别表示15位同学,在主对角线下方,根据不同的 λ 值,使满足条件的元素所在位置全为1,不满足条件的元素所在位置不标出。然后,可以在主对角线下方标为1的元素向上引纵线,向右引横线,凡是矩阵主对角线上可以相交的点所代表的学生均属于同类,从而实现分类[9]

3. 基于模糊聚类分析的大学生综合素质评定分析

3.1. 综合素质评价指标的确定

评定大学生各项能力的指标多种多样[10],但总的来说,离不开德、智、体、美、劳这五个指标。其中“德”这一指标所表达的含义是非常多的,所以要对德这一指标进行评价,也要通过多个维度来进行衡量。本文通过政治思想、遵纪守法、集体观念、寝室卫生、社会公德这五个方面对学生德育进行多角度的评价,并选择五位与学生接触时间最多的老师对学生这五项指标进行打分,最后选取五位老师所给成绩的平均值作为最终成绩。“智”这一指标主要反映学生的学习情况,所以选择学生大学四年成绩的平均值做为智这一指标的结果。“体”这一指标,可以选择学生大学四年体测成绩的平均值作为评定结果。“美”这一指标受学生的主观影响较大,如果选择单一的指标来进行评定太过于主观臆断,不能准确地反映学生的真实情况,所以可以采用调查问卷的形式来进行评定。“劳”这一指标可以通过学生参加的实践活动与所获得的各类竞赛的奖项来进行加分评定。通过总结得到各指标的考察方式如下表1

Table 1. Structure of student quality assessment system

1. 学生素质评价体系构成

指标名称

指标构成

指标分值

政治思想

20

遵纪守法

20

集体观念

20

寝室卫生

20

社会公德

20

大学四年成绩的平均值

100

大学四年体测的平均成绩

100

调查问卷

100

实践活动

40

各类竞赛

60

评选取德、智、体、美、劳作为大学生综合素质评定的指标,并选择15名学生作为评定对象,得到各项指标的成绩作为原始数据,通过构建模糊聚类分析模型来进行分类,并做出不同阈值下聚类结果的表格。由2.2的方法可以得到15位同学关于这五项指标的成绩,见表2

Table 2. Comprehensive assessment scores of student quality

2. 学生综合素质评定得分

学生编号

指标得分

总分

1

76

95

85

95

89

440

2

92

85

87

82

76

422

3

76

70

70

76

85

377

4

87

75

93

84

82

421

5

85

99

95

92

100

471

6

92

97

98

90

97

474

7

73

74

52

67

75

341

8

79

58

89

71

68

365

9

86

87

90

98

96

457

10

83

90

76

86

90

425

11

76

86

65

73

79

379

12

82

80

87

89

95

433

13

87

95

79

86

85

432

14

61

74

81

81

94

391

15

74

76

86

85

83

404

即原始数据构成的矩阵为

Z=( 76 95 85 95 89 92 85 87 82 76 76 70 70 76 85 87 75 93 84 82 85 99 95 92 100 92 97 98 90 97 73 74 52 67 75 79 58 89 71 68 86 87 90 98 96 83 90 76 86 90 76 86 65 73 79 82 80 87 89 95 87 95 79 86 85 61 74 81 81 94 74 76 86 85 83 )

则,可以利用最大值的方法对 Z 进行标准化。首先计算矩阵 Z 的第j列的最大值 M j =max( u 1j u 2j ) ,再作变换 z ij = z ij M j ,其中 i=1,,15;j=1,,5 ,则 M 1 =92, M 2 =99, M 3 =98, M 4 =98, M 5 =100 ,因为计算量较大,所以可以利用MATLAB编程来计算,则可以得到标准化后的矩阵,为 Z

Z =( 0.83 0.96 0.86 0.97 0.89 1.00 0.86 0.88 0.84 0.76 0.83 0.71 0.71 0.78 0.85 0.95 0.76 0.95 0.86 0.82 0.92 1.00 0.97 0.94 1.00 1.00 0.98 1.00 0.92 0.97 0.79 0.75 0.53 0.69 0.75 0.86 0.59 0.91 0.73 0.68 0.94 0.88 0.91 1.00 0.96 0.90 0.91 0.78 0.88 0.90 0.83 0.87 0.67 0.75 0.79 0.89 0.81 0.89 0.91 0.95 0.95 0.96 0.81 0.88 0.85 0.66 0.75 0.83 0.83 0.94 0.80 0.77 0.88 0.87 0.83 )

3.2. 建立模糊相似矩阵

利用最大最小法计算模糊相似矩阵,且计算方法为 r ij = k=1 15 ( z ik z jk ) k=1 15 ( z ik z jk ) ,其中 z ik , z jk 表示标准化后的矩阵 Z 的第i行第k列元素和第j行第k列元素,利用MATLAB软件计算模糊相似矩阵 R ,则

R=( 1.00 0.88 0.86 0.88 0.92 0.90 0.78 0.80 0.93 0.93 0.87 0.92 0.94 0.87 0.91 0.88 1.00 0.86 0.93 0.87 0.89 0.81 0.86 0.90 0.91 0.88 0.91 0.92 0.85 0.91 0.86 0.86 1.00 0.88 0.80 0.80 0.89 0.86 0.83 0.89 0.93 0.87 0.87 0.89 0.91 0.88 0.93 0.88 1.00 0.89 0.89 0.81 0.87 0.94 0.90 0.85 0.92 0.92 0.87 0.94 0.92 0.87 0.80 0.89 1.00 0.96 0.73 0.78 0.94 0.90 0.81 0.92 0.91 0.83 0.86 0.91 0.89 0.80 0.89 0.96 1.00 0.72 0.77 0.93 0.90 0.80 0.91 0.91 0.82 0.85 0.78 0.81 0.89 0.81 0.73 0.72 1.00 0.82 0.75 0.80 0.90 0.79 0.79 0.82 0.85 0.80 0.86 0.86 0.87 0.78 0.77 0.82 1.00 0.80 0.81 0.84 0.84 0.81 0.81 0.87 0.93 0.90 0.83 0.91 0.94 0.93 0.75 0.80 1.00 0.92 0.83 0.95 0.91 0.86 0.88 0.93 0.91 0.89 0.90 0.90 0.90 0.80 0.81 0.92 1.00 0.89 0.93 0.96 0.88 0.91 0.87 0.88 0.93 0.85 0.81 0.80 0.90 0.84 0.83 0.89 1.00 0.85 0.88 0.84 0.88 0.92 0.91 0.87 0.92 0.92 0.91 0.79 0.84 0.95 0.93 0.85 1.00 0.91 0.90 0.93 0.94 0.92 0.87 0.92 0.91 0.91 0.79 0.81 0.91 0.96 0.88 0.91 1.00 0.86 0.90 0.87 0.85 0.89 0.87 0.83 0.82 0.82 0.81 0.86 0.88 0.84 0.90 0.86 1.00 0.92 0.91 0.91 0.91 0.94 0.86 0.85 0.85 0.87 0.88 0.91 0.88 0.93 0.90 0.92 1.00 )

3.3. 建立模糊等价矩阵

利用传递闭包法计算模糊等价矩阵,可以利用MATLAB软件来实现。

R =( 1.00 0.93 1.00 0.91 0.91 1.00 0.93 0.93 0.91 1.00 0.93 0.93 0.91 0.93 1.00 0.93 0.93 0.91 0.93 0.96 1.00 0.90 0.90 0.90 0.90 0.90 0.90 1.00 0.87 0.87 0.87 0.87 0.87 0.87 0.87 1.00 0.93 0.93 0.91 0.93 0.94 0.94 0.90 0.87 1.00 0.94 0.93 0.91 0.93 0.93 0.93 0.90 0.87 0.93 1.00 0.91 0.91 0.93 0.91 0.91 0.91 0.90 0.87 0.91 0.91 1.00 0.93 0.93 0.91 0.93 0.94 0.94 0.90 0.87 0.95 0.93 0.91 1.00 0.94 0.93 0.91 0.93 0.93 0.93 0.90 0.87 0.93 0.96 0.91 0.93 1.00 0.92 0.92 0.91 0.92 0.92 0.92 0.90 0.87 0.92 0.92 0.91 0.92 0.92 1.00 0.93 0.93 0.91 0.94 0.93 0.93 0.90 0.87 0.93 0.93 0.91 0.93 0.93 0.92 1.00 )

这个矩阵是关于主对角线对称的矩阵。

3.4. 聚类

利用传递闭包法计算模糊等价矩阵,可以利用MATLAB软件来实现。

选取不同的 λ 值,进行聚类:

(1) λ( 0.96, 1.00 ] R ( 0.96,1.00 ] =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 1 },{ x 2 },,{ x 15 }

(2) λ=0.96 R 0.96 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 5 , x 6 } { x 10 , x 13 } ,其余各成一类。

(3) λ=0.95 R 0.95 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,分类为 { x 5 , x 6 } { x 10 , x 13 } { x 9 , x 12 } ,其余各成一类。

(4) λ=0.94 R 0.94 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 1 , x 10 , x 13 } { x 4 , x 15 } { x 5 , x 6 , x 9 , x 12 } ,其余各成一类。

(5) λ=0.93 R 0.93 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 1 , x 2 , x 4 , x 5 , x 6 , x 9 , x 10 , x 12 , x 13 , x 15 } { x 3 , x 11 } { x 7 } { x 8 } { x 14 }

(6) λ=0.92 R 0.92 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 1 , x 2 , x 4 , x 5 , x 6 , x 9 , x 10 , x 12 , x 13 , x 14 , x 15 } { x 3 , x 11 } { x 7 } { x 8 }

(7) λ=0.91 R 0.91 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 9 , x 10 , x 11 , x 12 , x 13 , x 14 , x 15 } { x 7 } { x 8 }

(8) λ=0.90 R 0.90 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则分类为 { x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 9 , x 10 , x 11 , x 12 , x 13 , x 14 , x 15 } { x 8 }

(9) λ=0.87 R 0.87 =( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) ,则15位同学可分为一类。

由上面的不同的分类,可以得出如表3的聚类结果。

Table 3. Clustering analysis results under different thresholds

3. 不同阈值下的聚类分析结果

阈值的取值

聚类结果

λ( 0.96,1.00 ]

{ x 1 },,{ x 15 }

λ( 0.95,0.96 ]

{ x 1 },{ x 2 },{ x 3 },{ x 4 },{ x 5 , x 6 },{ x 7 },{ x 8 },{ x 9 },{ x 10 , x 13 },{ x 11 },{ x 12 },{ x 14 },{ x 15 }

λ( 0.94,0.95 ]

{ x 1 },{ x 2 },{ x 3 },{ x 4 },{ x 5 , x 6 },{ x 7 },{ x 8 },{ x 9 , x 12 },{ x 10 , x 13 },{ x 11 },{ x 14 },{ x 15 }

λ( 0.93,0.94 ]

{ x 1 , x 10 , x 13 },{ x 2 },{ x 3 },{ x 4 , x 15 },{ x 5 , x 6 , x 9 , x 12 },{ x 7 },{ x 8 },{ x 11 },{ x 14 }

λ( 0.92,0.93 ]

{ x 1 , x 2 , x 4 , x 5 , x 6 , x 9 , x 10 , x 12 , x 13 , x 15 },{ x 3 , x 11 },{ x 7 },{ x 8 },{ x 14 }

λ( 0.91,0.92 ]

{ x 1 , x 2 , x 4 , x 5 , x 6 , x 9 , x 10 , x 12 , x 13 , x 14 , x 15 },{ x 3 , x 11 },{ x 7 },{ x 8 }

λ( 0.90,0.91 ]

{ x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 9 , x 10 , x 11 , x 12 , x 13 , x 14 , x 15 },{ x 7 },{ x 8 }

λ( 0.87,0.90 ]

{ x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 9 , x 10 , x 11 , x 12 , x 13 , x 14 , x 15 },{ x 8 }

λ( 0,0.87 ]

{ x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 8 , x 9 , x 10 , x 11 , x 12 , x 13 , x 14 , x 15 }

3.5. 结果及优势分析

通过对不同 λ 值下的聚类结果进行分析,可识别出具有显著特征的学生类别,进而为差异化教育策略提供依据。当 λ( 0.95,0.96 ] 时,学生 x 10 x 13 首先聚为一类。其在德、智、美、劳四项指标上均表现优良,体测成绩处于中等偏上水平,属于“德智美劳均衡型”。该类学生可作为班级或社团骨干培养对象,鼓励参与跨学科项目与社会实践,以充分发挥其综合优势。

λ( 0.93,0.94 ] 范围内,学生 x 5 , x 6 , x 9 x 12 聚为一类。该类群体在智育、美育和劳育方面得分显著突出,各项指标均处于较高水平,可归类为“全面优秀型”。教育实践中,应优先推荐其参与国家级竞赛与创新项目,并作为奖学金及保研资格的优先考虑对象。

随着 λ 值降至 λ( 0.92,0.93 ] ,更多学生被纳入同一类别,包括 x 1 , x 2 , x 4 , x 5 , x 6 , x 9 , x 10 , x 12 , x 13 x 15 。该类学生普遍在德、智、美、劳方面表现良好,体测成绩中等,属于“主流优良型”,构成学生群体的中坚力量。建议通过导师制与团队项目进一步挖掘其潜力,促进其全面发展。

λ( 0.91,0.92 ] 时,学生 x 3 x 11 聚为一类。其在德、智、体、美四项指标上处于中等偏下水平,唯劳育表现相对较好,可界定为“劳育突出型”。针对此类学生,应加强学业与体美素养的培育,并通过劳动实践类活动增强其自信心与综合能力。

最后,在 λ( 0.87,0.90 ] 范围内,学生 x 7 x 8 最后被归入大类。其在体测与美育方面得分明显偏低,智育表现亦较弱,属于“体美薄弱型”。教育机构需为其提供个性化辅导,重点强化体能训练与美育课程,并配合心理辅导与学业支持,以提升其整体素质。

本研究通过不同的方法对学生的素质进行测评,例如,成绩的定量分析法、调查问卷法以及选择专业人士进行调查分析法等,对学生更加全方位,多角度地进行评价,使评定的结果更加接近于学生的真实水平,提高了实验结果的准确性。

参考文献

[1] 第七次人口普查. 2021年第七次全国人口普查主要数据公报[R]. 北京: 第七次人口普查, 2021.
[2] 诸峰, 陈崚, 李忠祥. 大学生综合素质的内涵与测评[J]. 当代教育论坛(管理研究), 2011, 8(6): 32-34.
[3] 刘兴旺. 高校学生综合素质评价的现状及实施对策[J]. 今日财富, 2017(9): 15-56.
[4] 徐赋. 高校学生综合素质评价体系构建及应用[D]: [硕士学位论文]. 南京: 南京理工大学, 2008.
[5] 褚佳琦. 大学生综合素质评价方法研究[D]: [硕士学位论文]. 沈阳: 东北大学, 2008.
[6] Zadeh, L.A. (1965) Fuzzy Sets. Information and Control, 8, 338-353. [Google Scholar] [CrossRef
[7] 谢季坚, 刘承平. 模糊数学方法及其应用[M]. 武汉: 华中科技大学出版社, 2002: 38-51.
[8] 魏景柱. 高校学生综合素质评价研究[D]: [硕士学位论文]. 大庆: 大庆石油学院, 2006.
[9] 赵晓燕. 基于模糊聚类分析的大学生综合素质评价方法[J]. 兰州工业高等专科学校学报, 2012, 19(2): 48-55.
[10] 陈玉君, 万秋萍, 李大治. 大学生综合素质模糊评价法[J]. 扬州大学学报(高教研究版), 2009, 22(2): 16-17.