基于奖牌学习算法的团队成员分配问题

doi:10.12677/mos.2025.142179

期刊菜单

基于奖牌学习算法的团队成员分配问题
The Team Member Allocation Problem Based on the Medalist Learning Algorithm

DOI: 10.12677/mos.2025.142179, PDF, HTML, XML,
作者: 何旺, 何胜学^*：上海理工大学管理学院，上海
关键词: 团队构建；合作学习；团队公平；多目标离散优化；启发式算法；Team Formation； Collaborative Learning； Team Fairness； Multi-Objective Discrete Optimization； Heuristic Algorithm

摘要: 高效且和谐的团队是组织成功的关键因素之一。团队的目标不仅在于完成任务，更在于促进成员能力提升和团队可持续发展。如何组建一个个人利益和群体利益均衡的团队是一项难题，因为这涉及到公平性问题。本文将团队组建视为一个多目标离散问题，并提出了一个综合考虑任务完成度、个人提升和群体公平性的优化模型。该模型旨在确保团队在尽可能保证达到任务目标的前提下，实现团队成员个人能力提升和同级成员间公平发展的均衡。通过对六个数据集进行优化求解，研究得出了最佳团队分配方案。对于一个以任务为导向的团队而言，团队规模在3到6人之间是最具效益的。这种规模的团队构成灵活多样，能够在完成任务的同时提供更多提升可能性。

Abstract: Efficient and harmonious teams are crucial for organizational success. The goals of a team extend beyond task completion to include the enhancement of members’ abilities and the sustainable development of the team. Forming a team that balances individual and collective interests is a challenge due to fairness considerations. This paper views team formation as a multi-objective discrete problem and proposes an optimization model that comprehensively considers task completion, personal improvement, and group fairness. The model aims to ensure that, while meeting task objectives, there is a balance between the personal development of team members and fairness among peers. Through optimization across six datasets, the study derives optimal team allocation strategies. For task-oriented teams, a team size of 3 to 6 members is found to be the most beneficial. This team size offers flexibility and variety, enabling task completion while providing ample opportunities for individual growth.

文章引用：何旺, 何胜学. 基于奖牌学习算法的团队成员分配问题[J]. 建模与仿真, 2025, 14(2): 593-607. https://doi.org/10.12677/mos.2025.142179

1. 引言

现代社会各领域活动所需技能知识日益复杂和多样化，自动化团队构建已不局限于人力资源[1]，在教育活动[2]、工程项目[3]、体育竞技[4]等领域也变得越来越重要。在许多情况下，团队组建的目的不仅仅是完成既定的任务目标，还在于团队成员在完成任务的过程中积累经验，实现个人和集体能力的提升，以便在新的任务出现时更好地为成员分配合适的团队。很多研究已经考虑到，团队组建的关键不仅在于成员是否有能力参与完成任务，还在于个体特征和角色是否有利于团队任务的完成和内部沟通交流。在两位能力相近的成员间做选择时，团队合作的抉择价值就大大提升了[5]。团队公平性同样是一个不能忽略的话题。一些研究在考虑组建问题时，希望团队成员在完成任务时能够达到相似的表现水平，以实现公平的目的[6] [7]。这些公平性问题的研究侧重于使组成的团队在多个属性上相似，而将公平性作为考虑因素用于分组问题的研究较少。为此，本文将构建兼顾个人利益和群体公平性的团队组建优化模型，采用一种新的元启发式算法进行求解分析，给出最优分配策略。

下面介绍团队组建问题的相关研究。很多早期的研究将团队组建问题依据成员的特征相似性和差异性划分同质性团队和异质性团队[8]。部分研究认为团队中具有同质性更能提高分组学习效果，同质性团队能促进成员之间的默契配合与高效沟通，从而提高团队的任务完成效率，同质性较高的小组在任务完成率和成员互动率方面表现优异[5]-[9]。这些研究强调了相似背景和经验的成员之间更容易达成一致，能够更高效地协作。异质性团队的优势同样得到了广泛认可，尤其在面对复杂任务时，异质性可以通过成员间的互补性，提升团队整体效能。异质性团队能够通过成员间的差异性和互补性来促进创新与协作，从而提高团队的整体效能[10]-[14]。这些研究指出，异质性带来的多样性使得团队成员能够互补短板，推动知识共享与团队创新。因此，异质性团队尤其适合解决复杂且需要创新思维的任务。在应对不同问题的分组活动时，单一追求一种模式各有利弊。综合考虑异质性和同质性的优势，一些学者开始寻求“组间同质，组内异质”的分组方式[1]-[17]。这种混合型分组方式通过在组内引入异质性，促进了成员之间的多样性互动，同时在组间保持一定的相似性，从而优化了团队的整体表现。这种综合方式被认为能够有效平衡团队协作与创新之间的矛盾，提高团队的综合效益。

除了对分组策略的研究，研究者也注意到同伴学习能够对团队和个人来带正面效益，有利于集体目标的实现和个体健康发展。在团队组建中，如何确保公平性，尤其是在成员能力存在差异时，成为了提高团队稳定性与成员学习动机的重要因素。研究表明，公平的角色分配和帮助行为能够有效提升低能力成员的参与度和学习动机，从而增强团队整体的协作氛围和学习效果[18]-[21]。合理的团队成员配置不仅能够提高团队的协作效果，还能确保团队成员在合作过程中感受到公平，进而提升其在团队中的学习动机和贡献。

还有部分研究者关注到团队的稳定发展与团队内部公平的关联性，个体间发展的公平性会对团队效益和成员学习动机产生影响。团队成员之间的公平性不仅有助于增强团队的协作氛围，还能显著提升个体的学习动力。具体而言，通过公平的角色分配和帮助行为，可以减少能力较弱成员在团队中的边缘化现象，从而激发其参与和学习的积极性[22]。此外，团队成员的能力和性格匹配度也对团队的协作效能有重要影响，合理的匹配能够促进更有效的协作关系，进而提高团队的整体表现[23]。进一步研究发现，团队内部互动公平性对团队的长期稳定和创新能力具有正向作用。公平的互动和良性竞争机制有助于激发团队成员的创造力，推动团队稳定发展。相反，缺乏公平的互动则可能削弱团队的创造力和凝聚力，影响团队的长期效能[24] [25]。因此，确保团队内部的公平性，特别是在成员角色分配和互动方式上的公平，是提升团队效能和促进创新的重要因素。

这些研究在团队组建问题上各有其独特的关注重点，但很少有研究能够在组建团队时同时兼顾个人利益和群体利益，并深入探讨二者之间的冲突性如何影响分组策略的制定。在本文的主要贡献在于：(1) 建立了一个包含三个子目标的优化模型，在达到任务目标的基础上，最大限度地保证成员个人的提升水平和成员间发展的公平性。(2) 采用改进的元启发式算法进行仿真实验优化，得出最优团队分配方案的成员数量为3至6人时，能够最有效地实现任务目标并促进个体的公平发展，带来最佳的综合效益。

2. 团队组建问题的优化模型

在前人研究中已证明团队中的高能力成员在与低能力的成员共同合作中所给予同伴帮助和指导与其能力的提升呈正相关，即使其所有技能水平均优于低能力的成员[26]。我们想创建一个团队，成员在分组学习并完成任务的同时，所有成员都能在组内学习中获得公平发展。

给定一个由N名成员组成的团队，成员根据自身能力评分高低可分为A，B，C，D四个等级。各小组中每位成员需要完成的具有k项技能要求的目标任务r可由任务需求向量表示， $r = (r_{1}, r_{2}, \dots, r_{k})$ ，向量的第m个分量是 $r_{m}$ ，其中 $m \in {1, \dots, k}$ 。默认成员的技能量满足目标任务要求技能数k，成员i原有技能向量表示为， $s_{i} = (s_{i}_{, 1}, s_{i}_{, 2}, \dots, s_{i, k})$ ，其中 $i \in N$ ，第m个技能分量为 $s_{i, m}$ ，其中 $m \in {1, \dots, k}$ 。成员i的能力值表示如下：

$a b i = \sqrt{\sum_{m = 1}^{k} s_{i, m}^{2}}$ (1)

令 $n_{g}$ 表示为小组g的成员数量；令 $U_{g}^{i}$ ， $D_{g}^{i}$ ， $S_{g}^{i}$ 分别表示为小组g中比成员i等级高、低和相同的成员集合；令 $G r a_{i}$ 为成员i的能力等级值，A等级到D等级依次为4，3，2，1；令p为 $G r a_{i}$ 和 $G r a_{j}$ 的差值的绝对值，其中 $p = {1, 2, 3}$ ；令UL_p，DL_p，SL分别为成员i向比自身等级高p级、低p级和同级的成员学习的学习量。我们设定各等级成员都可以从组内其他成员处学习，而不同等级成员的学习收益必然存在差异。因此，小组g中成员i的第m项技能的综合提升量可表示为：

$\begin{array}{l} i m p_{g, i, m} \\ = \frac{1}{n_{g} - 1} (\sum_{j \in U_{g^{i}}} (\max (0, s_{j, m} - s_{i, m}) \cdot U L_{p_{i, j}}) + \sum_{j \in D_{g^{i}}} (\max (0, G r a_{i} - s_{i, m}) \cdot D L_{p_{i, j}}) + \sum_{j \in S_{g^{i}}} (\max (0, G r a_{j} - s_{i, m}) \cdot S L)) \end{array}$ (2)

成员i完成组内学习提升后的技能向量的第m个分量表示为：

$s_{g, i, m}^{n e w} = s_{i, m} + i m p a_{g, i, m}$ (3)

令G表示各小组集合；令 $G_{g}$ 表示小组g中成员集合；令 $C_{g, m}$ 指示小组g中第m项技能的要求总量是否超过组内提升后集体的技能总量，如果超过，则值为1；否则，值为0。给定条件下我们定义以下罚函数：

$C_{g, m} = {\begin{cases} 1, if \max (0, (r_{m} \cdot n_{g}) - \sum_{i \in G_{g}} s_{g, i, m}^{n e w}) > 0; \\ 0, otherwise . \end{cases}$ (4)

$C_{g} = \sum_{m = 1}^{k} C_{g, m}$ (5)

$C = \sum_{g \in G} C_{g}$ (6)

式(4)为惩罚值的取值范围约束；式(5)和式(6)分别为小组g和所有小组的总惩罚。

小组g的整体技能水平如下：

$X_{g} = \sum_{m = 1}^{k} {(\frac{\sum_{i \in G_{g}} s_{g, i, m}^{n e w}}{r_{m} \cdot n_{g}})}^{- 1}$ (7)

令 $n_{G}$ 表示已组建的小组数量。任务完成度部分的目标函数X用团队整体技能水平表示：

$X = \frac{1}{n_{G} \cdot k} (\sum_{g \in G} X_{g}) (1 + C)$ (8)

在个人提升部分，我们希望所有成员通过学习获得整体效益提升，而不局限于某一项技能。成员技能提升量被转化为能力值的形式表述：

$a i m p_{g, i} = \sqrt{\sum_{m = 1}^{k} i m p_{g, i, m}^{2}}$ (9)

进一步定义成员平均提升水平部分，即子目标Y如下：

$Y = \frac{1}{N} (\sum_{g \in G} \sum_{i \in G_{g}} \frac{a i m p_{g, i}}{a b i_{g, i}})$ (10)

令Gra表示为等级A，B，C，D；令 $n_{G r a}$ 表示对应等级的成员数量；令 $s_{G r a}$ 表示各等级成员集合。各等级成员的能力基础不同，学习提升的空间也存在差异。当同一等级成员的提升差距缩小时，说明成员在自身等级内都获得了更加公平的提升。因此，可以定义提升公平性部分的目标函数Z：

$\bar{i m p_{G r a}} = \frac{1}{n_{G r a}} (\sum_{g \in G} \sum_{i \in s_{G r a}} a i m p_{g, i})$ (11)

$Z_{G r a} = \sqrt{\frac{1}{n_{G r a}} (\sum_{g \in G} \sum_{i \in s_{G r a}} {(a i m p_{g, i} - \bar{i m p_{G r a}})}^{2})}$ (12)

$Z = \frac{1}{4} \sum Z_{G r a}, G r a = A, B, C, D$ (13)

式(11)的含义为属于同一等级的成员的能力提升平均值；式(12)的含义为任一等级提升值的标准差。

令δ，α和β表示各子目标的调节参数，以此来衡量个人学习效益和同等级学习公平性的重要性。将式(8)，(10)，(13)组合得到一个最终的多目标函数：

$minmise F = δ X - α Y + β Z$ (14)

此外，还需要对组建小组规模和能力值上下限的进行约束。令n_ig表示成员i是否会被分配到小组g中，如果被分配，值为1；否则，值为0；令g_min和g_max分别为小组g的人数下限和上限。小组规模约束如下：

$n_{i, g} \in {0, 1}, \forall i \in N, g \in G$ (15)

$g_{\min} \leq \sum_{i \in g} n_{i, g} \leq g_{\max}$ (16)

式(15)为变量的取值范围约束；式(16)为小组g的规模范围。

设定成员能力值的约束以保证在进行相互学习前小组有达到任务目标的可能性，约束如下：

$L_{g} = \sum_{m = 1}^{k} \frac{\sum_{i \in G_{g}} s_{g, i, m}}{r_{m} \cdot n_{g}} \geq l$ (17)

其中，l为设定的常数。

3. 奖牌学习算法

3.1. 算法的基本思想

MLA的基本思想来源于群体中个体学习行为的观察。以一个班级为例，通常由几十名学生组成。学生在能力上有高低之分，其通过设定时间内多段测试评估的分数来呈现，相邻两次测试的时间间隔是相互学习时间，学习的效率随着学习时间和次数的增加会从较低的水平逐步提升到高水平。学生能力不同，学习策略也不相同。能力拔尖的学生会采用自我提升策略，从自身的经验中学习；普通学生会选择模仿学习或者借助过去的经验来学习。假定只有班级中成绩前三名的学生会采取自我提升策略学习，称他们为奖牌获得者，其余学生采用普通学生的提升策略。

该启发式算法中的个体即为优化问题的一个解，测试分数对应于目标函数值，相互学习的过程则是解的优化过程，在所有测试结束后，分数最高的个体为问题最优解。

3.2. 学习效率曲线

当个体学习时间和次数的增加，学习效率也会从低水平逐渐提高。在早期学习中，个体学习的效率较低且提升缓慢，在学习一段时间后，学习效率会迅速提升，到后期时学习效率会达到一个较高水平并趋于稳定。由此得出了学习阶段学习效率的函数[27]-[29]。令T为测试之间的学习阶段的总数；令t为其中一个学习阶段；学习效率函数 $P (t)$ 如下：

$P (t) = \frac{1}{1 + e^{\frac{2 γ}{T} (\frac{T}{2} - t)}}$ (18)

3.3. 初始可行解生成方式

在MLA中，算法的优化过程是通过更改学习特征来提高解的表现。每个个体对应优化问题的一个解，学习特征对应则对应解的一个变量。本研究将学习特征定为团队中的每个成员，即个体的成员编号的位置。

当初始可行解更好或者有一定的改进空间时，对算法的收敛效果和优化的自适应的好处越多[30]。因此，需要特别设计初始可行解的生成方式。先根据式(1)评估成员的能力值，并按照从高到低顺序为能力值最高的成员赋予编号1，能力值第二的成员赋予编号2，以此类推，给所有的成员赋予编号。编号个数即对应可行解个体长度。初始可行解的质量会影响到算法迭代的速度以及最终解的质量，所以在生成可行解时，考虑了式(15)和式(16)的约束。

具体分配方式如下：将现有成员随机排序，按随机顺序依次加入小组，直到小组满足约束。若小组能力值L_g达到l但小组人数未达下限，则继续增加成员；若人数已达上限但未达到l，剩余成员加入第二个小组。以此类推，将所有成员分配进若干个小组。所有成员分配进小组后，每位成员都有对应的小组序号，将该序号匹配进初始个体中各成员编号对应的位置，即可生成初始可行解。

3.4. 算法步骤

基于前文基本思想和优化操作构建的奖牌学习算法的实现步骤如下：

步骤1：参数初始化。按设定初始化以下参数：个体总数I；学习阶段总数T；学习效率参数γ；奖牌获得者的自我提升次数h。设置当前学习阶段 $t = 0$ 。

步骤2：初始群体生成。令 $M_{0}$ 作为初始群体，其由个体 $m_{1, 0}, m_{2, 0}, \dots, m_{i}_{, 0}, \dots, m_{I}_{, 0}$ 组成，其中 $i = 1, 2, \dots, I$ 。个体 $m_{i}_{, 0}$ 的生成，首先根据能力值排序生成个体学习特征序列，按照3.3小节的初始分配方式生成个体的学习特征对应的团队编号数值得到 $m_{i}_{, 0, u}$ ，其中 $u = 1, 2, \dots, U$ ，U为个体长度。将生成的所有 $m_{i}_{, 0, u}$ 放入对应的学习特征位置得到 $m_{i}_{, 0}$ ，即 $m_{i}_{, 0} = (m_{i}_{, 0, 1}, m_{i}_{, 0, 2}, \dots, m_{i}_{, 0, U})$ 。

步骤3：确定奖牌获得者。将阶段t中群体M_t的所有个体按照测试成绩进行排序，选择目标函数值最优的三个个体，按照从优到劣设定为金牌获得者m_G,t，银牌获得者m_S,t，铜牌获得者m_B,t，并计算普通个体学习的选择概率P_G,t，P_S,t，P_B,t。个体学习对象的选择概率按下式计算：

$P_{G, t} = \frac{F (m_{G, t})}{F (m_{G, t}) + F (m_{S, t}) + F (m_{B, t})}$ (19)

$P_{S, t} = \frac{F (m_{S, t})}{F (m_{G, t}) + F (m_{S, t}) + F (m_{B, t})}$ (20)

$P_{B, t} = \frac{F (m_{B, t})}{F (m_{G, t}) + F (m_{S, t}) + F (m_{B, t})}$ (21)

其中， $F (m_{i}_{, t})$ 为式(14)的倒数，越大则表示个体为更优的解。

步骤4：进行个体学习过程。令群体M_t中的三个奖牌获得者m_G,t，m_S,t，m_B,t利用自身经验进行h次学习，具体学习过程如下：采用均匀分布选取从个体长度区间选择一个随机位置和一个随机的团队编号，将团队编号填入该位置，并进行目标函数值比较。学习操作用函数表示为：

$m_{i, (t + 1)} = A_{h} (m_{i, t}), i = G, S, B$ (22)

普通个体从从式(26)中的三种学习方式中选择一种进行学习来改变自身学习特征k：

$m_{t}^{t o p} = {\begin{cases} m_{G, t}, if 0 \leq p_{1} \leq P_{G, t} \\ m_{S, t}, if P_{G, t} < p_{1} \leq P_{G, t} + P_{S, t} \\ m_{B, t}, if P_{G, t} + P_{S, t} < p_{1} \leq 1 \end{cases}$ (23)

$F (m_{i, t}^{b e s t}) = \max_{j = 1, 2, \dots, t} (F (m_{i, j}))$ (24)

$m_{i, t, k} = R a n (r_{c o m})$ (25)

$m_{i, (t + 1), k} = {\begin{cases} m_{t}^{top}, if 0 \leq p_{2} \leq P (t) \\ m_{i, t, k}^{best}, if P (t) < p_{2}, p_{3} \leq μ \\ R a n (r_{com}), if P (t) < p_{2}, μ < p_{3} \end{cases}$ (26)

其中，p₁，p₂和p₃均是在[0, 1]区间上服从均匀分布的随机数；μ是设定在[0, 1]上的一个任意值。式(23)的含义为个体选择从一位奖牌获得者身上学习；式(24)的含义为个体选择从过去的最好经验中学习；式(25)的含义为个体进行随机提升，从学习特征的邻域范围r_com中按照均匀分布随机选取一个值取代原位置。将经过学习阶段的所有个体组合得到下一阶段的群体 $M_{t}_{+ 1}$ 。

步骤5：终止判断，令t更新为 $t + 1$ ，如果t等于T或者 $F (m_{G}_{, t})$ 等于 $F (m_{B}_{, t})$ ，则终止运行，输出当前群体中最优个体 $m_{G}_{, t}$ ；否则，返回步骤3。

4. 实验分析

4.1. 实验数据及参数设定

本研究选择两类数据集进行实验：第一类是随机生成的数据集，模拟比实际更加多样的组建状况；第二类是现实数据集，来自Kalantzi等[30]从一所大学的三个系中收集的学生成绩信息。

(1) 合成数据集

等级分布：成员的等级与其能力值挂钩，由具体分数表示能力值。有研究认为logit-normal模拟不同等级分布更加符合成绩分布[31]。我们从不同形状的logit-normal分布中采样获得等级比例。生成的成员能力被划分为四个等级，其中D对应于[0, 1)；C对应于[1, 2)；B对应于[2, 3)；A对应于[3, 4]。三个数据集中生成的不同等级成员人数比例见表1。

Table 1. Proportions of individuals at each rank in synthetic datasets

表1. 数据集各等级人数比例

数据集	A	B	C	D
D1	24.2%	33.2%	33.8%	8.8%
D2	32.6%	37.5%	28%	1.9%
D3	37.6%	17.4%	14.8%	30.2%

技能：成员的能力由技能向量的模来表示，各分量值与成员的能力等级对应。以A，B，C，D四个能力分数区间的中点值作为均值采样得出对应的技能平均值：A = 3.52，B = 2.43，C = 1.47，D = 0.54，再采用均匀分布从能力分数区间生成各等级成员的技能向量。

学习量：假设成员均都可以向其他成员学习获得技能提升，由于小组成员存在能力等级的差异，以及Herter等[32]的研究，二人小组成员的能力存在中度差异时相互合作能获得更好的效益。向其他人学习的提升量参数设定如下：向等级高的成员学习的提升量参数UL1 = 1.2，UL2 = 0.7，UL3 = 0.5；向等级低的成员学习的提升量参数DL1 = 1.6，DL2 = 1.2，DL3 = 0.8；向同等级的成员学习的提升量参数SL = 2。

(2) 现实数据集

数据集涉及一所大学中计算机科学(CSCI)，机械工程(MENG)和数学(MATH)三个系的学生综合成绩分布，每个学生都参加了k门课程的学习。具体信息如表2所示。关于学生的技能值即各课程的分数没有明确说明，该部分数据生成方式同合成数据集一致。

Table 2. Real dataset information statistics

表2. 现实数据集信息统计

数据集	N	A	B	C	D	k
CSCI	400	167	154	77	2	3
MENG	400	149	209	40	2	3
MATH	355	144	120	74	17	3

(3) 参数设置

默认待分配成员总数 $N = 100$ ，在后续分析中将设定不同成员数量，即 $N = 50, 100, 200, 500$ ；成员技能数 $k = 3$ ；任务需求分量 $r_{m} = 2.4$ ， $r = (2.4, 2.4, \dots, 2.4)$ ；目标函数的权重参数 $α = 1$ ， $β = 1$ ；小组规模约束 $g_{\min} = 2$ ， $g_{\max} = 0.1 N$ ；小组能力约束 $l = 1$ 。

对MLA的参数设置如下：Logistic函数截取范围的半径 $γ = 6$ ；奖牌获得者学习尝试的次数 $h = 4$ ；普通个体学习策略的参数 $μ = 0.5$ ；群体大小 $M = 20$ ；学习阶段总数 $T = 500$ 。实验重复10次，每次实验采用不同的随机生成值。

4.2. 数据分析

在这一章节中，将采用设定的初始分配策略和算法对各数据集进行优化，并分析最优方案的结果。对于合成数据集的成员规模均为100 (N = 100)。

(1) 算法迭代结果

不同数据集下MLA的优化结果见图1。在整个学习阶段，所有的奖牌获得者的表现不断变优。在学习阶段初期，奖牌获得者的目标函数值存在差异，随着学习阶段的增加，目标函数值逐渐变小，在学习阶段结束时，奖牌获得者的成绩趋于一致，达到最优值。说明MLA对于解决该团队构建问题具有有效性。

Figure 1. Impact of increasing learning stages on objective values of medalists

图1. 奖牌获得者的目标函数值随着学习阶段增加的变化

(2) 不同数据集的优化结果

各数据集的目标函数优化结果如表3所示。为了更直观地分析结果，我们将X部分函数转化为设定的集体任务需求的倍数，Y部分函数转化为个人在原有能力值上的提升百分比。各数据集通过MLA的优化都能完成给定的统一任务，并获得不同程度的提升。在具体函数值上，D3优化后的目标函数值相较于其他数据集有更好的表现。因为D3数据集中A等级和D等级能力的成员占比多，虽然小组平均能力略低于其他数据集，但低等级成员在小组合作学习中有更大的提升空间，优化结果具有更大的个人平均提升比例。反之，高等级成员占比越多，个人提升空间小，分组后个人的学习提升量较小，例如D2。

此外，我们还将不同数据集的小组划分结果统计在表4上。从结果上可以看出，各数据集划分的小组规模最小的都是2人。这就意味着，在没有明确的组建规模约束下，较高能力值的成员可以选择与同等级成员合作，在达到技能要求的基础上相互学习获得提升。高等级成员也可以选择与具有提升潜力的较低能力成员合作，通过传授技能、给予指导来间接提升自身能力，同时低能力成员也能在一对一的学习中提升自身能力来达到任务要求。D1和D3中的小组最大规模比D2更大，这是因为数据集中C等级和D等级成员占比高，较小的小组规模不满足任务目标和低能力成员的学习需求，扩大小组规模能提供更多的学习思路，提升组内协作和交流，以完成集体任务。在真实数据集中也有相同的规律。在统计的结果中，通过算法优化的平均小组规模在3~6人之间。虽然也存在两人小组和大规模小组的个别情况，但3~6人规模的小组在构成上更具有灵活性和多样性，能提供更多思路。小组成员在协作和沟通上更加高效，在完成目标任务的同时能获得更好的能力提升。对于管理者而言，较小的规模更有利于小组的管理、决策制定和下达，更好处理好成员发展和团队能力之间的关系。

Table 3. Comparison of objective values for different datasets

表3. 不同数据集目标函数优化结果

数据集	目标函数值	X	Y	Z
D1	0.297	1.390	66.68%	0.204
D2	0.354	1.496	46.06%	0.146
D3	0.013	1.346	93.49%	0.205
CSCI	0.385	1.576	47.70%	0.228
MENG	0.370	1.593	48.15%	0.224
MATH	0.342	1.552	54.49%	0.243

Table 4. Statistics of team formation for different datasets

表4. 不同数据集的小组分组结果

数据集	小组数量	小组最小规模	小组最大规模	平均小组规模
D1	21	2	11	5
D2	26	2	11	4
D3	17	2	13	6
CSCI	116	2	18	3
MENG	132	2	11	3
MATH	72	2	20	5

4.3. 敏感性分析

在本节中，我们将重点关注设定的参数。分析当适当改变问题参数时，优化方案会如何变化，哪些参数对优化结果产生的影响较大的问题。

(1) 不同任务难度

本文的小组任务目标是由技能需求向量r表示，通过扩大和缩小向量的各个分量值r_m可以改变小组任务难度。随机生成的成员各项技能值在给定范围内服从随机分布，本节中我们采用分量值r_m = {2.4, 2.6, 2.8}对D1，D2，D3数据集进行研究，其他参数设定保持不变。

不同任务需求量的影响见图2。从图2(a)中可以看出，当技能需求量变大时，小组任务难度也随之提高，在保证任务完成度的前提下保证各等级内部的公平性更加困难。因为当任务难度增大时，为了达到小组目标，成员分组需要在个人发展和群体利益之间进行权衡，可能会带来个人能力提升和公平性之间的冲突问题，从而影响优化方案。图2(b)说明了任务需求量对小组数量的影响。任务难度增大时，各小组需要加入更多的成员来满足任务需求和成员间学习提升的需要，因此在分配方案中小组数量会减少，各小组分配的成员会增多。图2(c)中随着技能需求量变大，各小组的成员数量也增多同样说明了这一点。在为团队制定目标时，管理者不仅需考虑团队能力与任务难度的匹配，还应认识到目标的难易程度会影响内部不同能力成员的积极性和学习力。随着任务难度的增加，团队成员之间学习提升的需要也会增加。因此，管理者应该鼓励团队成员之间的学习和合作。合理分配团队各阶段的任务，以适配团队能力，特别是在必须完成的高难度任务时，需要进一步优化团队规模和人员配置，以提高团队能力和工作效率。

Figure 2. Impact of different task difficulties

图2. 不同任务难度的影响

(2) 不同任务向量维度

Figure 3. Impact of skill demand vector dimension variation on individual improvement and team fairness

图3. 不同技能向量维度对个体能力和公平性的影响

我们想知道当小组任务需求向量的维度有所改变时，会对优化结果产生什么样的影响。所以我们选择了需求向量维度k = {2, 4, 6}来对合成数据集进行研究。不同规模的D1数据集的优化结果如图3所示。

从图3(a)可以看出，随着需求向量维度增加，最优解决方案中个体平均能力提升量呈现下降趋势，而图3(b)中对应的各等级提升量标准差则有更优的结果。在其他数据集中实验也有相同规律。这是因为需求向量维度增加个体拥有更多技能值，小组组建会有更多选择性。同时，问题的复杂化使得个人的提升对于任务的贡献变小，群体的公平性带来的效益更有利于小组整体的发展。所以强化成员的团队意识，注重不同能力的成员的技能互补和协作学习，是作为团队管理者在面临复杂的问题时可以思考的应对方向。关注到不同能力等级成员在同伴学习中的个体发展公平性能够为团队带来更积极的效益。

(3) 子目标对优化结果的影响

本研究的目标函数值F是由三个子目标决定的。我们通过改变子目标的调节参数来研究只考虑一个子目标时的优化结果。本节中，我们更改了X部分在优化过程中计算方式，不再要求小组在达到技能需求量后继续优化使整体技能水平X达到更高，而是致力于寻找能使Y或者Z值更优的方案，即：

$X_{g} = \sum_{m = 1}^{k} max (0, r_{m} \cdot n_{g} - \sum_{i \in G_{g}} s_{g, i, m}^{n o w})$ (17)

Figure 4. Optimization results of final objective value considering different sub-objectives

图4. 考虑不同子目标的优化结果

Table 5. Impact of different parameter values on optimization results of D3

表5. 不同调节参数对D3优化结果的影响

调节参数			优化结果
δ	α	β	目标函数值	X	Y	Z
1	1	1	0.013	1.346	93.49%	0.205
1	0	0	0.164	1.667	91.41%	0.478
0	1	0	0.306	1.315	97.19%	0.517
0	0	1	0.387	0.91	86.25%	0.151

考虑所有子目标和考虑单个子目标情况下最终目标值的优化结果见图4。当我们考虑所有子目标时，优化方案具有最好的综合效益。只考虑个体提升程度时，在不同数据集中最终目标值都明显变差。这是因为只追求组内学习后个体的平均提升水平，忽视了不同等级群体发展的公平性，导致在这种情况下小组的公平受到损害。这表明，过度考虑个体的提升而不关注到个人对群体产生的影响不利于团队整体发展，团队组建和组内相互学习都需要思考，如何在个人利益与群体利益之间找到均衡点。以群体公平性作为优化目标时，对D1和D2来说团队综合效益只略差于最优方案，而D3中的目标值却是所有结果中最差的。我们将D3具体优化结果统计见表5。其中X部分和Y部分转化成与表3中相同的形式。从结果可知，当只考虑Y目标最优时，会导致群体公平产生损害，各等级内部提升量的标准差变大。只考虑Z目标最优值时，结果中的X部分出现小于1的情况，表明方案中集体能力值未达到要求，最终的目标值在所有结果中最差。出现这种情况是因为D3数据集中成员的等级分布较为极端，A等级和D等级个体占比大。只考虑群体公平时，算法在优化中会倾向于将同等级个体分到同一小组来保证群体得到相对公平的学习机会，低等级成员过多导致小组在学习后仍然没有完成任务的能力。

(4) 个体提升和群体公平的均衡

Figure 5. Relationship between individual improvement and team fairness

图5. 个体提升和群体公平的关系

在这一小节中，我们研究了个体提升程度和群体公平性之间的关系。我们通过改变两个子目标对于最终目标函数的重要性来实现。与上一小节相同，为了方便研究Y与Z之间的关系，我们采用式(17)中X部分的计算方式，只要求能够达到任务需求即可。对于子目标Y，我们分别将β固定为1，α取值为{0, 0.5, 1, 2, 3, 6, 10, 20}，以调整个体提升的重要性；而对于子目标Z，我们将α固定为1，β取值为{0, 0.5, 1, 2, 3, 6, 10, 20}，以调整群体公平性的重要性。三个合成数据集中的结果见图5，其中个体提升程度用能力提升百分比来表示。从图5(a)中可以看到，当我们以提升个体能力为主要目标时，逐步提升其重要性能带来一定程度上的提升，但会损害群体公平性。特别是对于等级分布更为分散和极端的D1和D3 ，当 $α > 3$ 时，个体的提升效果并不明显，但提升量的标准差却显著增大，导致群体的公平性更难以维持。当我们着重考虑群体公平时，随着提升量标准差的缩小，各等级内个体提升变得更加公平，尽管整体提升水平也有小幅度下降。对应的结果在图5(b)中。值得注意的是，当 $α = 1$ ， $β = 0$ 时，各数据集的群体公平性都有明显最差的结果，尽管此时个体提升量稍高于其他情况。这说明当只以考虑个体效益来组建团队时，这种个人利益的过度追求可能会损害团队整体的利益和发展。所以，在设定团队目标重要性时，我们应当采用与α相等的β值或者采用稍高于α的β值。这样在关注个体发展的前提下，能尽可能减少群体间差异，保证团队内部具有更公平发展。

5. 总结

本文研究的是兼顾成员能力提升和群体公平的团队组建问题。在给定待分配成员数量和任务目标的前提下，我们希望组建的团队能够完成统一的任务，并实现综合效益最大化。我们提出了包含三个部分的优化模型，具体包括：1) 各团队达到给定的集体技能要求阈值；2) 成员个人能力提升最大化；3) 成员在等级内部有最公平发展。我们重新设计了奖牌学习算法中的个体编码形式和初始可行解生成策略，分别在生成数据集和现实数据集中进行了算法优化，得出了最优团队组建方案。研究结果表明，对于任务导向型团队，最优团队规模为3至6人，这一规模在确保任务完成的同时，能够平衡成员的个人发展和群体公平性。此外，本文通过重新设计奖牌学习算法中的个体编码形式和初始解生成策略，在生成数据集和现实数据集上均获得了优化方案，验证了合理团队规模和人员配置对提升团队整体效能的重要性。通过对任务难度、需求向量维度、子目标权重等参数的调整，分析了这些因素对优化结果的影响。研究发现，任务难度增加时，团队规模需要相应调整，尤其在高难度任务下，增加成员数量有助于满足更高的学习要求；需求向量维度的增加使得团队组建时选择更多，导致个体能力提升的效益有所下降，但群体公平性有所改善；另外，子目标权重的调整对团队最终效益和公平性有显著影响，过度关注个体提升会损害群体公平性，而过度强调群体公平性可能导致个体能力提升效果的下降。通过这些分析，我们进一步确认，在优化团队组建时，必须在多目标之间找到合适的平衡，以促进团队的长期发展和整体效能。

本研究将问题表述成一个包含多个子目标的最优化问题，通过单目标算法求解获得最优方案。未来的研究还可以从多目标优化的视角来考虑该问题，重新设计满足多目标问题的MLA优化策略。另外，我们只对算法生成的初始分配方案中的团队规模的上限和下限加以限制，而对于优化过程和最终团队组建方案中的团队规模没有限制，这种设定会导致各个团队规模会因内部成员能力间的差别而有不同。因为我们想知道这种情况下团队会如何构成。这也导致了最优方案中最小和最大团队规模差异较大。未来可以加入团队规模的约束，来考虑对个体提升水平和发展公平性的影响。

NOTES

^*通讯作者。

参考文献

[1]	Strnad, D. and Guid, N. (2010) A Fuzzy-Genetic Decision Support System for Project Team Formation. Applied Soft Computing, 10, 1178-1187. [Google Scholar] [CrossRef]
[2]	Alberola, J.M., del Val, E., Sanchez-Anguix, V., Palomares, A. and Dolores Teruel, M. (2016) An Artificial Intelligence Tool for Heterogeneous Team Formation in the Classroom. Knowledge-Based Systems, 101, 1-14. [Google Scholar] [CrossRef]
[3]	Yu, Y., Chen, W. and Yang, J. (2017) Team Formation in Business Process Context. 2017 IEEE 21st International Conference on Computer Supported Cooperative Work in Design (CSCWD), Wellington, 26-28 April 2017, 73-78. [Google Scholar] [CrossRef]
[4]	Cao, A., Lan, J., Xie, X., Chen, H., Zhang, X., Zhang, H., et al. (2023) Team-Builder: Toward More Effective Lineup Selection in Soccer. IEEE Transactions on Visualization and Computer Graphics, 29, 5178-5193. [Google Scholar] [CrossRef] [PubMed]
[5]	Fischer, M., Rilke, R.M. and Yurtoglu, B.B. (2023) When, and Why, Do Teams Benefit from Self-Selection? Experimental Economics, 26, 749-774. [Google Scholar] [CrossRef]
[6]	Andrejczuk, E., Bistaffa, F., Blum, C., Rodríguez-Aguilar, J.A. and Sierra, C. (2019) Synergistic Team Composition: A Computational Approach to Foster Diversity in Teams. Knowledge-Based Systems, 182, Article 104799. [Google Scholar] [CrossRef]
[7]	Rubin, P.A. and Bai, L. (2015) Forming Competitively Balanced Teams. IIE Transactions, 47, 620-633. [Google Scholar] [CrossRef]
[8]	Esposito, D. (1973) Homogeneous and Heterogeneous Ability Grouping: Principal Findings and Implications for Evaluating and Designing More Effective Educational Environments. Review of Educational Research, 43, 163-179. [Google Scholar] [CrossRef]
[9]	Sanz-Martínez, L., Er, E., Martínez-Monés, A., Dimitriadis, Y. and Bote-Lorenzo, M.L. (2019) Creating Collaborative Groups in a MOOC: A Homogeneous Engagement Grouping Approach. Behaviour & Information Technology, 38, 1107-1121. [Google Scholar] [CrossRef]
[10]	Salihoun, M., Guerouate, F., Berbiche, N. and Sbihi, M. (2017) How to Assist Tutors to Rebuild Groups within an ITS by Exploiting Traces. Case of a Closed Forum. International Journal of Emerging Technologies in Learning, 12, 169-181. [Google Scholar] [CrossRef]
[11]	桑治平, 何聚厚. 基于改进细菌觅食的协作学习分组算法[J]. 计算机工程, 2017, 40(10): 137-142.
[12]	郭军, 麻环宇. 高管团队异质性、内部控制与企业技术创新[J]. 统计与决策, 2022, 38(17): 174-178.
[13]	Murphy, P.K., Greene, J.A., Firetto, C.M., Li, M., Lobczowski, N.G., Duke, R.F., et al. (2017) Exploring the Influence of Homogeneous versus Heterogeneous Grouping on Students’ Text-Based Discussions and Comprehension. Contemporary Educational Psychology, 51, 336-355. [Google Scholar] [CrossRef]
[14]	刘东. 普通高校篮球课异质分组合作教学评价方法实验研究[J]. 北京体育大学学报, 2012, 35(5): 95-98.
[15]	Kanika, C.S., Chakraborty, P., et al. (2023) Effect of Different Grouping Arrangements on Students’ Achievement and Experience in Collaborative Learning Environment. Interactive Learning Environments, 31, 6366-6378. [Google Scholar] [CrossRef]
[16]	杨桂松, 李燕婷, 何杏宇. 面向社交关系的学习小组划分策略研究[J]. 实验室研究与探索, 2021, 40(11): 208-214.
[17]	罗凌, 杨有, 马燕. 基于模糊C均值的在线协作学习混合分组研究[J]. 计算机工程与应用, 2017, 53(16): 68-73.
[18]	Freeman, S., Eddy, S.L., McDonough, M., Smith, M.K., Okoroafor, N., Jordt, H., et al. (2014) Active Learning Increases Student Performance in Science, Engineering, and Mathematics. Proceedings of the National Academy of Sciences, 111, 8410-8415. [Google Scholar] [CrossRef] [PubMed]
[19]	Coetzee, D., Lim, S., Fox, A., Hartmann, B. and Hearst, M.A. (2015) Structuring Interactions for Large-Scale Synchronous Peer Learning. Proceedings of the 18th ACM Conference on Computer Supported Cooperative Work & Social Computing, Vancouver, 14-18 March 2015, 1139-1152. [Google Scholar] [CrossRef]
[20]	徐晶晶, 胡卫平, 逯行. 在线协同学习的群体动力理论模型、案例设计与实现策略[J]. 中国电化教育, 2022(3): 81-89.
[21]	郑江波, 成芳, 甘燕红. 基于知识学习的产品研发团队成员配置研究[J]. 科技管理研究, 2019, 39(20): 135-143.
[22]	Saleh, M., Lazonder, A.W. and Jong, T.D. (2007) Structuring Collaboration in Mixed-Ability Groups to Promote Verbal Interaction, Learning, and Motivation of Average-Ability Students. Contemporary Educational Psychology, 32, 314-331. [Google Scholar] [CrossRef]
[23]	张连营, 张祥. 软件开发团队的多目标优化构建研究[J]. 计算机应用研究, 2013, 30(4): 1064-1068.
[24]	刘新梅, 李智勇, 杨晓梅, 等. 领导员工互动公平对团队创造力的影响机制: 一个被调节的中介模型[J]. 科技进步与对策, 2023, 41(7): 122-131.
[25]	陈超, 张树满. 互动公平差异、团队工作繁荣与团队创造力——基于团队自主权的调节作用[J]. 科技进步与对策, 2023, 40(18): 142-150.
[26]	Bargh, J.A. and Schul, Y. (1980) On the Cognitive Benefits of Teaching. Journal of Educational Psychology, 72, 593-604. [Google Scholar] [CrossRef]
[27]	Sheng-Xue, H. (2023) Truss Optimization with Frequency Constraints Using the Medalist Learning Algorithm. Structures, 55, 1-15. [Google Scholar] [CrossRef]
[28]	He, S. and Cui, Y. (2023) A Novel Variational Inequality Approach for Modeling the Optimal Equilibrium in Multi-Tiered Supply Chain Networks. Supply Chain Analytics, 4, Article 100039. [Google Scholar] [CrossRef]
[29]	He, S. and Cui, Y. (2023) Medalist Learning Algorithm for Configuration Optimization of Trusses. Applied Soft Computing, 148, Article 110889. [Google Scholar] [CrossRef]
[30]	Kalantzi, M., Polyzou, A. and Karypis, G. (2022) FERN: Fair Team Formation for Mutually Beneficial Collaborative Learning. IEEE Transactions on Learning Technologies, 15, 757-770. [Google Scholar] [CrossRef]
[31]	Arthurs, N., Stenhaug, B., Karayev, S., et al. (2019) Grades Are Not Normal: Improving Exam Score Models Using the Logit-Normal Distribution. Proceedings of the 12th International Conference on Educational Data Mining, Montréal, 2-5 July 2019, 143-150.
[32]	Hertel, G., Kerr, N.L. and Messé, L.A. (2000) Motivation Gains in Performance Groups: Paradigmatic and Theoretical Developments on the Köhler Effect. Journal of Personality and Social Psychology, 79, 580-601. [Google Scholar] [CrossRef] [PubMed]

为你推荐

友情链接