社群电商模式下供应链主从博弈的策略研究

doi:10.12677/ecl.2025.1461782

期刊菜单

社群电商模式下供应链主从博弈的策略研究
Research on the Strategies of the Leader-Follower Game in the Supply Chain under the Community E-Commerce Model

DOI: 10.12677/ecl.2025.1461782, PDF, HTML, XML, 科研立项经费支持
作者: 刘露萍：贵州商学院计算机与信息工程学院，贵州贵阳；刘雨喆^*：贵州大学数学与统计学院，贵州贵阳
关键词: 社群电商；供应链管理；主从博弈；协同免疫蜉蝣算法；Community E-Commerce； Supply Chain Management； Leader-Followers Game； Coevolutionary Immune Mayfly Algorithm

摘要: 随着移动互联网的快速发展和智能手机的普及，社群电商成为一种新兴商业模式。在此模式下，供应商主导的两级供应链管理成为关键问题，而主从博弈均衡策略研究对优化供应链决策具有重要指导意义。本文针对供应商与多个零售商之间的博弈关系，提出一种新型协同免疫蜉蝣算法(Coevolutionary Immune Mayfly Agorithm, CIMA)，该算法模拟了蜉蝣的飞行行为与交配过程，不仅维持了种群多样性，而且增强了粒子群算法的全局寻优能力。数值仿真结果表明，该算法具有较强的寻优能力和收敛性能，此外，基于主从博弈的均衡分析，为社群电商背景下的供应链管理提供了理论支持与实践指导，有助于降低运营成本、提升资源配置效率，从而为电商经济的可持续发展创造经济效益。

Abstract: With the rapid development of mobile Internet and the popularization of smart phones, community e-commerce is regarded as a new business model. In this model, the two-level supply chain management dominated by suppliers has become a key issue, and the research on the equilibrium strategy of the leader-follower game has significant guiding significance for optimizing supply chain decisions. This paper proposes a novel coevolutionary immune Mayfly algorithm for the game relationship between suppliers and multiple retailers. The proposed algorithm simulates the flight behavior and mating process of mayflies, not only maintaining the diversity of population, but also enhancing the abilities of seeking the global optimization result. Numerical simulation results show that this algorithm has strong optimization ability and convergence performance. In addition, based on the equilibrium analysis of the leader-follower game, it provides theoretical support and practical guidance for supply chain management in the context of community e-commerce, which helps to reduce operating costs and improve resource allocation efficiency, thereby creating economic benefits for the sustainable development of the e-commerce economy.

文章引用：刘露萍, 刘雨喆. 社群电商模式下供应链主从博弈的策略研究[J]. 电子商务评论, 2025, 14(6): 612-622. https://doi.org/10.12677/ecl.2025.1461782

1. 引言

随着移动互联网技术的快速普及，社群电商凭借其独特的社交裂变属性与用户高黏性，迅速成为电子商务领域的新增长点。以拼多多、小红书、抖音、快手等为代表的平台，通过去中心化流量分发和社群互动机制，显著降低了获客成本并提升了转化效率。然而，这种新型商业模式也对传统供应链体系提出了更高要求：碎片化订单、动态化需求以及多节点协同压力，使得供应链管理的复杂性与日俱增。在此背景下，如何通过优化供应链主从博弈关系(如平台与供应商、零售商、物流服务商之间的决策)实现成本与效率的平衡，成为推动社群电商可持续发展的关键。正如著名物流专家马丁•克里斯多夫所言：“真正的竞争不是企业与企业之间的竞争，而是供应链和供应链之间的竞争”[1]。供应链已经成为企业的生命线，只有对供应链不断地整合、优化，才能使企业在激烈的市场竞争中立于不败之地。因此，现代竞争本质是供应链间的竞争，而社群电商的爆发式增长正亟需构建与之适配的敏捷化、协同化的供应链网络。

中央办公厅、国务院办公厅2024年印发的《有效降低全社会物流成本行动方案》指出，降低物流成本对提高经济运行效率具有重要意义，对于建设高水平社会主义市场经济体制、加快构建发展新格局、推动高质量发展至关重要，这一政策的出台，凸显了供应链管理在国民经济运行中的战略地位。随着移动互联网发展与智能手机的普及，移动社群和电子商务融合出社群电商的新模式，比如：拼车群、登山群、钓友群、摄影群、跑友群、物流群等。社群电商的迅猛发展进一步放大了这一命题的现实意义——其“去中心化”特性打破了传统电商的线性供应链结构，形成了以用户社群为核心、多主体参与的网状供应链生态。陈[2]研究了在线社群电商用户购买意愿的影响因素，并指出在社群电商环境中，社群信任对于用户购买行为具有显著的影响，可归结为两个方面：一是社群特征的因素，二是其商品特征因素，其中商品的有用性和性价比对社群信任有显著的积极影响。在这一生态中，核心平台、供应商、物流企业等主体间存在显著的主从博弈关系：平台通过算法规则主导流量分配，而供应商则需动态调整产能与库存以响应社群端爆发性需求。这种博弈既可能因协同不足导致物流成本攀升，也可能因利益分配失衡削弱供应链韧性。因此，基于主从博弈理论重构社群电商供应链的决策机制(如收益共享契约、信息共享激励)，不仅契合国家降低物流成本的顶层设计，更是实现“供应链竞争”时代下多方共赢的必由之路。

随着全球化进程的加速和市场竞争的日益激烈，供应链管理的复杂性和动态性日益凸显。供应链中的各个参与主体，如供应商、制造商、分销商和零售商等，往往拥有不同的利益诉求和决策目标，彼此之间既有合作又有竞争关系。这种复杂的交互关系使得传统的集中式决策模型难以有效描述和解决供应链中的实际问题。为了使供应链获得良好的整体绩效，实现供应链节点企业的双赢或多赢，在市场竞争中获得优势，就必须对供应链进行有效的管理，对供应链节点企业进行有效的组织和协调，尽可能减少供应链节点企业间的矛盾和冲突。供应链中的节点企业在供应链中扮演着不同的角色，它们既相互合作，谋求共同的利益，又是相互独立的个体，在利益分配上是相互竞争的关系。因此，可将供应链管理中的供应商和零售商视作一个主从博弈系统，主要研究如何协调系统成员之间的关系，使得各自在实现自身利益最大化的同时又不损害其他成员的利益。如何描述供应链成员之间的复杂博弈关系，建立较为符合实际的数学模型，特别是用Stackelberg提出的主从博弈模型研究供应链问题，一直是供应链管理研究的热点，产生了大量的研究成果，见[3]-[12]。目前，关于主从博弈的求解算法层出不穷，具有代表性的有Candler和Townsley提出的约束集极点算法[13]，Bard和Falk提出的分支定界算法[14]，Kojima提出的互补旋转算法[15]等。然而，Jeroslow指出主从博弈均衡解的计算是一个NP-难问题[16]，随着博弈规模的越来越大，传统的方法面临着计算复杂度高和计算时间长的问题。群智能算法是模拟自然界的群体行为构造的一类随机优化算法。随着群智能算法应用越来越广泛，近些年来已成为人工智能、社会经济、政治及生物进化等交叉学科的研究热点和前沿之一。不同于遗传算法，群智能算法主要是模拟生物群体智能选择行为的属性，同时蕴含了生物体之间互相学习与合作的特性。随着智能算法研究的不断深入和发展，智能算法在解决NP-难问题上体现了强大的优越性，人们纷纷尝试利用禁忌搜索算法、遗传算法、粒子群算法等群智能算法求解主从博弈问题[17]-[20]。近年来，粒子群算法以及衍生的改进粒子群算法在现实生活中得到了广泛的应用，比如：B2C电商物流配送储位[21]、云计算任务调度[22]、多无人机编队[23]、移动机器人路径规划[24]、四旋翼自抗扰控制[25]等问题。

因此，借鉴生物进化理论和生物行为规律的智能算法来计算和模拟供应链管理中主从博弈均衡解的动态实现过程已成为了研究博弈问题均衡解的一种新的方法和途径。本文正是在这种思想的启发下，针对社群电商背景下供应商占主导地位的主从博弈问题，模拟生物学中蜉蝣的飞行行为与交配过程，提出了一种求解主从博弈的协同免疫蜉蝣粒子群算法，并通过数值仿真实验，说明了本文所提算法求解供应链中主从博弈均衡策略的有效性，通过分析，并为社群电商背景下的供应链管理提供了理论支持与实践指导，有助于降低运营成本、提升资源配置效率，从而为电商经济的可持续发展创造经济效益。

2. 问题描述

2.1. 假设与符号

本文考虑由供应商和若干个零售商组成的供应商占主导地位的两级供应链问题，系统假设如下：(1) 所有供应商和零售商的成本结构是完全信息；(2) 产品的零售价格 $p$ 经由市场竞争之后外生形成的固定值；(3) 仅考虑单一销售期内的单一产品；(4) 不考虑供应商和零售商的库存和物流成本；(5) 供应商和零售商都是风险中性、理性的参与者，即只要交易中获利大于等于零，双方就有兴趣参与交易。

对模型所用的符号进行如下定义：

$Π_{s i}$ ：供应商获得的与第 $i$ 个零售商相关的利润； $Π_{s}$ ：供应商获得的总利润； $Π_{r i}$ ：第 $i$ 个零售商的利润； $m$ ：供应商的单位生产成本； $v$ ：供应商回收产品的单位再利用价值； $p$ ：单位零售价； $g_{i}$ ：第 $i$ 个零售商的单位缺货损失； $D_{i}$ ：第 $i$ 个零售商的市场需求； $w$ ：单位批发价； $b$ ：单位回收价； $q_{i}$ ：第 $i$ 个零售商的订货量。

2.2. 供应商和零售商之间主从博弈模型的建立

根据以上假设和符号定义，可以得出第 $i$ 个零售商的利润表达式为：

$Π_{r i} (w, b, q_{i}) = {\begin{array}{l} p q_{i} - w q_{i} - g_{i} (D_{i} - q_{i}), & D_{i} > q_{i} \\ p D_{i} - w q_{i} + b (q_{i} - D_{i}), & D_{i} \leq q_{i}, \end{array}$

其中在缺货( $D_{i} > q_{i}$ )的情况下， $p q_{i}$ 、 $w q_{i}$ 和 $g_{i} (D_{i} - q_{i})$ 分别表示第 $i$ 个零售商的营业收入、采购成本和缺货损失；在产品剩余( $D_{i} \leq q_{i}$ )的情况下， $p D_{i}$ 、 $w q_{i}$ 分别表示第 $i$ 个零售商的营业收入和采购成本， $b (q_{i} - D_{i})$ 是第 $i$ 个零售商从供应商处获得的回购收入。

进而，可将第 $i$ 个零售商的损失写成如下形式：

$Π_{r i} (w, b, q_{i}) = p \min {q_{i}, D_{i}} - w q_{i} + b \max {q_{i} - D_{i}, 0} + g_{i} \min {q_{i} - D_{i}, 0}$ . (1)

供应商获得的与第 $i$ 个零售商相关的损失表达式为：

$Π_{s i} (w, b, q_{i}) = {\begin{array}{l} (w - m) q_{i}, & D_{i} > q_{i} \\ (w - m) q_{i} + (v - b) (q_{i} - D_{i}), & D_{i} \leq q_{i}, \end{array}$

其中 $w q_{i}$ 是供应商获得的与第 $i$ 个零售商相关的营业收入， $m q_{i}$ 是供应商的生产成本， $v (q_{i} - D_{i})$ 是再利用收益， $b (q_{i} - D_{i})$ 是回收成本。那么，供应商获得的与第 $i$ 个零售商相关的利润可表达式如下：

$Π_{s i} (w, b, q_{i}) = (w - m) q_{i} + (v - b) \max {q_{i} - D_{i}, 0},$

于是，我们可以得到供应商的总利润为：

$Π_{s} (w, b, q_{1}, \dots, q_{n}) = \sum_{i = 1}^{n} Π_{s i} (w, b, q_{i})$ . (2)

当供应商在供应链中占主导地位时，供应商先做出决策，给出批发价 $w$ 和回收价 $b$ ，零售商在得知供应商给出的价格后根据自己的利润选择订货量 $q_{i}$ 。由于供应商拥有完全信息并清楚地知道零售商是理性的参与者，其选择订货量 $q_{i}$ 时都是尽量使利润最大化，供应商在做出自己的决策时就已经考虑到这点。

由零售商的利润式(1)和供应商利润式(2)，因此基于供应商占主导地位的主从博弈模型建立如下：

$\begin{array}{l} \max_{w, b} Π_{s} (w, b, q_{1}, \dots, q_{n}) \\ s .t . 0 \leq b \leq m \leq w \leq p \\ {\begin{cases} \min_{q_{i}} Π_{r i} (w, b, q_{i}) \\ q_{i} \geq 0, i = 1, 2, \dots, n . \end{cases} \end{array}$

定义1 假设 $w, b$ 是供应商的可行决策变量，称 $(q_{1}^{*}, q_{2}^{*}, \dots, q_{n}^{*})$ 是各零售商对应于 $w, b$ 的合理反映，当且仅当 $q_{i}^{*}$ 满足下列不等式：

$Π_{r i} (w, b, q_{i}) \leq Π_{r i} (w, b, q_{i}^{*})$ ,

其中 $q_{i}$ 是第 $i$ 个零售商的任意可行决策变量， $i = 1, \dots, n$ 。

定义2 假设 $\hat{w}$ ， $\hat{b}$ 是供应商任意的可行决策变量， $({\hat{q}}_{1}, \dots, {\hat{q}}_{n})$ 是各零售商对应于 $\hat{w}$ ， $\hat{b}$ 的合理反应，则称 $(w^{*}, b^{*}, q_{1}^{*}, \dots, q_{n}^{*})$ 是主从博弈的解，当且仅当以下不等式成立：

$Π_{s} (\bar{w}, \bar{b}, \bar{q_{1}}, \dots, \bar{q_{n}}) \leq Π_{s} (w^{*}, b^{*}, q_{1}^{*}, \dots, q_{n}^{*})$ ,

同时各零售商的合理反应意味着在供应商确定自己的 $w, b$ 时，任何一个零售商都无法通过改变自己的订货数量来获得更多的利润，此时供应商和各零售商的主从博弈解表示供应商和各零售商之间已到达Nash均衡策略。

3. 协同免疫蜉蝣算法的设计

3.1. 蜉蝣算法的思想

蜉蝣算法(Mayfly Algorithm, MA)由Konstantinos和Zervoudakis [26]人于2020年提出的一种新型群智能优化算法。该算法的灵感来自于蜉蝣的飞行行为和交配过程，结合了群体智能和进化算法的主要优点。首先未成熟的蜉蝣从卵中孵化出来后，会在水中作为水生若虫生长几年。成年后它们将飞出水面，不过此时成年蜉蝣的寿命只有几天，所以这几天的终极目标就是交配，繁衍后代。正所谓“浮生一日，蜉蝣一世。”因此，在蜉蝣交配过程，每只蜉蝣在空间位置上代表了问题的可行解。MA先产生两组蜉蝣，分别代表雄性和雌性种群，蜉蝣的飞行方向是个体和社会经验的交互作用，而每只蜉蝣会调整自己的轨迹，朝着个体最优以及全局最优位置移动。

3.2. 协同免疫蜉蝣算法的设计

免疫算法具有抗原识别、免疫记忆、抗体抑制和促进的特点，是抗体对抗抗原的过程。协同免疫蜉蝣算法(Cooperative Immune Mayfly Algorithm, CIMA)将免疫记忆、自我调节机制引入到蜉蝣算法，所有粒子之间信息共享、共同进化，为了避免丢失一些适应度较差但保持较好进化趋势的粒子，借助于概率浓度选择公式来保持粒子种群的多样性。在CIMA算法的搜索空间中，每个抗体都表示问题的一个解。粒子在可行解空间搜索过程中通过其自身位置最优信息和群体位置最优信息不断地调整自己的当前位置，并向全局最优解靠拢。

在CIMA的设计中，首先随机产生两组蜉蝣，分别代表雄性和雌性种群。每个蜉蝣被随机放置在问题空间中，作为由 $n$ 维向量表示的候选解，即 $x = (x_{1}, x_{2}, \dots, x_{n})$ ，并根据预先确定的目标函数 $f (x)$ 对其表现进行评价。每只蜉蝣都具有一个速度，即 $v = (v_{1}, v_{2}, \dots, v_{n})$ ，用来定义其位置的变化。每个蜉蝣的飞行方向是个体飞行和社会飞行经验的动态交互作用。然后，每个蜉蝣都会调整自己的轨迹，朝向目前为止的个人最佳位置( $p b s e t$ )，以及迄今为止种群中的蜉蝣所获得的历史最佳位置( $g b s e t$ )。CIMA的设计主要分为以下三个部分。

(1) 雄性蜉蝣的运动

雄性会成群聚集，意味着每只雄性蜉蝣的位置是根据自己的经验和其他蜉蝣的经验来调整的。 $x_{i}^{t}$ 为在迭代次数 $t$ 时，第 $i$ 只雄性蜉蝣在搜索空间中的位置，因此可通过在当前位置上增加一个速度 $v_{i}^{t + 1}$ 来改变其位置。表述如下：

$x_{i}^{t + 1} = x_{i}^{t} + v_{i}^{t + 1} .$ (3)

考虑到雄性蜉蝣总是在离水面几米高的地方表演求偶舞蹈，于是假设他们不能飞行到很高的速度，而是不断地做出相对水平的移动。因此，一只雄性蜉蝣的速度被计算为：

$v_{i j}^{t + 1} = v_{i j}^{t} + c_{1} e^{- α r_{p}^{2}} (p b e s t_{i j} - x_{i j}^{t}) + c_{2} e^{- α r_{g}^{2}} (g b e s t_{j} - x_{i j}^{t}),$

其中， $v_{i j}^{t}$ 是第 $t$ 次迭代时，雄性蜉蝣 $i$ 在第 $j$ 维度上的速度， $j = 1, 2, \dots, D$ 。 $x_{i j}^{t}$ 为第 $t$ 次迭代时，雄性蜉蝣 $i$ 在第 $j$ 维度上的位置， $c_{1}$ 和 $c_{2}$ 是正吸引系数，分别用于衡量个人认识和种群影响的贡献。 $p b e s t_{i}$ 是蜉蝣过去最好的位置， $g b e s t$ 是蜉蝣种群进化中的历史最佳位置。 $α$ 表示雄性蜉蝣的能见度系数，控制着蜉蝣的能见范围。 $r_{p}$ 为当前位置与 $p b e s t$ 的距离， $r_{g}$ 为当前位置与 $g b e s t$ 的距离。对于个体的历史最佳位置，当迭代次数为 $t + 1$ 时，如果蜉蝣当前的位置 $x_{i}^{t + 1}$ 比 $p b e s t$ 更优，则 $p b e s t$ 被替换，否则保持不变。因此，考虑最小化问题

$p b e s t_{i} = {\begin{cases} x_{i}^{t + 1}, 如果 f (x_{i}^{t + 1}) < f (b e s t_{i}) \\ 保持不 �, 否 � . \end{cases}$

同时，种群中的雄性蜉蝣表演他们特有的舞蹈是非常重要的。因此，这些雄性蜉蝣会不断更新自身的速度，更新公式如下：

$v_{i j}^{t + 1} = v_{i j}^{t} + d \cdot r,$

其中， $d$ 是舞蹈系数， $r$ 为 $[- 1, 1]$ 之间的随机数。

(2) 雌性蜉蝣的运动

与雄性不同的是，雌性蜉蝣不会成群聚集，而是为了繁衍后代飞向雄性。为了便于区分我们使用 $y_{i}^{t}$ 为在迭代次数 $t$ 时，第 $i$ 只雌性蜉蝣在搜索空间中的位置。在当前位置上具有一个速度 $v_{i}^{t + 1}$ ，其雌性蜉蝣的位置更新公式如下：

$y_{i}^{t + 1} = y_{i}^{t} + v_{i}^{t + 1} .$ (4)

在大自然界中，蜉蝣的吸引过程是随机的，但在算法中，我们将其建模为一个确定性过程。因此，考虑最小化问题，雌性蜉蝣速度的计算如下：

$v_{i j}^{t + 1} = {\begin{cases} v_{i j}^{t} + c_{2} e^{- α r_{m f}^{2}} (x_{i j}^{t} - y_{i j}^{t}), 如果 f (y_{i}^{t}) < f (x_{i}^{t}) \\ v_{i j}^{t} + f l \cdot r, 否 � . \end{cases}$

其中 $c_{2}$ 是一个正系数， $α$ 是一个固定的能见系数。 $r_{m f}$ 雌性蜉蝣与雄性蜉蝣的距离， $f l$ 是一个随机游走系数，当雌性没有被雄性吸引时起作用。 $r$ 为 $[- 1, 1]$ 之间的一个随机数。

(3) 蜉蝣的交配

交叉算子表示两只蜉蝣的交配过程。从雄性群体中选择一个父代，再从雌性群体中选择一个。选择父母的方式和雄性蜉蝣的方式是一样的。由于交配的确定性过程，最好的雌性蜉蝣与最好的雄性蜉蝣繁殖，第二好的雌性与第二好的雄性繁殖，以此类推。交叉的结果生成两个子代，生成方式如下：

$\begin{array}{l} 子代 1 = L \cdot x + (1 - L) \cdot y \\ 子代 2 = L \cdot y + (1 - L) \cdot x, \end{array}$ (5)

其中 $x$ 是雄性父代， $y$ 是雌性父代， $L$ 是一个特定范围内的随机值。子代的初始速度设为零。

对于一个供应商和多个零售商的供应商占主导地位的两级供应链主从博弈的最优化问题，Nash均衡策略的领导者的函数值最大，跟随者的函数值最小，此时主从博弈的适应度函数值最好。在CIMA中， $x_{i}$ 表示粒子 $i$ 的位置， $f (x_{i})$ 表示粒子 $i$ 的适应度函数值， $i = 1, 2, \dots, M + Q$ 。集合 $X$ 由 $M + Q$ 个抗体组成，定义粒子 $f (x_{i})$ 到集合 $X$ 的距离如下：

$d (x_{i}) = \sum_{j = 1}^{M + Q} | f (x_{i}) - f (x_{j}) |, i = 1, 2, \dots, M + Q .$

由文献[27]我们将第 $i$ 个粒子的浓度定义如下：

$D (x_{i}) = \frac{1}{\sum_{j = 1}^{M + Q} | f (x_{i}) - f (x_{j}) |}, i = 1, 2, \dots, M + Q .$

定义基于上述粒子浓度的概率选择公式如下：

$P (x_{i}) = \frac{\frac{1}{D (x_{i})}}{\sum_{i = 1}^{M + Q} \frac{1}{D (x_{i})}}, = \frac{\sum_{j = 1}^{M + Q} | f (x_{i}) - f (x_{j}) |}{\sum_{i = 1}^{M + Q} \sum_{j = 1}^{M + Q} | f (x_{i}) - f (x_{j}) |}$ (6)

对于一般的主从博弈模型，所有局中人都会追求其自身利益的最大化，其最优解也将遵循一定的博弈规则最终达到一个动态的Nash平衡。

3.3. CIMA算法的实现步骤

本文设计的免疫粒子群算法的实现步骤如下：

步骤1：初始化雄性蜉蝣，雌性蜉蝣，设定种群规模大小为 $M$ ，最大迭代次数为 $T$ ，雄性蜉蝣的正吸引系数 $c_{1} = c_{2} = 1.5$ ，雄性蜉蝣的舞蹈系数 $d = 5$ ，雌性蜉蝣的能见系数 $α = 2$ ，随机游走系数 $f l = 1$ ；

步骤2：对种群中的每个个体进行评估，计算适应度值并排序，获取 $p b e s t$ 和 $g b e s t$ ；

步骤3：将种群随机均分为雄性种群和雌性种群，分别用式(3)和式(4)依次更新雄性蜉蝣，雌性蜉蝣位置，通过式(5)交配并产生子代，并将最优的子代粒子位置存入记忆库；

步骤4：依次检测第 $i$ 个粒子的位置 $x_{i}^{t + 1}$ ，保证所有粒子在每一次迭代中都落在可行策略集的空间内；

步骤5：随机生成 $Q$ 个粒子；

步骤6：根据粒子的概率浓度选择式(6)，从 $M + Q$ 个粒子中选取 $M$ 个粒子；

步骤7：用记忆库中的粒子代替粒子群中适应度较差的粒子，生成下一代种群 $p_{1}$ 的同时再进行下一次迭代；

步骤8：计算子代种群的适应度，分别用式(3)和式(4)依次更新雄性蜉蝣，雌性蜉蝣位置，通过式(5)交配并产生子代，并更新 $p b e s t$ 和 $g b e s t$ ，并找出新的 $g b e s t$ ；

步骤9：判断是否满足迭代终止条件？如果满足，输出最优值；否则重复执行步骤3~步骤8。

3.4. 算法性能评价

作为一种演化智能算法，免疫粒子群算法与遗传算法有很多相似之处，因此，算法性能的评价可以借鉴由文献[28]中Dejong给出的分析遗传算法性能而提出的定量方法，本文以离线性能来测试算法的收敛特性。

定义3 假设 $X_{e}^{*} (s)$ 为环境 $e$ 下策略 $s$ 的离线性能， $f_{e}^{*} (t)$ 为第 $t$ 代相应于环境 $e$ 的最佳适应度，那么有： $X_{e}^{*} (s) = \frac{1}{T} \sum_{t = 1}^{T} f_{e}^{*} (t)$ ，即离线性能是到第 $t$ 代最佳适应度的平均。

4. 数值实验

在社群电商背景下，针对一个供应链问题，可将供应商和零售商都视为一个群体从而建立主从博弈模型。假设有一个占主导地位的供应商和三个不同区域的相互独立的零售商。供应商会提供回收价格来回购零售商最终未售出的产品。模型参数假设如下： $p = 60$ ， $m = 35$ ， $v = 25$ ， $g_{1} = 1$ ， $g_{2} = 2$ ， $g_{3} = 3$ ， $D_{1} = 50$ ， $D_{2} = 20$ ， $D_{3} = 30$ 。因此该供应商占主导地位的供应链主从博弈模型建立如下：

$\begin{array}{l} max_{w, b} \sum_{i = 1}^{3} (w - 35) q_{i} + (25 - b) \max {q_{i} - D_{i}, 0} \\ s .t . 0 \leq b \leq 35 \leq w \leq 60, \\ {\begin{cases} min_{q_{1}} 60 \min {q_{1}, 50} - w q_{1} + b \max {q_{1} - 50, 0} + \max {q_{1} - 50, 0} \\ q_{1} \geq 0, \\ min_{q_{2}} 60 \min {q_{2}, 20} - w q_{2} + b \max {q_{2} - 20, 0} + \max {q_{2} - 20, 0} \\ q_{2} \geq 0, \\ min_{q_{3}} 60 \min {q_{3}, 30} - w q_{3} + b \max {q_{3} - 30, 0} + \max {q_{3} - 30, 0} \\ q_{3} \geq 0. \end{cases} \end{array}$

利用上述协同免疫蜉蝣算法(CIMA)求解该供应链主从博弈的近似Nash平衡，蜉蝣算法的参数设置如下：初始种群规模大小为，供应商(领导者)最大迭代次数设置为，零售商(跟随者)最大迭代次数为。运行6的计算结果如表1、表2所示。

Table 1. Calculation results of retailers (followers) in one leader and three followers supply chain

表1. 一主三从供应链主从博弈中零售商(跟随者)的计算结果

计算次数	计算次数	零售商的订货量 $(q_{1}, q_{2}, q_{3})$	零售商1的适应度函数值 $Π_{r 1}$	零售商2的适应度函数值 $Π_{r 2}$	零售商3的适应度函数值 $Π_{r 3}$
1	157	$q_{1} = 50.06, q_{2} = 20.02, q_{3} = 30.01$	−3.45	−1.16	−0.57
2	176	$q_{1} = 50.13, q_{2} = 20.18, q_{3} = 30.00$	−7.67	−10.44	0
3	142	$q_{1} = 51.04, q_{2} = 19.98, q_{3} = 29.69$	−61.36	1.16	17.67
4	135	$q_{1} = 49.95, q_{2} = 20.86, q_{3} = 30.05$	2.95	−49.88	2.85
5	140	$q_{1} = 49.78, q_{2} = 20.00, q_{3} = 30.02$	12.98	0	−1.15
6	150	$q_{1} = 50.00, q_{2} = 20.01, q_{3} = 29.98$	0	−5.8	1.14

Table 2. Calculation results of suppliers (leader) in one leader and three followers supply chain

表2. 一主三从供应链主从博弈中供应商(领导者)的计算结果

计算次数	计算次数	供应商的可行决策 $(w, b)$	供应商的适应度函数值 $Π_{s}$
1	230	$w = 60.057, b = 0.014$	2505.7
2	175	$w = 59.856, b = 0.025$	2485.6
3	186	$w = 59.983, b = 0.019$	2468.3
4	215	$w = 60.069, b = 0.043$	2506.9
5	202	$w = 60.021, b = 0.000$	2502.1
6	192	$w = 60.000, b = 0.028$	2500

由表1可知，三个零售商(跟随者)问题的平均迭代次数为150次，可以得到该供应链主从博弈中跟随

者的近似解为 ${(q_{1}, q_{2}, q_{3})}^{T} = {(50, 20, 30)}^{T}$ 。由表2可知，供应商(领导者)问题的平均迭代次数为200次，于是得到此供应链主从博弈中领导者的近似Nash均衡策略为 ${(w, b)}^{T} = {(60, 0)}^{T}$ 。由于Nash平衡点处所有的参与人(包括所有供应商和零售商)都无法通过单独改变可行决策来获得更大的收益，因此 ${(w, b, q_{1}, q_{2}, q_{3})}^{T} = {(60, 0, 50, 20, 30)}^{T}$ 是该供应商在供应链中占主导地位的主从博弈的Nash均衡策略。

(a) 供应商(领导者)的离线性能 (b) 第1个零售商(跟随者)的离线性能

Figure 1. Offline performance of suppliers (leaders) and retailers (followers) in CIMA

图1. CIMA中供应商(领导者)和零售商(跟随者)的离线性能

在一个供应商和多个零售商的供应商占主导地位的两级供应链主从博弈模型，供应商(领导者)具有绝对的自主权，按照利益最大化原则，供应商会使得自身的利润达到最大，作为零售商(跟随者)则是在满足供应商利益最大化的前提条件下实现自身的损失最小。由离线性能图1(b)~(d)可知，在CIMA迭代约150代时，所有的零售商(跟随者)都将使自己的损失函数趋近于0，图1(a)显示迭代次数为200时，供应商(零售商)使得自身的收益函数达到最大趋近于2500。由图1可知，在迭代计算过程中，CIMA的收敛性不依赖于初始点的选择。此外，该算法大大减少了计算时间，并且不容易陷入局部最优解，离线性能图也表明该算法收敛速度快，是有效的。此时，供应商可以实现自身收益的最大化，而零售商则能够达到自身的损失最小，因此在社群电商背景下的供应商主导的两级主从博弈中可以实现共赢，从而为社群电商背景下的供应链管理提供了理论支持与实践指导，有助于降低运营成本、提升资源配置效率，并为电商经济的可持续发展创造经济效益。

5. 总结

通过数值实验的计算和分析，可知CIMA在求解供应链管理中主从博弈的Nash均衡策略是有效的。该算法模拟了蜉蝣的飞行行为与交配过程，不仅维持了种群多样性，而且增强了粒子群算法的全局寻优能力。另外，需要指出的一个事实是，CIMA本质上是一种智能迭代算法，在算法的迭代过程中，粒子会根据观察到的博弈结果向自身的最优解进化，且同时向群体中表现最好的同伴进化。每个局中人都会根据进化过程中的个体极值和群体极值，不断地调整自己的策略，最终趋向供应链主从博弈的Nash均衡策略。这也就意味着，供应商(领导者)和零售商(跟随者)在市场的宏观调控下，最终两者的价格会达到一个动态的平衡状态。因此，借助蜉蝣粒子群算法求解博弈问题，不但可以求出Nash均衡策略，而且可以预测博弈的实现路径，模拟博弈活动的全过程，为实际经济生活中的博弈活动提供决策参考，这正是研究社群电商背景下供应链管理中博弈行为的重要意义所在。基于此，本文今后将围绕更复杂的供应链管理中的其他问题，诸如平台与供应商、平台与分销商、供应商与物流服务商两方之间或者多方之间的博弈决策行为开展进一步的研究。

致谢

本文作者非常感谢贵州大学贾文生教授提出的宝贵意见以及提供的帮助。

基金项目

本文由基金项目：贵州省科技计划项目(黔科合基础-ZK[2024]一般066)；贵州大学高等教育研究项目(703217243301)；贵州大学引进人才科研启动基金项目((2023)16)赞助。

NOTES

^*通讯作者。

参考文献

[1]	马丁·克里斯托弗. 物流与供应链管理[M]. 第5版. 何明珂, 等, 译. 北京: 电子工业出版社, 2012.
[2]	陈琳珊. 在线社群电商用户购买意向影响因素研究[D]: [硕士学位论文]. 上海: 上海财经大学, 2021.
[3]	Cachon, G.P. (2001) Stock Wars: Inventory Competition in a Two-Echelon Supply Chain with Multiple Retailers. Operations Research, 49, 658-674. [Google Scholar] [CrossRef]
[4]	Apornak, A. and Keramati, A. (2020) Pricing and Cooperative Advertising Decisions in a Two-Echelon Dual-Channel Supply Chain. International Journal of Operational Research, 39, 297-305. [Google Scholar] [CrossRef]
[5]	Sana, S.S. (2022) A Structural Mathematical Model on Two Echelon Supply Chain System. Annals of Operations Research, 315, 1997-2025. [Google Scholar] [CrossRef]
[6]	Sarkar, B. (2013) A Production-Inventory Model with Probabilistic Deterioration in Two-Echelon Supply Chain Management. Applied Mathematical Modelling, 37, 3138-3151. [Google Scholar] [CrossRef]
[7]	蒋冉. 考虑不同减排政策的港口-船公司两级供应链博弈研究[D]: [博士学位论文]. 上海: 上海交通大学, 2022.
[8]	周永务, 杨丽芳, 曹彬, 等. 考虑公平关切行为下竞争零售商的最优联合购买策略研究[J]. 中国管理科学, 2021, 29(11): 158-169.
[9]	禹海波, 李欣, 李健, 等. 基于信息收集的降低需求可变性两级供应链博弈研究[J]. 管理工程学报, 2021, 35(3): 229-240.
[10]	朱琳, 王圣东. 随机产出下两级供应链供需双方的博弈[J]. 系统管理学报, 2011, 20(6): 734-743.
[11]	Liu, B. (1998) Stackelberg-Nash Equilibrium for Multilevel Programming with Multiple Followers Using Genetic Algorithms. Computers & Mathematics with Applications, 36, 79-89. [Google Scholar] [CrossRef]
[12]	Liu, L. and Jia, W. (2021) An Intelligent Algorithm for Solving the Efficient Nash Equilibrium of a Single-Leader Multi-Follower Game. Mathematics, 9, Article 454. [Google Scholar] [CrossRef]
[13]	Candler, W. and Townsley, R. (1982) A Linear Two-Level Programming Problem. Computers & Operations Research, 9, 59-76. [Google Scholar] [CrossRef]
[14]	Bard, J.F. and Falk, J.E. (1982) An Explicit Solution to the Multi-Level Programming Problem. Computers & Operations Research, 9, 77-100. [Google Scholar] [CrossRef]
[15]	Kojima, M. (1979) A Complementary Pivoting Approach to Parametric Nonlinear Programming. Mathematics of Operations Research, 4, 464-477. [Google Scholar] [CrossRef]
[16]	Jeroslow, R.G. (1985) The Polynomial Hierarchy and a Simple Model for Competitive Analysis. Mathematical Programming, 32, 146-164. [Google Scholar] [CrossRef]
[17]	严司玮, 姚建刚, 李丰涛, 等. 基于改进粒子群算法的变电站两阶段优化选址[J]. 电力系统保护与控制, 2010, 38(5): 34-38.
[18]	Wen, U.P. and Huang, A.D. (1996) A Simple Tabu Search Method to Solve the Mixed-Integer Linear Bilevel Programming Problem. European Journal of Operational Research, 88, 563-571. [Google Scholar] [CrossRef]
[19]	刘露萍, 贾文生, 蔡江华. 协同免疫量子粒子群算法求非合作博弈Nash均衡策略解[J]. 计算机应用与软件, 2019, 36(8): 203-209.
[20]	胡广浩, 毛志忠, 何大阔. 基于两阶段领导的多目标粒子群优化算法[J]. 控制与决策, 2010, 25(3): 404-415.
[21]	刘威, 林海, 罗嫚玲. 封臣算法: 针对B2C电商物流配送中心的储位优化算法[J]. 计算机应用与软件, 2024, 41(5): 203-211+303.
[22]	陈俊仁, 郭一晶. 基于交换改进粒子群算法的云计算任务调度[J]. 计算机应用与软件, 2023, 40(6): 223-228.
[23]	张江伟. 基于粒子群算法和控制参数化的多无人机编队重构控制方法[J]. 计算机应用与软件, 2023, 40(3): 142-148.
[24]	陈高远, 宋云雪. 改进遗传算法在移动机器人路径规划中的应用研究[J]. 计算机应用与软件, 2023, 40(2): 302-307.
[25]	李茂林, 王勇杰, 介丹. 基于多种群蜻蜓算法的四旋翼自抗扰姿态优化控制[J]. 计算机应用与软件, 2022, 39(12): 328-334+349.
[26]	Zervoudakis, K. and Tsafarakis, S. (2020) A Mayfly Optimization Algorithm. Computers & Industrial Engineering, 145, Article 106559. [Google Scholar] [CrossRef]
[27]	Lu, G., Tan, D. and Zhao, H. (2002) Improvement on Regulating Definition of Antibody Density of Immune Algorithm. Proceedings of the 9th International Conference on Neural Information Processing, Singapore, 18-22 November 2002, 2669-2672. [Google Scholar] [CrossRef]
[28]	Dejong, K.A. (1975) Analysis of the Behavior of a Class of Genetic Adaptive System. University of Michigan.

为你推荐

友情链接