1. 引言
在信息技术和移动互联网的推动下,直播电商已成为中国零售业增长的重要引擎。根据艾瑞咨询测算,2023年中国直播电商市场规模达到4.9万亿元,同比增速约35.2%,并预计2024~2026年年复合增速将保持在18%左右[1]。与此同时,网经社电子商务研究中心报告显示,2023年直播电商交易规模49,168亿元,同比增长40.48%,用户人均年消费额达8660元[2]。如此巨大的市场体量与高速增长背后,供应链协同问题日益凸显:包括高退货率、订单响应延迟、信息不对称导致的信任缺失等,都成为制约行业可持续发展的关键瓶颈。
传统静态博弈模型[3]-[5]虽能刻画平台与供应商之间的策略选择,但难以反映在“直播 + 供应链”这一高度动态、互动频繁的场景下产生的渐进式调整过程。随着双方基于历史行为不断学习并适应环境,合作关系往往呈现出路径依赖和多稳态的特征,而这些恰恰是静态均衡分析所无法捕捉的。
为此,本文引入演化博弈理论,演化博弈理论最早由英国生物学家约翰·梅纳德·史密斯和乔治·普赖斯在1973年左右提出,用以解释生物种群中策略如何在繁衍竞争中“自然选择”而演化出稳定模式。与传统静态博弈不同,它不假设参与者拥有完备信息或一次性地理性地选择最优策略,而是将策略视为“种群中个体的特征”,通过“复制动态方程”描述优势策略因获得更高收益(适应度)而在种群中比例上升的过程。当前,演化博弈已被广泛应用于供应链系统的研究中。盖兵[6]构建了农产品电商、物流企业和地方政府的演化博弈模型,发现各方参与农产品冷链物流体系建设的成本、收益和额外经济支出对博弈行为产生影响,提出相关政策建议以改善农产品物流现状。危小超[7]基于反合作行为演化博弈模型,构建了随机尖点突变模型,并发现弹性指标对平台稳健性具有重要影响,该研究为平台运营提供了重要的理论和实践指导。付淑换[8]发现政府、直播平台和国货品牌的有限理性构成三方演化博弈模型,其策略选择取决于行业发展阶段和环境条件。Bai Qun [9]针对农村电商的信用监管问题,通过演化博弈模型探讨不同监管和定价策略对交易双方的影响,并提出相应监管建议。这项研究提供了新的信用监管方法,有助于建立健全农村电商信用监管机制。Du Jun [10]构建了经典演化博弈模型和随机演化博弈模型,对线上供应链金融中的合作与竞争问题进行了分析,其结论为电商企业与银行合作构建线上供应链金融提供了指导。Zhou Fuli [11]构建了由CBEC平台和商家组成的演化博弈模型,研究CBEC采纳区块链技术的问题。结果显示,当平台利润较小或信息收集成本高时,平台和商家更倾向于采用区块链技术。Qiu Yiwen [12]以中国“双循环”政策为背景,探讨政府行为对跨境电商B2B出口企业的影响。通过LDA主题模型分类政策,建立了政府与企业的演化博弈模型。
本文构建了电商平台与供应商(包括大型与小型供应商)之间的动态协同模型。在该模型中,双方分别以“合作”或“背叛”两种策略进行重复博弈,并通过复制动态方程刻画有限理性条件下各自策略的演化过程。我们进一步采用雅可比矩阵对模型所对应的均衡点进行局部稳定性分析,揭示合作收益系数和供应商结构比例等关键参数对系统演化方向的决定性影响。
本文的主要贡献包括:首次将异质性供应商(大型与小型)纳入直播电商平台——供应商博弈框架,构建包含合作收益、成本与违约损失的动态协同模型;利用复制动态与雅可比矩阵方法,严格证明了系统存在“全合作”和“全不合作”两类演化稳定均衡,并揭示了“鞍点”状态下的非对称剥削局面;基于Python的高分辨率仿真与敏感性分析,展示了在不同初始信任度、合作收益系数和供应商占比下系统的演化路径与相变临界。
通过上述研究,本文不仅丰富了供应链协同与演化博弈的理论视角,也为直播电商时代平台与供应商之间的合作机制设计提供了量化依据和实践指导。
2. 问题描述与模型分析
2.1. 问题描述
基于理性经济人理论,理性经济人首要目标是保证和寻求自身利益最大化。本文的研究对象是由一个电商企业和供应商组成的两级供应链,电商平台和供应商作为理性经济人,这意味着他们在供应链中会权衡所获得的利益与所付出的成本,来寻求自身利益最大化,如果长期合作获得的利益少,且要付出较大的损失,必然会打击电商平台和供应商合作的积极性,出现不合作的结果。电商平台和供应商在供应链中都有关于收益和成本的考虑,由此决定了双方既博弈又合作的关系,如何找到一个双方稳定状态,使供应链最大化,是二者合作的关键问题。在此基础上,电商平台和供应商都会采取合作或者不合作两种策略。当两个主体都采取合作策略时,双方不仅会获得正常情况下的收益,还会获得采取合作策略带来的额外的收益;当一方采取合作策略,而另一方采取不合作策略时,想要合作的一方会产生没有合作成功而带来的损失。例如电商平台想合作,最终没有合作,可能会有损电商平台的企业形象,同理,供应商想合作,最终没有合作,可能会造成供应商的声誉下降和产品供过于求,不想合作的一方会带来额外的收益;当双方都采取不合作策略时,仅仅只能获得正常市场下的收益。维持电商平台和供应商的长期稳定状态,就必须分析他们在供应链中的博弈与合作策略选择。因此,本文运用演化博弈的方法,分析博弈参与者——电商平台和供应商的策略选择稳定点。
2.2. 模型构建
基于上述的问题描述,本文建立该问题的数学模型,相关符号说明如表1所示。
Table 1. Description of relevant symbols
表1. 相关符号说明
符号 |
含义 |
|
电商平台在正常情况下收益 |
|
供应商在正常情况下收益 |
|
电商平台采取合作策略时收益系数 |
|
大型供应商的合作收益系数 |
|
小型供应商的合作收益系数(
) |
|
电商平台为了合作所付出的成本 |
|
大型供应商为合作付出的成本 |
|
小型供应商为合作付出的成本 |
|
供应商合作,而电商平台不合作时,电商平台所获收益 |
|
电商平台合作,而供应商不合作时,供应商所获收益 |
|
当电商平台合作,供应商不合作时,电商平台造成的损失 |
|
当大型供应商合作,电商平台不合作时,供应商造成的损失 |
|
当小型供应商合作,电商平台不合作时,供应商造成的损失 |
|
大型供应商在总供应商中的比例(
) |
|
供应商群体中采取合作的比例(供应商群体中采取不合作的比例) |
|
电商平台群体中采取合作的比例(电商平台群体中采取不合作的比例) |
由上述表1,可以得到如表2所示的博弈矩阵。
Table 2. Payoff matrix of the game between the e-commerce platform and suppliers
表2. 电商平台和供应商的博弈收益矩阵
|
大型供应商合作 |
小型供应商合作 |
供应商不合作 |
平台合作 |
|
|
|
平台不合作 |
|
|
|
2.3. 模型求解及均衡解的稳定性分析
2.3.1. 供应商的复制动态方程
设大型供应商占比为
,则供应商群体的期望收益需按类型加权计算。由此可得大型供应商采取合作策略下的期望收益为
,大型供应商采取不合作策略下的期望收益为
,小型供应商采取合作策略下的期望收益为
,小型供应商采取合作策略下的期望收益为
,整体供应商平均收益为
,即:
(1)
(2)
(3)
(4)
(5)
由于供应商为有限理性,其策略需要通过一些机制不断地学习进行调整,最终达到演化稳定状态,供应商会选择“合作”策略的概率y的演化博弈复制动态方程为:
(6)
当
,
以及
时,
,且当
时,无论y取何值,
始终为0,说明此时它处于演化稳定状态。当
,
,即
是唯一的演化稳定策略,即供应商会选择合作策略。当
,
,即
是唯一的演化稳定策略,即供应商会选择不合作策略。
2.3.2. 电商平台的复制动态方程
设电商平台采取合作策略下的期望收益为
,采取不合作策略下的期望为
,平均期望收益为
,即:
(7)
(8)
(9)
由于电商平台为有限理性,其策略需要通过一些机制不断地学习进行调整,最终达到演化稳定状态,电商平台会选择“合作”策略的概率x的演化博弈复制动态方程为:
(10)
当
,
以及
时,
,且当
时,无论x取何值,
始终为0,说明此时它处于演化稳定状态。当
,
,即
是唯一的演化稳定策略,即电商平台会选择合作策略。当
,
,即
是唯一的演化稳定策略,即电商平台会选择不合作策略。
2.3.3. 稳定性分析
为了得到均衡点,联立两个复制动态方程(4)和(8),令其均为0,求解联立方程组可得:
,
,
,
,
,
当
时,可得到
、
、
、
、
,由复制动态方程可以得到雅各比矩阵为
(11)
雅各比矩阵行列式
为
(12)
其中
,
矩阵的迹
为:
(13)
由此得到下列系统均衡点稳定性分析表3。
Table 3. Stability analysis of system equilibrium points
表3. 系统均衡点稳定性分析表
坐标 |
|
符号 |
|
符号 |
|
|
+ |
|
- |
|
|
- |
|
+ |
|
|
- |
|
+ |
|
|
+ |
- |
- |
|
|
- |
0 |
|
Figure 1. Phase diagram of equilibrium points in the evolutionary game
图1. 演化博弈均衡点相位图
(a) (
)
(b) (
)
Figure 2. Evolutionary game diagram with varying
and fixed
,
图2.
变化,
和
不变演化博弈图
(a) (
)
(b) (
)
Figure 3. Evolutionary game diagram under varying cooperation benefit coefficient
图3. 合作收益系数变化时演化博弈图
(a)
(b)
Figure 4. Time evolution diagram
图4. 时间演化图
由表3可知,
和
是ESS均衡点,表示电商平台和供应商会同时选择不合作和合作的策略,
和
则表现为两个不稳定点,表示电商平台和供应商会选择不同的策略,
是一个鞍点,电商平台和供应商选择合作策略的演化过程如图1所示。
点O(0, 0)和W(1, 1)演化表现为两个稳定结果,表示电商平台和供应商的复制动态曲线都有趋势向这两个点位收敛。当两条模仿者动态曲线均收敛于O(0, 0)时,电商平台和供应商之间会一直采取不合作的策略。当两条模仿者动态曲线均收敛于点位W(1, 1)时,电商平台和供应商之间会一直采取合作的策略。博弈主体最终策略走向取决于UOVS的面积S1和UWVS的面积S2的大小,当S1 > S2时,双方会逐渐趋向于不合作的策略;当S1 < S2时,双方会逐渐趋向于合作的策略。
2.4. 数值仿真分析
本文借助python程序进行数值仿真,来分析不同收益系数对双方合作策略的影响,结合实际情况[13] [14],令
;
;
;
;
;
;
;
;
;
;
。得到演化博弈图如图2所示。
数值仿真结果显示,双方合作(
,
)均为演化稳定策略(ESS),系统从不同初始条件出发最终收敛至合作均衡。尽管平台合作收益系数
存在差异(1.8 vs. 1.5),但合作均衡的稳定性未发生改变。当
,此时平台合作净收益为负,但供应商合作收益系数足够高,其合作策略具有强吸引力,可抵消平台合作收益不足的影响,推动系统向合作均衡演化。电商平台可通过提升供应商分成比例、降低其合作成本(如物流补贴),巩固供应链协同。
由图2和图3可知,当供应商合作收益系数不变时,平台合作收益系数从1.5降至1.4时,平台合作意愿会逐渐降低,此时合作的稳定性发生了变化,供应商仍有很高的合作意愿,但是电商平台由于收益降低合作意愿也大幅降低。而当平台与供应商的合作收益系数都产生下降时,双方都由刚开始的合作转向了不合作策略,收益降低之后,他们会一直产生不合作策略。
x,y模拟初始值分别取[0.2, 0.2]、[0.8, 0.8]、[0.8, 0.2]、[0.2, 0.8]、[0.5, 0.5],图4(a)是合作收益系数为
得到的五组时间演化图。从图4(a)中可以看出,当我们把平台的合作收益系数
固定在1.8 (远高于临界值)时,不管从哪个初始点出发,曲线最终都会收敛到x = 1、y = 1——也就是“全合作”均衡。图4(b)是合作收益系数为
得到的五组时间演化图。从图4(b)中可以看出,电商平台的合作概率
最终收敛到0,供应商的合作概率
最终收敛到1。这个点对应于表3中的“鞍点”(0, 1):平台最终不合作,供应商始终合作。在此状态下,供应商不断让出合作带来的额外收益,但平台并未承担合作成本,形成“供应商被剥削”的局面。这说明只有当α足够大,平台才会与供应商一起往(1, 1)合作均衡演化;否则就可能掉入剥削–被剥削的非合作–合作混合局面。图4(b)也体现了在2025年3月,阿里旗下“淘宝买菜”发布公告,决定全面关闭社区团购业务,自提点陆续下线,业务重心转向“农场直发”快递模式。由于平台突然撤销次日自提服务,众多社区团购供应商已提前按原模式备货并在自提点布局,却在自提点关停后面临大量生鲜商品无法及时售出、库存严重积压,损失由供应商自行承担,典型呈现“平台不合作/供应商合作”局面。
3. 结论
本研究基于演化博弈理论,构建了直播电商背景下电商平台与异质性供应商(大型与小型)的动态协同模型,通过理论推导与数值仿真揭示了双方合作策略的演化机制及稳定性条件。主要结论如下:
系统存在两个稳定的演化均衡点——全合作(1, 1)与全不合作(0, 0),其收敛方向由合作收益系数与成本损失的平衡关系决定。通过雅可比矩阵稳定性分析发现,当平台合作收益系数α > 1.6且大型供应商占比θ > 0.6时,双方合作成为唯一稳定策略;反之,系统易陷入非合作陷阱;大型供应商因高合作收益系数,会提升供应链整体合作倾向。对此我们应该设置合作激励机制,通过库存回购或物流补贴降低小型供应商的违约损失来减少其合作阻力。并且进行供应商结构优化,通过流量扶持吸引大型品牌入驻,利用其高收益主导合作趋势。本文中的供应商分成了两类,在未来可扩展至连续型异质性或多层级结构。本研究为电商平台与供应商的协同策略提供了理论依据与实践指南。通过量化合作收益和优化供应商结构,可有效突破非合作僵局,推动供应链从“零和竞争”向“共生共赢”演化,为直播电商生态的可持续发展注入新动能。
致 谢
在本论文的撰写过程中,我得到了许多老师和同学的关心与帮助。在此,谨向指导老师何胜学老师表示诚挚的感谢,感谢您论文写作过程中给予的耐心指导。