1. 引言
近年来,直播电商以“实时互动–内容呈现–即时决策”的交易组织方式显著降低了信息搜索与匹配成本,并在扩大内需与推动数字消费方面发挥了重要作用。但与之相伴的是更强的信息不对称:消费者往往依赖主播话术、场景化演绎与平台展示信号完成判断,而商品质量、履约能力与售后兑现等关键属性具有较强的事后可验证性。这一结构性特征使部分主体存在通过夸大宣传、误导性营销、货不对板等方式获取短期收益的激励,并由此引发消费纠纷增加、信任受损与平台治理成本上升等外部性问题[1]。
在制度层面,监管部门正通过规则供给与责任体系重构推进直播电商常态化治理。2026年1月7日,市场监管总局和国家网信办联合发布《直播电商监督管理办法》,明确围绕直播电商平台经营者、直播间运营者、直播营销人员及其服务机构“四类主体”压实责任义务、划定行为边界并完善监管机制,以维护消费者与经营者合法权益、促进直播电商健康发展。尤其值得关注的是,《办法》提出鼓励建立健全首问负责、先行赔付、在线争议解决等制度,以“及时预防和解决直播电商领域消费争议”。这意味着治理重心不仅在于事后补偿,更在于通过改变纠纷处置的成本与确定性,重塑平台治理、主体合规与消费者监督之间的互动关系[2]。
基于此,本文关注《办法》实施背景下先行赔付与在线争议解决等制度安排对三方激励结构的影响:平台是否会因兜底责任上升而调整治理强度与资源配置,消费者是否会因救济可得性提高而增强投诉维权意愿,并通过监督外部性抬升违规的预期成本,从而改变合规策略的扩散与生态稳态的形成。为刻画这一动态过程,本文构建平台–商家–消费者三方演化博弈模型,将先行赔付的制度效应表述为维权成本下降与补偿兑现提升,并在复制动态框架下推导稳定性与阈值条件,结合数值示例展示关键参数变化对演化路径的影响,以期为理解新规治理效应及其政策优化提供可解释的理论依据。
2. 制度背景与研究思路
2.1. 《办法》的治理逻辑
《直播电商监督管理办法》将直播电商界定为由平台经营者、直播间运营者、直播营销人员及其服务机构共同构成的复合型交易生态。该生态呈现出主体多元、链条延伸、影响外溢等特征:一方面,平台通过流量分发、交易规则与技术系统在生态中处于枢纽位置;另一方面,直播间运营与营销服务的组织化、专业化使得传统的“事后追责”难以覆盖全部风险环节[3]。在此背景下,《办法》强调平台责任与协同治理,意在通过规则供给将治理重心从末端纠纷处理前移至过程性行为约束,从而在交易发生前后形成贯通的治理闭环[4]。
在上述治理逻辑下,先行赔付并非孤立的“事后补偿”措施[5],而是与在线争议解决、责任压实和过程监管相衔接的制度工具[6],具有明显的激励重塑功能:其一,对消费者而言,先行赔付与在线争议解决有助于降低维权成本与不确定性,提升救济的可得性与可预期性,从而增强投诉、举报与监督参与的相对收益;其二,对平台而言,先行赔付将平台对交易风险的承担前置化[7],使平台在纠纷发生时承担更直接的经济与声誉压力,进而倒逼平台加强事前审核、事中巡查与事后处置,并通过黑名单、分级管理、动态管控等方式实现治理资源的差异化配置与长期降本增效;其三,对主播/商家而言,当平台治理强度提升且消费者维权参与上升时,违规行为的暴露概率与预期惩罚同步提高,短期套利空间被压缩,合规经营的相对收益随之上升[2]。由此可见,《办法》的核心并非仅在于提高处罚力度,更在于通过机制设计改变各主体的收益结构与行为边界,使合规在动态竞争中更具可持续性。
2.2. 研究思路:三方演化博弈框架
直播电商治理并非一次性静态决策,而更接近于多主体在持续互动中基于经验学习与收益比较不断调整行为选择的动态过程,这使演化博弈成为更贴合的分析工具[8]。具体而言,至少存在以下三方面特征支撑三方演化博弈建模的必要性。
第一,策略具有可复制性与学习性。主播/商家会在流量与收益驱动下模仿更高转化的营销方式并快速扩散;平台会在合规压力、治理成本与生态收益之间动态选择治理强度;消费者则会根据既往维权体验(如处理速度、举证难度、赔付兑现)更新其投诉与监督决策。上述机制决定了三方策略比例会随时间演化,而非固定不变。
第二,收益存在显著外部性与相互依赖。消费者监督不仅影响自身救济结果,还会通过线索供给与舆情压力提升平台的识别与处置效率;平台治理强度改变违规主体的暴露概率与预期成本,从而影响主播/商家的合规选择;违规行为的扩散又会通过信任受损与纠纷上升影响平台声誉与长期收益,并进一步改变消费者的整体信任与参与意愿。因此,三方收益并非相互独立,而是通过制度与市场机制形成联动。
第三,制度冲击需要通过行为反馈才能实现治理效果。先行赔付作为制度工具,其作用并不止于“赔付本身”,而在于能否在实际执行中持续降低维权摩擦、提高处置效率与兑现确定性;若平台响应滞后、证据难以获取或处置链条不畅,制度可能退化为象征性承诺,难以显著改变消费者参与与平台治理的激励结构。换言之,新规的治理效应具有典型的“制度–行为–再制度”的反馈特征,需要在动态框架下刻画其传导路径与稳定结果。
基于上述认识,本文采用平台–商家–消费者三方演化博弈框架,将先行赔付及在线争议解决的制度效应形式化为消费者维权成本下降与补偿兑现提升,并将消费者监督对平台治理效率的增益纳入模型,从而在复制动态体系中推导关键阈值条件与可能的稳定态类型,以解释新规下直播电商治理的作用机理与差异化结果。
3. 平台–商家–消费者三方演化博弈模型
本文在《直播电商监督管理办法》强调“先行赔付、在线争议解决”等制度安排的背景下,构建平台–商家–消费者三方演化博弈模型,以刻画制度冲击对多主体策略选择的动态影响。模型采用群体演化视角:每一类主体由大量相似个体构成,个体在有限理性与信息不完全条件下,依据相对收益进行模仿与调整,进而使群体中不同策略的占比随时间演化[9]。平台、商家与消费者之间的关系如图1所示。
Figure 1. Evolutionary game relationship among three parties
图1. 三方主体演化博弈关系
根据上述问题描述,构建由商家、平台和消费者组成的三方演化博弈模型,并做出如下假设:
假设1:商家、平台和消费者三方博弈中,各主体间信息不完全对称,且表现为有限理性。其中平台的策略空间为严格治理与宽松治理,设其选择严格治理的概率为x,则选择宽松治理的概率为1 − x,
;商家的策略空间为合规经营与违规经营,设其选择合规经营的概率为y,则选择违规经营的概率为1 − y,
;消费者的策略空间为积极维权与沉默忍让,设其选择积极维权的概率为z,则选择沉默忍让的概率为1 − z,
。
假设2:在电商平台交易过程中,商家可能选择合规经营或违规经营。商家合规经营时可获得基础收益Rm,若商家违规经营,则可获得额外收益Pm,但一旦违规行为被发现,将受到惩罚F。当平台采取严格治理策略时,商家违规行为被发现的概率为α;当平台采取宽松治理策略时,违规行为被发现的概率为β,且一般有α > β。消费者购买商品需支付价格P,其正常消费效用为V。当商家合规经营时,消费者权益得到保障,其收益为V − P;当商家违规经营时,消费者无法获得正常消费效用,其收益为−P。消费者在遭遇商家违规行为时,可选择积极维权或沉默忍让。若消费者选择积极维权,则需支付维权成本Cc,且维权成功的概率为γ,成功后消费者可获得补偿Q。
当消费者积极维权且维权成功时,平台需履行先行赔付责任,向消费者垫付赔偿金额K。平台在完成先行赔付后,将向违规商家追偿相应金额。为更真实地刻画平台在“严格治理”与“先行赔付”之间的成本权衡,本文进一步引入平台治理投入强度g,并设追偿成功率为平台治理投入的增函数:
,
,
。其中λ0表示平台在基础治理水平下的追偿能力,ρ表示治理投入对追偿成功率的边际提升系数。严格治理对应更高的治理投入水平g1,宽松治理对应较低的治理投入水平g2,且g1 > g2。所以严格治理下追偿成功率为λ1,宽松治理下追偿成功率为λ2,并有λ1 > λ2。若追偿成功,则赔付成本由商家承担;若追偿失败,则由平台自行承担。因此平台在严格治理与宽松治理下的期望净赔付成本分别为γK(1−λ1)与γK(1−λ2),商家承担的期望追偿成本分别为γλ1K与γλ2K。同时,平台为保障先行赔付机制的持续兑现,需要设立赔付金资金池并承担固定成本F0 (如备付金资金占用、资金池运营管理、风控与反欺诈系统固定支出等)。该成本具有“机制设立即发生且不随纠纷次数变化”的特征,故在平台收益中计入固定成本项−F0。
平台在经营过程中可获得生态收益Rp。当平台采取严格治理策略时,需要支付治理成本C1;当平台采取宽松治理策略时,需要支付治理成本C2,且一般有C1 > C2。当平台采取宽松治理策略且商家发生违规行为时,平台将因监管不力及负面评价等因素遭受声誉损失Lp。
综上所述,模型参数与含义如表1所示。
Table 1. Model parameter assumptions and their meanings
表1. 模型参数假设及其含义
参数 |
含义 |
x |
平台严格治理的概率 |
y |
商家合规经营的概率 |
z |
消费者积极维权的概率 |
α |
平台严格治理下违规被发现概率 |
β |
平台宽松治理下违规被发现概率 |
γ |
消费者积极维权下赔付成功概率 |
g |
平台治理投入强度 |
g1 |
严格治理对应的投入水平 |
g2 |
宽松治理对应的投入水平 |
λ0 |
基础追偿能力 |
λ1 |
严格治理下追偿成功率 |
λ2 |
宽松治理下追偿成功率 |
Rp |
平台生态收益 |
C1 |
平台严格治理成本 |
C2 |
平台宽松治理成本 |
Lp |
平台声誉损失 |
K |
平台先行赔付垫付金额 |
F0 |
平台设立赔付金资金池的固定成本 |
Rm |
商家合规经营的基准收益 |
Pm |
商家违规经营的额外收益 |
J |
商家违规经营受到的惩罚 |
V |
消费者消费效用 |
P |
商品支付价格 |
Q |
维权成功获得的补偿 |
Cc |
消费者维权成本 |
根据上述假设,商家、平台和消费者的混合策略博弈收益矩阵,如表2所示。
Table 2. Payoff matrix of the platform-merchant-consumer game
表2. 平台–商家–消费者博弈收益矩阵
策略组合 |
平台收益 |
商家收益 |
消费者收益 |
{严格治理;合规经营;积极维权} |
Rp − C1 − F0 |
Rm |
V − P − Cc |
{严格治理;合规经营;沉默忍让} |
Rp − C1 − F0 |
Rm |
V − P |
{严格治理;违规经营;积极维权} |
Rp − C1 − γK(1 − λ1) − F0 |
Rm + Pm − αJ − γλ1K |
−P − Cc + γQ |
{严格治理;违规经营;沉默忍让} |
Rp − C1 − F0 |
Rm + Pm − αJ |
−P |
{宽松治理;合规经营;积极维权} |
Rp − C2 − F0 |
Rm |
V − P − Cc |
{宽松治理;合规经营;沉默忍让} |
Rp − C2 − F0 |
Rm |
V − P |
{宽松治理;违规经营;积极维权} |
Rp − C2 − γK(1 − λ2) − Lp − F0 |
Rm + Pm − βJ − γλ2K |
−P − Cc + γQ |
{宽松治理;违规经营;沉默忍让} |
Rp − C2 − Lp − F0 |
Rm + Pm − βJ |
−P |
4. 策略稳定性分析
4.1. 平台策略稳定性分析
根据收益矩阵可以得到平台严格治理的期望收益U11,宽松治理的期望收益U12以及平均期望收益U1分别为:
(1)
(2)
(3)
结合式(1)至式(3)与复制动态模型,计算出平台复制动态方程为:
(4)
对F(x)求导得:
(5)
便于表达,令:
(6)
当平台选择严格治理的概率处于稳定状态时,必须满足:
且
由
,可推导出:
(7)
(8)
(1)
此时G(y)是关于y的单调递减函数。
当
时,G(y) = 0,从而F(x) = 0,系统处于中性状态,平台稳定策略无法确定。
当
时,由单调性知G(y) > 0,故x = 1即严格治理为平台渐近稳定策略。
当
时,由单调性知G(y) < 0,故x = 0即宽松治理为平台渐近稳定策略。
(2)
此时,
,与y无关,平台将稳定选择宽松治理的策略。
(3)
此时G(y)是关于y的单调递增函数。
当
时,G(y) = 0,从而F(x) = 0,系统处于中性状态,平台稳定策略无法确定。
当
时,由单调性知G(y) < 0,故x = 0即宽松治理为平台渐近稳定策略。
当
时,由单调性知G(y) > 0,故x = 1即严格治理为平台渐近稳定策略。
先行赔付把纠纷风险前置为平台的预期赔付与追偿成本:在违规较多时,宽松治理既放大声誉冲击,又削弱追偿回收,使平台更倾向严格治理并扩大其稳定区间;而随着合规提升、风险下降,赔付与声誉压力减弱,严格治理的边际收益递减,平台治理强度会出现由强转弱的内生回落。
4.2. 商家策略稳定性分析
根据收益矩阵可以得到商家合规经营的期望收益U21,违规经营的期望收益U22以及平均期望收益U2分别为:
(9)
(10)
(11)
结合式(9)至式(11)与复制动态模型,计算出商家复制动态方程为:
(12)
对F(y)求导得:
(13)
便于表达,令:
(14)
当商家策略处于稳定状态时,必须满足:
且
由
,可推导出:
(15)
(16)
因此,
是关于z的单调递增函数。
(a) 当
时,
,从而F(y) = 0,系统处于中性状态,商家稳定策略无法确定。
(b) 当
时,由单调性知
,故y = 0即违规经营为商家渐近稳定策略。
(c) 当
时,由单调性知
,故y = 1即合规经营为商家渐近稳定策略。
商家是否趋向合规,取决于其违规额外收益与违规预期成本之间的比较。消费者维权程度提升会提高违规被追责与追偿的发生概率,使违规经营的预期成本上升,从而压缩违规经营的相对收益空间;当违规收益被罚则约束与追偿成本完全抵消时,合规经营成为演化稳定策略,推动商家行为向合规均衡收敛。
4.3. 消费者策略稳定性分析
根据收益矩阵可以得到消费者积极维权的期望收益U31,沉默忍让的期望收益U32以及平均期望收益U3分别为:
(17)
(18)
(19)
结合式(17)至式(19)与复制动态模型,计算出消费者复制动态方程为:
(20)
对F(z)求导得:
(21)
便于表达,令:
(22)
当消费者策略处于稳定状态时,必须满足:
且
由
,可推导出:
(23)
(24)
因此,N(y)是关于y的单调递减函数。
(a) 当
时,N(y) = 0,从而F(z) = 0,系统处于中性状态,消费者稳定策略无法确定。
(b) 当
时,由单调性知N(y) > 0,故z = 1即积极维权为消费者的渐近稳定策略。
(c) 当
时,由单调性知N(y) < 0,故z = 0即沉默忍让为消费者的渐近稳定策略。
先行赔付与在线争议解决通过提高γ并降低Cc,显著扩展消费者积极维权的稳定区间;而随着商家合规经营比例y的上升,违规情形减少,消费者维权激励被削弱,体现出治理改善后的“投诉自然回落”效应。
5. 系统均衡点稳定性分析
由F(x) = 0,F(y) = 0,F(z) = 0,可以得出8个纯策略均衡点,同时在参数满足一定条件时还可能存在若干混合策略均衡点。在非对称动态博弈中,混合策略均衡并不一定具备演化稳定性,因此只对8个纯策略均衡点进行分析。这些纯策略均衡点分别为E1(0,0,0),E2(1,0,0),E3(0,1,0),E4(0,0,1),E5(1,1,0),E6(1,0,1),E7(0,1,1),E8(1,1,1)。三方演化博弈的雅可比矩阵,如下:
Table 3. Stability analysis of equilibria
表3. 均衡点稳定性分析
均衡点 |
雅可比矩阵特征值 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
根据表3可对均衡点进行稳定性分析,均衡点E2(1,0,0),E5(1,1,0),E6(1,0,1),E7(0,1,1),E8(1,1,1)对应的特征值中至少存在一个不为负实部,均不满足演化稳定条件,因此均为不稳定点。而E1(0,0,0),E3(0,1,0),E4(0,0,1)在一定条件下可能满足特征值全为负,从而达到演化稳定策略(ESS)。因此,本文通过不同的限制条件分别定义3种情形进行系统演化稳定分析。
情形1:当满足
时,均衡点E1(0,0,0)所对应的三个特征值均为负值,即策略组合(宽松治理,违规经营,沉默忍让)为该系统的演化稳定策略。
情形2:当满足
时,均衡点E3(0,1,0)对应的特征值均为负值,即策略组合(宽松治理,合规经营,沉默忍让)为该系统的演化稳定策略。
情形3:当满足
时,均衡点E4(0,0,1)所对应的三个特征值均为负值,即策略组合(宽松治理,违规经营,积极维权)为该系统的演化稳定策略。
6. 模拟与仿真
为检验《直播电商监督管理办法》提出的先行赔付与在线争议解决(ODR)等制度安排对平台–商家–消费者三方策略演化的影响,本文在前述复制动态方程基础上进行数值仿真。F0对平台不同治理策略具有对称性,在相对收益比较中被抵消,其作用主要体现在抬高先行赔付机制的长期运行门槛而非改变治理强度的演化方向,因此属于制度可行性问题而非演化路径问题。具体初始参数设置如:x0 = 0.30,y0 = 0.40,z0 = 0.20,C1 = 1.35,C2 = 0.85,J = 1.20,α = 0.65,β = 0.25,Pm = 0.90,K = 1.0。λ0 = 0.35, ρ = 0.20,g1 = 1.0, g2 = 0.5,根据追偿成功率函数,得出λ1 = 0.55,λ2 = 0.45。基准情形下,Lp = 0.60,γ = 0.25,Cc = 0.60,Q = 1.00;仅ODR情形下,Lp = 0.60,γ = 0.25,Cc = 0.20,Q = 1.00;仅先行赔付情形下,Lp = 1.20,γ = 0.60,Cc = 0.50,Q = 1.20;ODR+先行赔付联动情形下,Lp = 1.20,γ = 0.70,Cc = 0.15,Q = 1.20。
从图2可以看出,在基准情形下,消费者积极维权比例迅速下降并长期维持在较低水平,商家合规比例随之下滑并陷入低位,表明在维权成本较高且救济不确定的环境中,违规收益空间难以被有效压缩。平台虽在声誉压力与负面外部性作用下逐步强化治理,但这种事后性的治理调整难以带动消费者监督与商家合规形成协同改善,系统整体仍停留在低效率均衡状态。
在仅引入ODR的情形下,维权门槛下降显著提升了消费者维权参与度,说明纠纷处理可及性的改善能够稳定激活消费者监督。然而,由于缺乏先行赔付与追偿兑现等配套机制,违规的预期成本提升有限,商家合规水平改善不够稳定,平台仍需依赖较高治理投入来应对外部性风险,ODR对合规行为的长期约束作用存在一定局限。
Figure 2. Evolutionary trajectories of three strategies under four institutional scenarios
图2. 四种制度情形下三方策略演化轨迹对比
当仅实施先行赔付机制时,纠纷风险被前置为平台的预期支出,平台在前期显著强化治理强度,并阶段性压缩商家违规收益空间,使合规比例与维权比例一度上升。随着合规改善、违规事件减少,平台面临的风险暴露下降,高强度治理的边际收益递减,平台治理与商家合规随之出现回摆,消费者维权也因预期收益下降而内生回落,反映出单一先行赔付机制下激励效应的阶段性特征。
在ODR与先行赔付联动实施的情形下,维权成本下降与救济确定性提升形成叠加效应,消费者维权比例迅速收敛至高位并保持稳定,平台治理强度与商家合规水平整体显著优于其他制度安排。尽管平台治理与商家合规在演化过程中仍存在一定波动,但该波动主要源于“治理强化–违规下降–激励递减–再调整”的负反馈滞后效应,体现的是制度作用下的动态修正过程,而非治理失效。总体而言,联动机制更有利于推动系统向高维权、高治理与高合规的稳态结构收敛。
7. 结论与启示
直播电商在“实时互动–内容呈现–即时决策”的交易结构下,显著压缩了信息搜索与匹配成本,但商品质量、履约与售后等关键属性的事后可验证性增强了信息不对称,使部分主体仍存在夸大宣传、误导营销等短期逐利行为,进而抬高交易纠纷发生概率并外化为平台治理压力。针对上述问题,《直播电商监督管理办法》通过压实平台及相关主体责任,引导建立先行赔付、在线争议解决等制度安排,意在以“纠纷处置机制”推动“激励结构重塑”。
本文的演化博弈分析与仿真结果显示,单一制度工具难以支撑治理目标的长期实现。在线争议解决机制通过降低维权摩擦,能够稳定激活消费者参与,使监督行为更具持续性,但在缺乏明确责任兑现与追偿约束的情况下,违规的预期成本提升有限,商家合规行为难以形成稳态扩散。先行赔付机制通过将风险前置为平台的预期责任,在一定阶段内强化了平台治理动机,并压缩了违规收益空间,但当合规水平上升、纠纷频率下降后,平台维持高治理强度的收益基础随之减弱,治理与合规均可能出现回摆。两类机制单独运行时,均难以同时兼顾激励强度与制度稳定性。
当在线争议解决与先行赔付形成联动安排时,维权成本下降与救济确定性提升相互作用,消费者监督更容易转化为可执行的治理压力,平台治理与商家合规之间的反馈关系趋于清晰。仿真结果表明,在联动情形下,系统更容易维持在高维权、高治理与高合规的状态区间,治理效果的持续性明显优于单一制度情形。治理过程中仍存在阶段性波动,但其来源主要在于合规改善后激励结构的动态调整,而非制度本身的失效。
模型分析同时揭示了平台动力不足的现实约束。先行赔付并非单次赔偿行为,而是一项伴随资金占用、风控建设与合规管理的制度性投入安排,其固定成本具有刚性特征。在现有制度环境下,该成本不直接改变平台不同治理策略之间的相对收益,却显著抬高了机制长期运行的门槛。由此,即便平台能够识别联动机制带来的治理改善,也可能在执行强度、覆盖范围或持续投入上保持审慎,从而影响制度效果的稳定发挥。
基于上述分析,治理实践有必要在责任前置的同时引入成本对冲与激励补偿。通过税收优惠、费用扣除等方式分担平台的制度性投入压力,或将先行赔付与在线争议解决的运行情况纳入信用评价与分级监管体系,均有助于提升平台持续投入治理的内生收益。对极端赔付风险的保险化或行业共担安排,也能够缓解平台对制度成本与风险敞口的顾虑。责任约束与激励补偿形成匹配,联动机制才能在不依赖短期行政压力的情况下稳定运行,推动直播电商交易秩序向更高质量的均衡状态演进。