随机Stackelberg微分博弈视角下电商平台评论监管与商家激励策略研究
Study on E-Commerce Platform Comment Supervision and Merchant Incentive Strategies from the Perspective of Stochastic Stackelberg Differential Game
DOI: 10.12677/ecl.2026.153243, PDF, HTML, XML,    国家自然科学基金支持
作者: 鄢守信:贵州大学数学与统计学院,贵州 贵阳
关键词: 电商平台评论治理Stackelberg微分博弈随机干扰动态策略E-Commerce Platform Comment Governance Stackelberg Differential Game Stochastic Disturbance Dynamic Strategy
摘要: 为解决电商平台评论治理中监管与激励的动态适配问题,本文构建平台(领导者)-家(追随者)的线性二次随机Stackelberg微分博弈模型,以评论真实可信度为核心状态变量,引入布朗运动刻画市场不确定性,研究采用逆向归纳法结合随机哈密尔顿–雅可比–贝尔曼(HJB)方程推导均衡策略,系统分析核心参数与时域长度的调节效应,明确双方策略动态特性。结果表明:有限时域下,平台监管强度与商家激励强度均为评论可信度的线性反馈函数,呈现“时域约束 + 可信度驱动”双重动态特性,策略强度随剩余时间递减,前期重投入快速提升可信度,后期稳投入平衡成本与收益;成本收益系数、贴现因子、时域长度等核心参数对策略演化的调节作用显著,平台先动优势可通过监管策略引导商家激励行为,实现评论生态协同优化,且商家激励对可信度提升的主导效应更突出。
Abstract: To address the problem of dynamic adaptation between supervision and incentives in the comment governance of e-commerce platforms, this paper constructs a linear-quadratic stochastic Stackelberg differential game model with the platform as the leader and merchants as followers. Taking the authentic credibility of comments as the core state variable, Brownian motion is introduced to characterize market uncertainty. The equilibrium strategies are derived by adopting the backward induction method combined with the stochastic Hamilton-Jacobi-Bellman (HJB) equation. Meanwhile, the moderating effects of core parameters and time horizon length are systematically analyzed, and the dynamic characteristics of the strategies of both parties are clarified. The results show that: under a finite time horizon, both the platform’s supervision intensity and merchants’ incentive intensity are linear feedback functions of comment credibility, presenting the dual dynamic characteristics of “time horizon constraint + credibility-driven”. The intensity of strategies decreases with the remaining time, indicating that heavy investment in the early stage can rapidly improve credibility, while steady investment in the later stage balances costs and benefits. Core parameters such as cost-benefit coefficients, discount factors, and time horizon length exert significant moderating effects on strategy evolution. The platform’s first-mover advantage can guide merchants’ incentive behaviors through supervision strategies, thereby achieving the collaborative optimization of the comment ecosystem. Moreover, merchants’ incentives play a more prominent leading role in improving credibility.
文章引用:鄢守信. 随机Stackelberg微分博弈视角下电商平台评论监管与商家激励策略研究[J]. 电子商务评论, 2026, 15(3): 20-29. https://doi.org/10.12677/ecl.2026.153243

1. 引言

数字经济背景下,电子商务平台已成为消费决策核心场景,在线评论作为连接消费者、平台与商家的关键信息纽带,其可信度直接决定平台公信力构建。随着直播电商、社区团购等新业态的兴起,在线评论的传播与影响力进一步放大,据《2024中国生鲜电商消费行为报告》(艾瑞咨询)显示,生鲜电商消费者将在线评论作为购买首要参考,优质评论可使商家销量提升30%,而虚假刷评、恶意差评等乱象,不仅扭曲消费信息真实性、侵害消费者权益,更加剧了平台成本与商家经营矛盾,甚至引发恶性竞争。

在线评论治理与平台–商家互动已成为电商生态与运营管理领域的研究热点,在评论奖励与真实性治理领域,Cui等[1]以在线零售平台为研究对象,对比强制与自愿披露两种激励模式的效果,发现强制披露可显著降低评论正向偏移风险,为奖励机制合规化设计提供理论支撑,其结论在生鲜电商评论治理中同样适用。Chen等[2]通过信号博弈模型推导评论奖励最优阈值,证实低额度奖励可提升真实好评比例,高额度奖励易诱发虚假评论。在生鲜电商场景适配方面,胡颖等[3]基于微分博弈理论,提出生鲜商家评论激励需与保鲜努力深度绑定,“新鲜度达标奖励 + 优质评论积分”的组合模式可实现品质与评论的协同提升。Hai等[4]研究了一个由一个生鲜电子商务企业和一个生鲜供应商组成的两级生鲜农产品电子商务供应链的协调问题。国内研究中,李明琨和葛艺博在[5]中从有限理性视角构建演化博弈模型,分析商家好评奖励策略与消费者评论行为的适配关系,验证平台监管对恶意奖励动机的抑制作用。Sun等[6]引入制度距离变量,发现跨境生鲜电商中,本土化奖励策略可削弱制度距离对奖惩的负面影响,为跨境生鲜合规成本控制提供新思路。Edelman等[7]从价格一致性视角指出,平台奖励机制需适配宏观监管政策,避免过度返利扭曲市场价格,为生鲜电商价格合规与奖励协同提供理论支撑。Schwartz等[8]则聚焦现金返利奖励,证实无附加费规则约束下,平台需通过监管规范返利额度,平衡交易量与市场效率。

平台治理、口碑管理与信息不对称领域的经典与最新研究为本文提供了重要理论支撑:平台治理领域,Rochet和Tirole [9]构建双边市场Stackelberg模型,量化平台佣金与监管策略对双边参与主体的影响,奠定平台治理理论基础;口碑管理领域,Chen等[10]构建平台–商家–消费者三方博弈模型,揭示评论奖励与监管的负相关关系,成为口碑管理奠基性研究;Cui等[1]对比评论激励披露模式效果,证实强制披露可降低评论正向偏移,为生鲜电商激励合规化提供依据。信息不对称领域,Akerlof [11]中以“柠檬市场”为背景理论揭示品质不确定性对市场秩序的破坏,论证评论治理必要性。

Stackelberg博弈作为刻画层级决策关系的核心工具,其理论体系与拓展应用为平台–商家互动分析提供方法论支撑。经典理论层面,Isaacs [12]系统构建微分博弈理论框架,为连续时间动态研究奠定基础,成为生鲜电商保鲜、奖励等动态决策问题的核心分析工具。Basar等[13]将Stackelberg博弈与动态博弈深度融合,提出逆向归纳法求解层级均衡策略,完善了“领导者–追随者”动态决策的数学体系,在随机与逆向拓展领域,Yong [14]提出领导者–追随者随机线性二次微分博弈模型,通过线性二次(LQ)框架求解随机环境下均衡策略,适配生鲜市场需求波动、保鲜技术迭代等不确定性场景。Du等[15]将Stackelberg博弈拓展至均值场倒向随机微分系统,为多商家场景下的批量决策提供方法支撑,可适配大型生鲜平台多商家管理需求。Zheng等[16]通过倒向随机微分方程构建Stackelberg博弈模型,完善了随机场景下策略最优性证明逻辑。Shi等[17]构建不对称信息的领导者–追随者微分博弈模型,提出信息不对称下均衡策略的求解框架。Wang等[18]针对倒向微分方程的线性二次非零和微分博弈展开研究,揭示不对称信息对策略互动的影响机制,为本文刻画平台与商家提供理论基础;Shi等[19]研究了随机Stackelberg微分对策,利用极大值原理和最优滤波,给出了博弈的反馈Stackelberg均衡。完善了部分对称信息环境下的策略推导逻辑。这些研究为破解电商评论治理中的信息不对称难题提供了坚实的理论工具。

在电商场景落地方面,高婷[20]构建了生鲜农产品供应链协调策略研究模型,从本土化视角梳理了供应链各环节的协同逻辑,为平台奖励机制与供应链协调的深度融合提供基础框架;刘静雯[21]以盒马鲜生为研究对象,剖析新零售模式下生鲜电商的运营策略,证实精准的奖励与监管适配可提升品牌竞争力,补充了头部生鲜电商企业的实践研究。Riazati等[22]构建卖家诚实激励Stackelberg模型,证实当诚实奖励与欺诈惩罚之和大于欺诈收益时,商家倾向合规策略,为生鲜电商诚信治理提供微观激励框架。

生鲜电商“评论治理”与“生鲜保鲜”在数学结构上具有显著同构性,二者的协同优化具备坚实的理论基础:第一,核心要素同构,评论可信度与生鲜新鲜度均为连续时间动态演化的状态变量,平台监管或保鲜督导、商家激励或保鲜投入为对应控制变量,且均存在自然衰减特性与随机扰动影响[3] [4];第二,状态方程同构,二者状态演化均满足“控制变量正向作用 + 自然衰减 + 随机扰动”的线性随机微分方程形式,数学表达式结构完全一致;第三,优化目标同构,平台与商家的优化目标均为有限时域下的期望累积收益最大化,收益函数均符合线性二次博弈的目标函数特征[15] [17]

综合现有文献研究现状,当前在线评论治理与平台–商家动态互动领域仍存在明显研究缺口:一是研究视角上,多数文献采用静态博弈或演化博弈方法,缺乏对策略连续调整与实时反馈的刻画;二是模型场景上,微分博弈与Stackelberg模型的应用多集中于供应链协作、广告投放等领域,鲜少针对在线评论治理场景构建模型,且未充分整合评论可信度这一核心状态变量;三是现实适配性上,部分随机博弈模型简化了市场波动、观测噪声等干扰因素,与电商生态的实际场景有偏差。基于此,本文构建平台–商家评论治理的线性二次随机Stackelberg微分博弈模型,以评论可信度为核心变量,引入布朗运动刻画市场不确定性,将平台监管强度与商家评论激励强度作为双方控制变量;采用逆向归纳法求解Stackelberg均衡策略,先推导商家基于平台监管策略的最优响应函数,再代入平台目标函数求解最优监管策略。

2. 数学模型

2.1. 模型假设

为精准刻画电商平台与商家在评论治理中的动态互动关系,结合有限时域运营场景与随机市场环境,本文基于线性二次(LQ)随机微分博弈框架,提出以下背景假设,假设博弈双方均为理性的,以有限时域 [ 0,T ] 内自身期望贴现总收益最大化为决策目标,电商平台作为领导者,具备全局决策能力与信息主导权,可精准观测调整监管策略;入驻商家作为追随者,具备完全理性的策略响应能力,可即时观测平台监管强度并优化自身激励投入,双方决策无延迟。对称信息包括:评论可信度 x( t ) 的动态演化过程、状态方程参数(abc σ )、博弈 T 、贴现因子 ρ 等核心变量,双方认知完全一致。不对称信息包括:平台监管成本系数 k 1 、收益系数 h 1 ,商家激励成本系数 k 2 、收益系数 h 2 ,此类参数为各自私有信息,对方仅能通过行业经验与行为观测合理预判,贴合电商运营中成本、收益隐私性特征。假设评论真实可信度 x( t ) 为核心连续状态变量,取值范围为 ( 0,1 ) ,取值越高代表评论区信息真实性、公信力越强。可信度存在自然衰减特性( a<0 ),若双方均不采取干预措施,真实评论随新评论覆盖、舆情迭代而逐渐失效。

2.2. 模型建立

本模型聚焦电子商务平台(领导者)与入驻商家(追随者)的动态博弈:平台作为领导者,先确定评论监管强度;双方决策需考虑评论可信度的随机演化,目标为最大化自身长期贴现收益。

状态变量与随机演化方程定义评论区真实可信度 x( t ) 为状态变量,其动态满足线性随机微分方程:

dx( t )=ax( t )+b u 1 ( t )+c u 2 ( t )+σdW( t ),x( 0 )= x 0 >0,t[ 0,T ] (1)

这里 a<0 为可信度自然衰减系数, b>0 为平台监管对可信度的正向影响系数。; c>0 为商家激励对可信度的正向影响系数; σ>0 为随机干扰强度, W( t ) 为标准布朗运动,代表市场波动, x 0 初始评论可信度,由平台前期口碑决定; T 为博弈周期终点,根据电商运营目标设定(如 T=30 代表月度周期)。领导者(电商平台)在 t 时刻的监管强度用决策变量 u 1 ( t )0 表示。博弈时序:平台先宣布最优监管策略 u 1 ( t ) ;商家观测后,在给定 u 1 ( t ) 下优化自身激励策略 u 2 ( t )

采用线性二次形式收益函数,平台的收益来自评论可信度带来流量增长、广告收入增加,成本为监管投入的二次成本,形式为: L 1 ( t )= h 1 x 2 ( t ) 1 2 k 1 u 1 2 ( t ) h 1 >0 k 1 >0 为平台监管成本系数。商家收益来自可信度带来的销量增长、口碑沉淀,形式为: L 2 ( t )= h 2 x 2 ( t ) 1 2 k 2 u 2 2 ( t ) ,其中, h 2 >0 为商家收益系数,评论可信度越高,消费者购买意愿越强; k 2 >0 为商家激励成本系数,激励预算、运营成本等随激励强度递增。

目标函数双方以有限时域 [ 0,T ] 内的期望贴现总收益最大化为目标,考虑到终端时刻评论可信度对后续运营的影响,引入终端价值项(反映T时刻可信度的残值),平台和商家的目标函数分别为:

J 1 = max u 1 E{ 0 T e ρt [ h 1 x 2 ( t ) 1 2 k 1 u 1 2 ( t ) ]dt+ e ρT 1 2 q 1 x 2 ( T ) } (2)

J 2 = max u 2 E{ 0 T e ρt [ h 2 x 2 ( t ) 1 2 k 2 u 2 2 ( t ) ]dt+ e ρT 1 2 q 2 x 2 ( T ) } (3)

其中, E 表示期望算子, e ρt 为贴现因子项; q 1 >0 q 2 >0 分别为平台与商家的终端价值系数,反映 T 时刻评论可信度对双方后续收益的残值贡献, q 1 q 2 越大,双方越重视终端可信度水平。

3.主要结果

3.1. Stackelberg均衡策略组合

采用Stackelberg博弈逆向归纳法求解,先求商家最优响应,再代入平台目标函数求最优监管策略[15],最终得到有限时域 [ 0,T ] 内均衡策略组合:

{ u 1 * ( t )= K 1 ( t )x( t ) u 2 * ( t )= K 2 ( t )x( t ) (4)

其中, K 1 ( t )= b P 1 ( t ) k 1 ( 1+ c 2 P 2 ( t ) a k 2 ) K 2 ( t )= c P 2 ( t ) k 2 ( 1+ b K 1 ( t ) a ) 均为依赖于时间 t 的正反馈系数。核心特征为: K 1 ( t ) K 2 ( t ) 随时间 t 递增而递减,即越接近周期终点 T ,双方策略强度越低,体现有限时域下“前期重投入、后期稳收益”的决策逻辑,与电商短期运营中“前期构建口碑、后期维持优势”的实际行为一致。

3.2. 证明

对于线性二次随机Stackelberg微分博弈,需结合HJB方程与伊藤引理求解。核心原理:HJB方程将无限时域的静态优化转化为有限时域的动态优化,通过价值函数刻画每一时点的最优收益期望,再结合状态变量的随机特性,推导最优策略的反馈形式。已知状态变量 x( t ) 服从伊藤过程: x ˙ ( t )=μ( t,x )+σ( t,x )dW( t ) ,其中漂移项 μ( t,x )=ax( t )+b u 1 ( t )+c u 2 ( t ) ,扩散项 σ( t,x )=σ (常数,因随机干扰强度固定)。对于追随者(商家)与领导者(平台),分别构建价值函数并代入HJB方程求解。

3.2.1. 商家(追随者)最优响应证明

商家作追随者,需在给定平台监管策略 u 1 ( t ) 的前提下,优化自身激励策略 u 2 ( t ) ,最大化目标函数 J 2 .定义商家价值函数 V 2 ( t,x( t ) ) 为:在时刻 t 、状态 x( t ) 下,商家从 t T 时刻的最大期望贴现总收益:

V 2 ( t,x( t ) )= max u 2 ( τ )[ 0,+ ),τ[ t,T ] E{ t T e ρ( τt ) [ h 2 x 2 ( τ ) 1 2 k 2 u 2 2 ( τ ) ]dτ+ e ρ( Tt ) 1 2 q 2 x 2 ( T ) } (5)

其中, e ρ( τt ) 为贴现因子,结合模型线性二次特性,假设价值函数为二次型结构(保证解的存在性与唯一性): V 2 ( t,x )= 1 2 P 2 ( t ) x 2 ,其中 P 2 ( t )>0 为依赖于时间 t 的正定系数,且满足终端条件 P 2 ( T )= q 2 。根据随机控制理论,价值函数 V 2 ( t,x ) 需满足随机HJB方程。对于随机控制问题,HJB方程一般形式为:

ρV( t,x )= max u { L( t,x,u )+ V t +μ( t,x,u ) V x + 1 2 σ 2 ( t,x,u ) 2 V x 2 } (6)

式中 ρV( t,x ) 为价值函数的瞬时贴现收益; L( t,x,u ) 为即时收益函数; V t 为价值函数的时间变化率; μ( t,x,u ) V x 为漂移项带来的收益变化; 1 2 σ 2 2 V x 2 为扩散项带来的二阶收益变化。将商家的即时收益函数 L 2 ( t )= h 2 x 2 1 2 k 2 u 2 2 、状态漂移项 μ=ax+b u 1 +c u 2 、扩散项 σ 及价值函数 V 2 ( t,x )= 1 2 P 2 ( t ) x 2 代入HJB方程,得到商家HJB方程:

ρ 1 2 P 2 ( t ) x 2 = max u 2 { h 2 x 2 1 2 k 2 u 2 2 + V 2 t +( ax+b u 1 +c u 2 ) V 2 x + 1 2 σ 2 2 V 2 x 2 } (7)

对价值函数 V 2 ( t,x )= 1 2 P 2 ( t ) x 2 求多次偏导数

V 2 t = 1 2 P ˙ 2 ( t ) x 2 ,  V 2 x = P 2 ( t )x,  2 V 2 x 2 = P 2 ( t ) (8)

将(8)代入HJB方程(7)中,整理后得到:

1 2 ρ P 2 x 2 = max u 2 { h 2 x 2 1 2 k 2 u 2 2 + 1 2 P ˙ 2 x 2 +( ax+b u 1 +c u 2 ) P 2 x+ 1 2 σ 2 P 2 } (9)

方程中仅 1 2 k 2 u 2 2 +c P 2 x u 2 两项与 u 2 相关,且二次项系数 1 2 k 2 <0 函数存在唯一最大值。对 u 2 求一阶偏导并令其等于 0 u 2 ( 1 2 k 2 u 2 2 +c P 2 x u 2 )= k 2 u 2 +c P 2 x=0 ,解得商家最优响应策略: u 2 * ( t )= c P 2 ( t ) k 2 x( t )+ bc P 2 ( t ) a k 2 u 1 ( t ) ,整理后可表示为(4)中第二个式子。将 u 2 * ( t ) 代入化简后的HJB方程(7)中,整理后按 x 2 项、常数项分离系数(因方程同类项系数需相等)得到商家的Riccati方程: P ˙ 2 ( t )+( ρ2a ) P 2 ( t ) c 2 P 2 2 ( t ) k 2 +2 h 2 =0 P 2 ( T )= q 2

3.2.2. 平台(领导者)最优策略证明

平台作为领导者,可预判商家的最优响应 u 2 * ( t ) ,将其代入自身目标函数与状态方程,转化为单主体优化问题,求解最优监管策略 u 1 * ( t )

u 2 * ( t )= c P 2 ( t ) k 2 x( t )+ bc P 2 ( t ) a k 2 u 1 ( t ) 代入原状态演化方程,整理得到仅含 u 1 ( t ) 的状态方程:

x ˙ ( t )=( a+ c 2 P 2 ( t ) k 2 )x( t )+( b+ b c 2 P 2 ( t ) a k 2 ) u 1 ( t )+σdW( t ) (10)

记新漂移项为 μ 1 ( t,x )=( a+ c 2 P 2 ( t ) k 2 )x+( b+ b c 2 P 2 ( t ) a k 2 ) u 1 ,扩散项仍为 σ 。构建平台价值函数与HJB方程。定义平台价值函数: V 1 ( t,x )= 1 2 P 1 ( t ) x 2 ,其中 P 1 ( t )>0 ,满足终端条件 P 1 ( T )= q 1 。平台目标函数对应HJB方程为: ρ 1 2 P 1 ( t ) x 2 = max u 1 { h 1 x 2 1 2 k 1 u 1 2 + V 1 t + μ 1 ( t,x ) V 1 x + 1 2 σ 2 2 V 1 x 2 } ,平台价值函数 V 1 ( t,x )= 1 2 P 1 ( t ) x 2 求偏导数:

V 1 t = 1 2 P ˙ 1 ( t ) x 2 , V 1 x = P 1 ( t )x, 2 V 1 x 2 = P 1 ( t ). (11)

将(11)代入HJB中 1 2 ρ P 1 x 2 = max u 1 { h 1 x 2 1 2 k 1 u 1 2 + 1 2 P ˙ 1 x 2 + P 1 x[ ( a+ c 2 P 2 k 2 )x+( b+ b c 2 P 2 a k 2 ) u 1 ]+ 1 2 σ 2 P 1 } ,接下来求解平台最优策略 u 1 * ,提取 u 1 相关项: 1 2 k 1 u 1 2 + P 1 x( b+ b c 2 P 2 a k 2 ) u 1 ,对 u 1 求一阶偏导并令其为0: u 1 ( 1 2 k 1 u 1 2 +b P 1 x( 1+ c 2 P 2 a k 2 ) u 1 )= k 1 u 1 +b P 1 x( 1+ c 2 P 2 a k 2 )=0 。解得平台最优监管策略: u 1 * ( t )= b P 1 ( t ) k 1 ( 1+ c 2 P 2 ( t ) a k 2 )x( t )= K 1 ( t )x( t ) ,其中 K 1 ( t )= b P 1 ( t ) k 1 ( 1+ c 2 P 2 ( t ) a k 2 ) ,这就完成了(4)的证明。将 u 1 * ( t ) 代入HJB方程,得到平台的Riccati方程:

P ˙ 1 ( t )+( ρ2a ) P 1 ( t ) b 2 P 1 2 ( t ) k 1 ( 1+ c 2 P 2 ( t ) a k 2 ) 2 2 c 2 P 1 ( t ) P 2 ( t ) k 2 +2 h 1 =0, P 1 ( T )= q 1

4. 数值仿真

为了探究电商平台评论治理中监管与激励的动态适配问题在不同情况下的变化趋势以及与相关因素的关系,本文利用Matlab软件模拟了不同情境下的博弈。为确保仿真结果贴合生鲜电商实际运营场景,参数则沿用[12][13]提出的经典微分博弈基准值,适配生鲜场景特性。具体参数取值依据如下表1所示:

Table 1. Numerical analysis parameters

1. 数值分析中的参数

参数

数值

参数

数值

a

−0.02

x 0

0.6

b

0.55

h 1

0.85

c

0.65

k 1

1.2

σ

0.1

h 2

0.8

T

30

k 2

0.9

ρ

0.05

利用上述参数进行仿真分析,模拟了平台监管强度和电商激励强度收益及系数随时间的演化趋势。

图1的评论可信度演化轨迹:前期( t[ 0,25 ] )评论可信度 x( t ) 维持在初始值0.6附近,在时域末期( t[ 25,30 ] )呈现指数级激增,这体现了时域约束的策略集中效应:双方在前期优先控制成本,将资源集中投入至时域末期,通过高强度策略快速提升可信度。平台监管强度轨迹:平台监管强度 u * ( t ) 的演化趋势与可信度高度同步,前期维持0投入,末期随可信度激增。这验证了论文结论:平台监管强度是评论可信度的线性反馈函数( u( t )= K 1 ( t )x( t ) ),可信度的动态变化直接驱动监管策略调整。商家激励强度轨迹:商家激励强度 v * ( t ) 的数值始终高于平台监管强度,证实了论文中商家主导效应。反馈系数演化对比:平台反馈系数与商家反馈系数在前期维持稳定,末期随时间剩余量减少而快速下降,体现了“时域约束 + 可信度驱动”的双重动态特性。

图2平台收益系数对商家激励强度的三维调节效应清晰展示了参数 h 1 (平台收益系数)的调节作用:当 h 1 固定时,商家激励强度 v * ( t ) 随时间推移呈现“前期低、末期高”的趋势,与二维轨迹图的结论一致;当时间 t 固定时, h 1 越大,商家激励强度越高:这一结果验证了论文结论:平台收益系数的提升会倒逼商家加大激励投入,因此平台会通过强化监管策略引导商家配合,进而提升自身收益。

Figure 1. Evolution trajectory diagram of review credibility and strategy intensity

1. 评论可信度与策略强度演化轨迹图

Figure 2. Effect diagram of platform profit coefficient on merchant incentive intensity

2. 平台收益系数对商家激励强度的效应图

5. 结论与建议

5.1. 主要结论

首先,有限时域下双方策略呈现双重动态特性:平台监管强度与商家激励强度均为评论可信度的线性反馈函数,前期重投入快速提升可信度,后期稳投入控制成本,贴合电商短期运营实际。平台可通过监管策略引导商家激励投入,实现评论生态优化;商家激励强度高于平台监管强度时,可信度提升效率更优,二者协同可最大化整体收益。

其次,策略临界条件明确且具有实践指导意义:平台放弃监管的参数条件:当平台监管成本系数 k 1 满足 k 1 > 2 b 2 h 1 T ρ( 1 e ρT ) 时,监管边际成本持续高于边际收益。基于基准参数( h 1 =0.85 T=30 ρ=0.05 b=0.55 )计算可得临界值 k 1 1.8 ,即当 k 1 >1.8 时,平台监管投入的增量成本无法通过可信度提升带来的收益覆盖,放弃监管可降低无效成本。商家激励破坏可信度的临界点:引入过度激励负向修正项 δ (表征激励引发刷单、虚假评论的负向影响系数),当商家激励强度 v( t )> v * ( t )=c( δa )x( t ) 时,过度激励会导致虚假评论占比激增,反而破坏评论可信度。基于基准参数( λ=0.02 δ=0.01 c=0.65 x( t )[ 0.6,0.9 ] )计算可得 v * ( t )[ 0.01,0.02 ] (实际场景需结合参数量级缩放),即激励强度超过该阈值时,“激励–可信度”的正向关系逆转,形成“过度激励–虚假评论–可信度下降”的恶性循环。

5.2. 实际应用策略建议

对电商平台的建议分周期动态监管:短期(如季度)加大监管投入,通过筛查、人工审核等手段快速剔除虚假评论;长期(如年度)采用“前期引导、后期维持”模式,降低监管成本,聚焦生态稳定。优化参数适配:根据行业成本水平调整监管力度,通过商家激励补位;设置合理终端价值权重,平衡短期流量与长期公信力,避免过度追求短期收益忽视评论质量。对于入驻商家,跟随监管动态调整激励:观测平台监管强度变化,监管严格时加大真实评论激励(如优质评论奖励),监管宽松时适度控制激励成本,避免无效投入。适配时域规划投入:短期聚焦快速提升口碑,前期加大激励力度抢占市场;长期优化激励结构,结合自身收益水平设定投入上限,维持可信度稳定。对行业而言,规范平台监管与商家激励行为,遏制虚假刷评等乱象;引入第三方机构监测评论可信度,降低随机干扰对生态的冲击,构建良性竞争环境。

基金项目

国家自然科学基金资助项目[71961003];贵州省科技计划项目[QKH-LH(2017)7223]。

参考文献

[1] Cui, G., Chung, Y., Peng, L. and Zheng, W. (2022) The Importance of Being Earnest: Mandatory vs. Voluntary Disclosure of Incentives for Online Product Reviews. Journal of Business Research, 141, 633-645. [Google Scholar] [CrossRef
[2] Chen, J., Guo, Z. and Huang, J. (2022) An Economic Analysis of Rebates Conditional on Positive Reviews. Information Systems Research, 33, 224-243. [Google Scholar] [CrossRef
[3] 胡颖, 张瑞轩, 李思慧, 等. 基于微分博弈的生鲜电商供应链优化策略研究[J]. 商展经济, 2025(4): 116-119.
[4] Hai, X., Liao, T. and Zhao, C. (2023) Fresh Produce E-Commerce Supply Chain Coordination Considering Promotional and Freshness-Keeping Efforts. Journal of Information Processing Systems, 19, 513-526.
[5] 李明琨, 葛艺博. 好评奖励的有限理性经济策略与演化博弈分析[J]. 上海理工大学学报, 2021, 43(2): 202-212.
[6] Sun, Y. and Qu, Q. (2025) Platform Governance, Institutional Distance, and Seller Trust in Cross-Border E-Commerce. Behavioral Sciences, 15, Article 183. [Google Scholar] [CrossRef] [PubMed]
[7] Edelman, B. and Wright, J. (2015) Price Coherence and Excessive Intermediation. The Quarterly Journal of Economics, 130, 1283-1328. [Google Scholar] [CrossRef
[8] Schwartz, M. and Vincent, D.R. (2020) Platform Competition with Cash‐back Rebates under No Surcharge Rules. The Journal of Industrial Economics, 68, 298-327. [Google Scholar] [CrossRef
[9] Rochet, J. and Tirole, J. (2003) Platform Competition in Two-Sided Markets. Journal of the European Economic Association, 1, 990-1029. [Google Scholar] [CrossRef
[10] Chen, Y. and Xie, J. (2008) Online Consumer Review: Word-Of-Mouth as a New Element of Marketing Communication Mix. Management Science, 54, 477-491. [Google Scholar] [CrossRef
[11] Akerlof, G.A. (1970) The Market for “Lemons”: Quality Uncertainty and the Market Mechanism. The Quarterly Journal of Economics, 84, 488-500. [Google Scholar] [CrossRef
[12] Isaacs, R. (1965) Differential Games. John Wiley & Sons.
[13] Başar, T. and Olsder, G.J. (1998) Dynamic Noncooperative Game Theory. 2nd Edition, Society for Industrial and Applied Mathematics. [Google Scholar] [CrossRef
[14] Yong, J. (2002) A Leader-Follower Stochastic Linear Quadratic Differential Game. SIAM Journal on Control and Optimization, 41, 1015-1041. [Google Scholar] [CrossRef
[15] Du, K. and Wu, Z. (2019) Linear‐Quadratic Stackelberg Game for Mean‐Field Backward Stochastic Differential System and Application. Mathematical Problems in Engineering, 2019, Article ID: 1798585. [Google Scholar] [CrossRef
[16] Zheng, Y. and Shi, J. (2019) A Stackelberg Game of Backward Stochastic Differential Equations with Applications. Dynamic Games and Applications, 10, 968-992. [Google Scholar] [CrossRef
[17] Shi, J., Wang, G. and Xiong, J. (2016) Leader-Follower Stochastic Differential Game with Asymmetric Information and Applications. Automatica, 63, 60-73. [Google Scholar] [CrossRef
[18] Wang, G., Xiao, H. and Xiong, J. (2018) A Kind of LQ Non-Zero Sum Differential Game of Backward Stochastic Differential Equation with Asymmetric Information. Automatica, 97, 346-352. [Google Scholar] [CrossRef
[19] Shi, J., Wang, G. and Xiong, J. (2017) Linear-Quadratic Stochastic Stackelberg Differential Game with Asymmetric Information. Science China Information Sciences, 60, Article No. 092202. [Google Scholar] [CrossRef
[20] 高婷. 我国生鲜农产品供应链协调策略研究[J]. 商展经济, 2023(21): 105-108.
[21] 刘静雯, 李向洋, 杨海娟. 新零售模式下盒马鲜生电商运营策略研究[J]. 商展经济, 2020(14): 18-20.
[22] Riazati, M., Shajari, M. and Khorsandi, S. (2018) An Incentive Mechanism to Promote Honesty among Seller Agents in Electronic Marketplaces. Electronic Commerce Research, 19, 231-255. [Google Scholar] [CrossRef