1. 引言
近年来,电子商务发展迅速,我国网上零售额稳居全球首位。2024年我国网上零售额达15.5万亿元,其中实物商品网上零售额为13.1万亿元,占社会消费品零售总额的31.82% [1]。电子商务的可持续发展离不开相关退货政策的出台和退货服务的完善。早期的退货政策,由于物流和技术条件的限制,往往设置较为严格,以解决“退货难”的问题,确保交易的顺利进行。这一时期的政策重点在于保护商家的利益,避免因退货带来的额外成本和潜在损失。然而,随着市场竞争的加剧和消费者需求的多样化,中期退货政策开始转向保护消费者权益,旨在提升消费者体验和忠诚度。商家通过放宽退货条件、简化退货流程、提供无忧退换服务等措施,来吸引更多消费者,增强市场竞争力。这种转变在一定程度上促进了电子商务的进一步发展,但同时也埋下了退货率上升的隐患。现如今,行业中各大平台为争夺有限的市场份额进一步放宽退货政策,虽短期刺激了消费,但过于宽松的退货政策可能会使消费者“有机可乘”,随意使用无理由退货以最大化自己的利益,在享受退货权利的同时却也在滥用退货权,使得网络商家的退货率越来越高。2024年,女装类目在传统电商渠道的退货率普遍维持在50%~60%,部分商家甚至高达75%;而在直播电商领域,退货率更是突破80%大关,个别商家甚至逼近90% [2]。这一高退货率现象不仅让商家面临巨大的库存压力和利润缩水,也影响了消费者的购物体验以及碳排放增加和包装废弃物污染加剧。尤其在“双碳”目标背景下,国家政策明确要求减少资源浪费与环境污染,而高退货率引发的运输能耗、包装垃圾等问题与绿色发展理念背道而驰,并对其可持续发展构成制约。因此这一问题的治理需要政府、商家与消费者三方形成合力,协同应对。
对于网络购物中的机会主义行为研究,许多学者多从其产生的原因以及带来的影响出发。例如,刘涵秋等[3]研究发现宽松的退货政策使消费者产生更高的感知质量和更低的感知风险,进而增强消费者购买意愿。因此不少商家为提升自身竞争力,促进商品销售,同时提高客户满意度,从而提供了愈发宽松的退货政策。郝皓等[4]对网络购物消费者退货行为的不同类型进行了具体划分,分析了消费者机会主义退货行为的影响因素及影响结果,表明过度宽松的退货政策是引发机会主义退货行为的主要原因之一。Guang等[5]通过比较根据消费者期望和消费者类型得到不同情况下的零售商利润函数,得出退货机会主义程度和其获取的利益大小程度对零售商利润的影响,研究结果表明机会主义的增加会增加零售商的运营成本进而损害零售商的利润。对于退货问题的研究,国内外学者主要采用博弈论等建立模型,从企业利润最大化、供应链绩效最优出发,探讨退货政策和协调机制等问题。如,陆媛媛等[6]考虑了竞争性零售商不同退货运费险政策的选择对其利润最大化及相关参数的影响,建立了具有竞争性的零售商的Stackelberg主从博弈模型,寻求两个零售商的最优定价和最优服务水平。赵晓敏等[7]针对退货运费承担问题,重点比较消费者承担退货运费、商家承担退货运费、双方共同承担退货运费三种策略,探讨不同策略下在线零售商的最优定价及其盈利能力。窦茂伟等[8]基于当今电商店家、买家和电商平台管理者参入的模式,分析了时间成本,退货补偿和平台监管等因素对消费者退货的影响,基于动态博弈理论,对买家和店家在不同条件下的博弈收益进行分析,分别找出其博弈的均衡结果。也有学者从环保角度出发来探讨行业的可持续发展。如,邱优[9]结合环境税背景和闭环供应链再制造发展,基于竞争市场环境中,研究环境税政策对竞争企业和闭环供应链运营决策和生产定价的影响,探讨不同环境税下再制造闭环供应链渠道结构策略,并分析不同环境税时的社会福利及实现社会福利的最大化的最优环境税。韩小雅等[10]考虑消费者环保意识的影响,构建企业和电商平台之间的Stackelberg博弈模型,企业选择转销或代销模式进入平台,电商平台通过制定绿色营销努力带动绿色消费,绿色市场促进企业减排。
目前关于退货政策的相关研究主要集中在如何制定退货策略以提高消费者的购买意愿和增加零售商的利润,且多侧重于单一维度的影响分析。因此本文创新性地将三维主体(政府、平台商家、消费者)纳入博弈框架,构建一个三方Stackelberg博弈模型,刻画政策规制下多主体决策互动机制。政府通过设立环保标准与奖惩机制引导平台商家行为;商家基于成本收益调整定价和退货相关服务条款,进而影响消费者的购买和退货决策。本研究将建立动态博弈方程,求解均衡状态下各主体的最优策略组合,并通过数值仿真验证模型有效性。本研究旨在揭示环保约束下电商供应链的多方博弈规律,提出兼顾经济效率与环境效益的退货管理方案。理论层面,拓展Stackelberg博弈在绿色供应链领域的应用场景,完善多方动态博弈建模方法;实践层面,为政府制定差异化奖惩政策、平台商家优化退货策略提供决策依据,助力电商行业可持续发展与国家生态文明建设。研究成果对实现“经济–社会–环境”三重效益协同具有重要参考价值。
2. 博弈模型构建
2.1. 模型假设
本文通过构建三阶段Stackelberg博弈模型,刻画政策规制下多主体决策互动机制,提出兼顾经济效率与环境效益的退货管理方案。实际生活中,每个消费者在购买产品之前只能大概地判断产品是否符合需求,在收到产品进行试用后这种不确定性才会消失。假设每个消费者对产品的估值为
,
服从区间为
的均匀分布,即
,每位消费者根据自身效用最大化原则做出保留或退货决策。为了简化模型,本文做出如下假设:
假设1:市场为Stackelberg博弈结构,政府作为领导者首先制定环保标准与奖惩机制,商家为跟随者,消费者为最终响应者。各主体信息透明,决策顺序明确;
假设2:无缺陷退货,即消费者退货不是因为产品本身存在缺陷,而是因为不匹配自身需要或者有机会主义行为;
假设3:允许退货时,保留不符合实际需要的产品对理性消费者而言没有任何价值,这代表消费者不满意时一定会退货;
假设4:市场中存在机会消费者,只有在收到产品后才决定是否表现出投机行为。若消费者体验时认为产品达到了实际预期但是依然选择使用一段时间后退还,那么消费者就确认为是机会消费者;反之,若是留下产品,那么消费者就不是机会主义消费者;
假设5:考虑包邮的情况,商品的零售价格中包含送货运费;
假设6:消费者需求同时受到商品价格和退货政策的影响,表现为市场需求是商品价格的递减函数,是退款金额的递增函数,即退款金额的增加会促进需求的增长;
假设7:退货数量主要受到退货政策的影响,退款金额的增多会导致退货数量的增加,即退货数量是退款金额的递增函数;
假设8:在线零售商对消费者退货给予全额退款;
假设9:退货运费按配送标准单程定价。
参数设定如表1所示。
Table 1. Symbol explanation
表1. 符号说明
符号 |
定义 |
|
消费者对产品的估值 |
|
产品的单位成本 |
|
单位产品的退货处理成本(销毁、再回收、再处理) |
|
产品的销售价格 |
|
退货运费 |
|
消费者承担退货运费比例(
) |
|
退货人群中机会主义消费者所占比例(
) |
|
机会主义消费者使用产品期间获得的产品效用率 |
|
需求量(
) |
|
退货量(
) |
|
消费者效用 |
|
零售商利润函数 |
|
单位退货环境损耗成本 |
|
环境基准 |
|
政府社会福利函数 |
2.2. 消费者决策
消费者决策过程为:零售商向市场公布产品售价,此时消费者进入市场;消费者则根据商品效用考虑是否购买产品;当收到产品之后,消费者根据产品与需求的匹配程度决定是否退回产品,即消费者效用最大化。最大效用原理是指在风险和不确定条件下,个人的决策行为准则是为了获得最大期望效用值并非最大期望金额值。效用估值是消费者的主观感知,故消费者的预期效用要根据商品在消费者心中主观价值
、销售价格
、消费者退货时返回商品运费
综合考虑得出。商家提供退货服务时的消费者决策顺序,如图1所示。
Figure 1. Consumer decision-making process
图1. 消费者决策过程
消费者购买商品后,满意且保留商品,所得到的效用为
如果消费者选择退回商品,有两种情况,一种是理性消费者不满意且退回,一种是机会主义消费者满意但退回,所得到的效用为
仅当
,效用大于0时消费者才会选择购买;当
时,可得
,
为行为分界点。由此可划分消费者的行为区域,
时,消费者离开市场;
时,消费者购买并退货;
时,消费者购买并保留。
2.3. 商家运营决策
基于消费者“最大期望效用”原则,构造了需求函数和退货函数。本文为了更接近实际及突显退货运费对需求、退货量及利润的影响,认为需求函数受商品价格和退货运费的影响。则有需求函数(即交易量):
其中,
,表示基本需求量;
,表示商品价格对需求的影响程度;
,表示退款金额对需求的影响程度。通常情况下,零售价格对商品需求的影响大于退款金额对需求的影响,因此有
。
消费者的退货决策受到退货政策的影响,表现为退款金额的增多会引起退货数量的增加,当消费者承担退货运费时,消费者获得的实际退款金额为
,此时退货率为:
则实际退货量为:
其中,
表示基本退货率;
表示退款金额对退货量的影响程度;
表示机会主义占比对退货率的影响程度。通常一项退货政策对需求的刺激作用大于其对退货的影响,因此假定
。
在线零售商利润函数为:
式中,
为在线零售商的销售利润;
为在线零售商根据商品售价给予消费者的退款;
为在线零售商对退货进行处理的费用(如检测、再包装费用等);
为在线零售商按比例承担的退货运费。
2.4. 政府政策决策
假设每单位退货会造成
的环境损失,包含包装废弃物与逆向运输碳排放等。设总退货量为
,则环境总成本为:
为了降低退货造成的负面环境影响,政府设定退货环保基准
,作为社会能容忍的最大环境损耗标准,并在环保标准的基础上实施奖惩机制,当退货造成的环境成本未超过标准
时,即实际环境成本
,政府给予零售商奖励;反之,处以罚金。
设政府单位奖惩强度为
,则政府对零售商的奖惩项为:
实际交易量,多交易才有奖惩,解决“无交易获奖”问题。
环保偏差,衡量当前系统是否“超排”或“低碳”,决定奖惩方向(正为奖励,负为罚款)。
消费者承担比例越高(
趋近1),商家承担越少,奖惩削弱;商家承担越多(
趋近0),奖惩放大。
该值可为正(奖励)或负(处罚),则加入政府奖惩的零售商利润函数为:
政府目标为最大化社会福利,包括消费者剩余(
)、零售商利润(
)、以及环境成本影响(
),形式如下:
根据消费者估值
,行为区间为:
,不购买;
,购买并退货;
,购买并保留(产生剩余),因此消费者剩余为
代入
得,
则社会福利函数为
3. 模型求解与算例分析
3.1. 逆向归纳法求解
由于模型无法求得解析解,本文采用逆向归纳法结合粒子群优化算法求解三阶段Stackelberg博弈均衡,逆向归纳法的求解顺序为:1) 消费者决策层:基于给定的价格
和运费分担比例
,通过效用函数划分购买-退货行为区间,计算需求
和退货量
;2) 商家决策层:以利润最大化为目标,在消费者响应函数约束下,优化定价
和
;3) 政府决策层:以社会福利最大化为目标,通过调整奖惩强度
和环保基准
,引导商家策略优化。逆向归纳法求解顺序如图2所示。
Figure 2. Flowchart of reverse solution
图2. 逆向求解流程图
3.2. 参数设定
本文使用Python软件进行数值求解,设置迭代精度为10−6,种群规模100,最大迭代次数500。参考现有研究及电商行业实际运营数据[7],设定基础参数如表2所示。
Table 2. Parameter settings
表2. 参数设定
参数 |
含义 |
数值 |
|
市场基础潜在需求 |
1500 |
|
价格影响系数 |
7 |
|
退款政策影响系数 |
4 |
|
基础退货率 |
0.3 |
|
退款金额对退货敏感度 |
0.2 |
|
机会主义对退货敏感度 |
0.6 |
|
单位产品成本 |
50 |
|
退货运费 |
10 |
|
单位退货环境损耗成本 |
5 |
|
机会主义使用价值感知 |
0.5 |
|
机会主义退货占比 |
|
|
奖惩强度 |
|
|
环境基准 |
|
|
商品售价 |
|
|
退货运费承担比例 |
|
3.3. 结果与分析
固定其他参数不变,逐步调整
,记录需求量、退货率、商家利润、环境成本和社会福利核心指标值,最优策略组合如表3所示。
Table 3. Optimal strategy combinations and target indicators under different theta values
表3. 不同
值下的最优策略组合及目标指标
|
|
|
|
|
D |
r |
|
|
W |
0.1 |
0.22 |
2100 |
82.3 |
0.28 |
1450 |
9.8% |
48,250 |
720 |
63,580 |
0.2 |
0.28 |
1800 |
89.5 |
0.32 |
1380 |
11.5% |
42,680 |
820 |
58,350 |
0.3 |
0.35 |
1600 |
95.7 |
0.38 |
1300 |
16.2% |
38,950 |
1050 |
52,680 |
0.4 |
0.43 |
1400 |
101.2 |
0.43 |
1220 |
22.6% |
35,120 |
1320 |
48,920 |
0.5 |
0.52 |
1200 |
105.8 |
0.49 |
1150 |
27.3% |
31,250 |
1560 |
45,120 |
0.6 |
0.61 |
1000 |
112.5 |
0.57 |
1030 |
33.5% |
26,840 |
1890 |
39,850 |
0.7 |
0.68 |
850 |
119.6 |
0.65 |
950 |
38.7% |
22,560 |
2180 |
35,620 |
0.8 |
0.76 |
750 |
128.3 |
0.75 |
890 |
43.8% |
18,920 |
2460 |
32,780 |
0.9 |
0.85 |
600 |
135.4 |
0.82 |
820 |
51.2% |
15,380 |
2850 |
28,450 |
由表可知,机会主义消费者占比
从0.1增至0.9的过程中,三方最优策略呈现出显著的协同演变特征:政府奖惩强度
从0.22升至0.85,环保基准
从2100降至600,商家售价
从82.3涨至135.4,消费者运费承担比例
从0.28升至0.82。市场中机会主义占比对各方最佳策略选择呈现出如下规律:(1) 当机会主义占比较低时(如
),政府采用高基准低奖惩的组合(如
时
、
),此时机会主义行为可控,政策重心应放在维护市场活力,避免过度干预抑制合理消费。商家可保持较低
(0.22~0.35),承担大部分退货运费,通过宽松退货条款吸引消费者购买,同时适度定价(82.3~95.7)来平衡利润与销量;机会主义占比处于中高水平(如
),政府采取提高奖惩强度来强化政策约束力,同时降低环保基准倒逼商家控制退货;商家则通过提高售价直接弥补机会主义退货行为造成的运营成本,令消费者承担更高比例的退货运费以此增加消费者退货的经济门槛,直接抑制其投机行为。
4. 环境政策对退货决策的影响分析
选取
(低机会主义)、
(中机会主义)和
(高机会主义)三个典型情景,设置对照组(无政府干预:
)与实验组(有政府干预:采用最优
和
),在相同
水平下对比有无政府干预情况下的各项指标,如图3所示。
Figure 3. Comparison of index values with and without government intervention under different
values
图3. 不同
值下有无政府干预的指标数值对比
由图可知,政府干预对各项指标均产生显著的正向影响,且无论市场中机会主义消费者占比处于何种水平,政府干预均能发挥积极作用:(1) 在
(低机会主义)时,政府干预后需求从1250增至1380,较无干预增长10.4%;干预使退货率从17.8%降至11.5%,下降35.4%;商家利润从34,200增至42,680,提升24.8%;社会福利从46,200增至58,350,提升26.3%;环境成本从1240降至820,减少34.0%。(2) 在
(中机会主义)时,政府干预后需求从980增至1150,增幅达17.3%;退货率从42.3%降至27.3%,降幅32.1%;利润从22,800增至31,250,增幅达37.1%;社会福利从33,000增长至45,120,增幅36.7%;环境成本从2530降至1560,降幅33.6%。(3) 在
(高机会主义)时,政府干预后需求从750提升至890,增长18.7%;退货率从58.6%降至43.8%,减少25.3%;利润从12,560增至18,920,增长50.6%;
时,社会福利从23,500提升至32,780,增长39.5%;环境成本从3520减少至2460,下降30.1%。
由数据变化趋势可知,随着机会主义消费者占比升高,政府干预的边际效益呈现效果越显著特征:需求提升幅度从10.4%增至18.7%,增幅扩大8.3个百分点;商家利润提升幅度从24.8%增至50.6%,增幅扩大25.8个百分点;社会福利提升幅度从26.3%增至39.5%,增幅扩大13.2个百分点。由此可得,干预能够显著提升需求、商家利润与社会福利,同时降低退货率与环境成本。且在机会主义行为泛滥,政府干预的效果更为突出。政府的政策干预并非简单的成本转嫁,而是通过合理设计奖惩强度
和环保基准
,引导商家在刺激需求与控制退货之间找到最佳平衡点,最终实现经济、社会和环境效益的协同优化。
5. 结语
本文针对电商行业中过度退货引发的经济与环境可持续性问题,基于Stackelberg博弈理论构建政府、商家与消费者三方动态博弈模型,系统探讨了多方协同决策对退货生态的调节作用。通过数值仿真与对比分析,揭示了机会主义消费者占比(
)对各方决策的影响规律,验证了政府干预在平衡“需求刺激–成本控制–环境保护”中的核心价值,为电商退货治理提供了理论依据与实践路径。
研究发现,机会主义行为是驱动退货生态恶化的关键变量,
值升高会导致需求萎缩、退货率攀升、商家利润缩水与环境污染加重的连锁反应;其次,政府干预需实施差异化策略,针对低
市场采用“宽松基准 + 温和奖惩”组合,针对高
市场切换为“严格基准 + 强奖惩”模式,商家也需同步调整策略,适当提价和提升消费者承担退货运费比。政府通过动态调整环保基准(
)与奖惩强度(
)引导商家优化定价(
)与退货运费分担比例(
)共同抑制退货;此外,政府干预的边际效益随
值升高而递增,在高机会主义市场中,干预可使商家利润提升50.6%、社会福利增长39.5%,同时实现环境成本降低30.1%,印证了政策手段对市场失灵的干预作用。
从理论层面看,本研究突破了单一主体视角的局限,将政府环保规制纳入电商退货博弈框架,通过构建包含环境成本与社会福利的目标函数,拓展Stackelberg博弈在绿色供应链领域的应用场景,为多主体动态决策建模提供了新思路。
实践层面,研究结论为电商退货治理提供了可操作的方案:对政府而言,需建立与
值联动的动态政策体系,完善退货环境成本核算标准,通过阶梯式奖惩机制强化政策弹性;对商家而言,可依据
值优化定价与运费分担策略,针对高机会主义用户群体实施“高运费分担 + 精准营销”组合策略,从源头抑制非理性退货;对消费者行为而言,平台可依托用户行为数据构建退货信用评分体系,将历史退货率与运费权益挂钩,通过权益差异化引导消费者形成“理性消费–良性退货”的正向循环。但研究仍存在一定局限:模型假设设定简化,未涉及市场竞争对退货策略的影响;未纳入退货商品再制造价值对利润与环境成本的调节作用。未来可拓展至竞争性市场分析,结合闭环供应链理论完善模型,并通过细分行业调研提升参数适配性。
NOTES
*通讯作者。