考虑消费者跨期囤货的AI直播供应链促销研究
A Study on AI-Powered Live Streaming Supply Chain Promotions Considering Consumers’ Intertemporal Stockpiling Behavior
摘要: 本文构建了一个由品牌商与采用AI主播的网络零售商组成的两期直播供应链博弈模型,考察在消费者存在跨期购买与囤货行为的情境下,不同促销策略对供应链定价与利润分配的影响。研究比较了“买一送一”(BOGO)、“阶段性降价”(PR)与“天天低价”(EDLP)三类典型促销机制。研究结果发现:在AI直播背景下,当消费者持有成本较高时,BOGO策略因有效激励即时批量购买而优于EDLP;PR策略仅在持有成本与边际估值因子满足特定区间条件时才具备优势。进一步地,BOGO策略下的批发价格与供应链利润均随持有成本上升而提高,而PR策略则呈现相反趋势。相比之下,EDLP策略凭借其价格稳定性及对跨期行为协调需求的弱依赖,在持有成本较低或信息不对称程度较高的环境中展现出更强的稳健性。在AI驱动的直播电商环境中,消费者的囤货行为如何影响供应链上下游之间的博弈均衡,也为品牌商与采用数字人技术的零售商在促销策略选择、定价协同与AI投入回报优化方面提供了重要的理论依据与实践启示。
Abstract: This paper constructs a two-stage live-streaming supply chain game model involving brand manufacturers and online retailers employing AI hosts. It examines how different promotional strategies impact supply chain pricing and profit distribution when consumers engage in cross-period purchasing and stockpiling behaviors. The study compares three typical promotional mechanisms: Buy One Get One Free (BOGO), Periodic Discounting (PR), and Everyday Low Pricing (EDLP). Findings reveal that under AI-streaming conditions, when consumer holding costs are high, the BOGO strategy outperforms EDLP by effectively incentivizing immediate bulk purchases. The PR strategy only gains an advantage when holding costs and marginal valuation factors fall within specific ranges. Furthermore, wholesale prices and supply chain profits under BOGO increase with rising holding costs, while PR exhibits the opposite trend. In contrast, the EDLP strategy demonstrates greater robustness in environments with low holding costs or high information asymmetry, owing to its price stability and minimal reliance on intertemporal behavioral coordination. How consumer stockpiling behavior influences the equilibrium of supply chain interactions within AI-driven livestream e-commerce also provides crucial theoretical foundations and practical insights for brands and retailers utilizing digital avatar technology in promotional strategy selection, pricing coordination, and optimizing AI investment returns.
文章引用:李浩镛. 考虑消费者跨期囤货的AI直播供应链促销研究[J]. 管理科学与工程, 2026, 15(2): 415-428. https://doi.org/10.12677/mse.2026.152041

1. 引言

根据《中国新电商发展报告(2025)》(以下简称《报告》)显示,2024年中国网络零售额达15.5万亿元,同比增长7.2%,拉动社会消费品零售总额增长1.7个百分点。在这一背景下,品牌商纷纷与主播合作构建“直播 + 传统电商”的双渠道销售体系,通过高频次、强互动的直播内容激发消费需求,直播电商用户规模近6亿,渗透率从2019年的4.9%跃升至2024年的37.8%。为提升用户转化效率、刺激消费需求并加速销售转化,各类促销策略被广泛应用于零售、电商及本地生活等多个场景中。《报告》指出,AI大模型已深度渗透直播选品、智能客服等关键环节,78%的直播电商积极应用生成式AI优化运营流程,虚拟主播与个性化推荐系统重构了消费决策路径,让消费者购物决策更加高效精准。尤其AI主播具备成本可控、可7 × 24小时运行、内容标准化等优势,在快消品等高频复购品类中展现出显著应用潜力。

关于商品的促销策略目前已有较成熟的研究结果,Blattberg [1] [2]研究了非耐用品价格促销和贸易促销对销量与利润的影响;Assuncao [3]指出促销对实际消费的长期提升作用有限,其主要影响是改变购买时间而非总消费量;Gönül [4]发现消费者对未来优惠券的预期会显著延迟其购买行为;Chan [5]揭示了促销不仅改变购买时机,也能在一定程度上创造真实新增需求。消费者对不同促销形式的感知存在显著差异,例如Sinha [6]发现绝对金额比百分比更容易被消费者理解;Hardesty [7]认为复杂的促销形式会降低可信度与吸引力,简单直接的呈现形式更受消费者青睐;Kamins [8]指出尽管“免费”赠品具有心理吸引力,但当消费者感知到隐性成本时,其对整体促销价值的判断会显著降低;Gordon-Hecker [9]证明“买一送一”比等价折扣更加吸引注意力,Kim [10]补充“买一送一”能更好地筛选高价值消费者并平滑需求,Ailwadi [11]提出促销是否提升零售商利润高度依赖于具体情境——包括品类价格弹性、品牌定位、促销类型及门店特征,盲目开展促销可能还会损害盈利能力。在供应链层面,促销策略不仅会影响消费者行为,更深刻作用于渠道成员间的利益协调与运营决策:Corbett [12]表明数量折扣可缓解供应链上下流间的信息不对称;Cho [13]证明返现比降价更能激励零售商;Levin [14] [15]等人提出阶梯定价可优化库存与收入;Liu [16]指在分销渠道中实施个性化定价可提升制造商和零售商的利润,但其效果取决于渠道成员间的信息共享与协调程度。总的来说降价促销[17]之所以被广泛采用,是因为促销不仅是一种清库存手段,更是一种有效的需求管理工具,通过动态调整价格可实现库存平衡,供需匹配,并在不确定的市场环境下提升供应链整体收益。

近年来,供应链领域的研究逐渐聚焦于直播电商情境,并将主播(包括真人与AI主播)视为影响消费者行为决策的关键变量。刘洋[18] [19]等人指出网络购物对消费意愿的影响,Chang [20]和Liu [21]等人则解释了数字界面如何诱发冲动消费。王玉燕等人[22]-[26]研究了制造商如何选择自播或外部主播以优化收益,强调主播影响力与产品特性的匹配;Zhen等人[27]则从主播角度分析其销售努力程度如何影响促销与定价选择;AI主播的相关研究聚焦于人机差异:王翠翠[28]对比AI与真人主播,发现后者在情感信任和复杂产品沟通上占优,前者则在响应速度与运营成本上更具优势;Niu等[29] [30]进一步探讨了AI直播在跨境业务中的潜力,认为其在多语言支持与数据驱动推荐方面优于真人主播。

总体来看,现有文献在传统营销策略和电商背景下的供应链定价策略方面已取得了丰富的研究成果,通过对相关文献的梳理可以发现:1) 以往文献缺乏在统一框架下对BOGO、PR与EDLP三类策略进行系统比较,同时也忽视了消费者行为对促销选择的影响。2) 大多文献聚焦于传统电商平台或引入真人主播的直播渠道,未考虑引入AI主播后所带来的结构性变化。在AI主播模式下,网络零售商需承担固定技术成本但无库存压力,且促销信息可全天候稳定触达消费者,这使得BOGO、PR等策略的实施逻辑与消费者响应机制显著区别于传统情境。

本文基于现有研究,构建一个包含AI主播、消费者囤货行为的两期供应链模型,系统比较BOGO、PR与EDLP三种典型促销策略的均衡表现,旨在为品牌商与零售商在AI驱动时代的策略制定提供理论依据与实践启示。

2. 模型构建与分析

2.1. 模型基础设定

本文构建了由单一品牌商与单一网络零售商组成的直播供应链两期模型,如图1所示,其中第一期为促销期,第二期为常规期。

品牌商以批发价格向网络零售商供货,网络零售商则借助数字人(AI智能销售助理机器人,简称AI主播)通过电商平台直播带货面向消费者销售,其中品牌商仅决策批发价格,零售价格由网络零售商自主制定,二者构成品牌商主导、网络零售商跟随的Stackelberg博弈。博弈顺序为品牌商先行确定批发价格,网络零售商随后依据该批发价格决策零售价格。

Figure 1. Structure of the live streaming supply chain

1. 直播供应链结构

本文考虑三种促销策略,分别为BOGO策略、PR策略与EDLP策略。其中BOGO策略指第1单位按常规价格出售,第2单位按折扣价;PR策略指第一期所有单位统一降价,第二期则维持原价;EDLP策略指两期均保持固定的低价水平。

Table 1. Symbol meaning

1. 符号含义

决策变量

符号含义

p EN

品牌商使用EDLP时一单位商品价格

p BN

品牌商使用BOGO时第一单位商品常规价格

p BD

品牌商使用BOGO时第二单位商品折扣价格, P BD < P BN

p PD

品牌商使用PR时第一期一单位商品促销价格, P PD < P PN

p PN

品牌商使用PR时第二期一单位商品常规价格

w E

网络零售商使用EDLP时的批发价格

w B

网络零售商使用BOGO时的批发价格

参数

符号含义

k

品牌商一单位商品的生产成本

c

网络零售商为维护AI主播直播带货所承担的固定成本

v

一单位商品的基础估值, v~U[ 0,1 ]

θ

边际估值因子, θ[ 0,1 ]

i

销售策略 i i=B( BOGO ),P( PR ),E( EDLP )

h

每期每单位商品的消费者持有成本

结果

符号含义

π ij

策略 i 下主体 j 的利润, j=o,r o 表示品牌商, r 表示网络零售商

u i,ab

消费者第一期购买 a 个单位以及第二期购买 b 个单位的效用

研究聚焦于包装零食、饮料等需求稳定的商品。鉴于网络零售商多采用厂家直发模式,模型中不纳入其库存持有成本。另外,网络零售商采用AI主播进行直播带货需要承担固定成本 c ,包括AI主播的技术开发、系统维护、数据存储等一次性或周期性支出。假设单期时长足够长,消费者当期消费估值不受往期消费影响[31]——例如家庭本周首盒谷物的消费估值与上周消费无关;同时假设边际估值递减[32]:消费者第一期的基础估值 v 服从 [ 0,1 ] 上的均匀分布,第二期的边际估值为 θv ( θ 为边际估值因子, 0<θ1 ), θ<1 时即体现边际估值递减特征。由于消费者可在任意时期以正常价格购买商品,模型假设其最多以常规价格购买1单位[33]。市场规模在每期内确定且标准化为1,单个消费者每期需求不超过1单位。若消费者在第一期购买2单位,那他会保留1单位到第二期使用,此时则需承担单位持有成本 h 。其余符号请详见表1

2.2. BOGO策略

在第一期中,网络零售商决定提供BOGO策略还是遵循EDLP策略。可能的两期购买组合有以下四种:(0, 0)、(1, 0)、(1, 1)、(2, 0) (括号内数字分别表示第一期和第二期的购买量)。其中,(0, 1)的收益与(1, 0)无差异,故予以剔除;而(0, 2)因与“最多以正常价格购买1单位”的假设冲突,同样不纳入分析。

在BOGO策略中,网络零售商将第1单位的价格设定为 p BN ,第二单位的价格设定为 p BD ( 0,1 ) p BD < p BN 。在第2期,零售商以 p BN 的常规价格销售产品。如果提供EDLP策略是最优的,零售商以 p EN 的单一价格销售产品。

由于效用每期更新一次,以正常价格在第1期购买的消费者也在第2期购买。设 u i,ab 是策略 i 消费者第一期购买 a 单位以及第二期购买 b 单位的效用。消费者可以获得四个效用,分别为 u B,00 =0 u B,20 =( 1+θ )v p BN p BD h u B,11 =2( v p BN ) u B,10 =v p BN

命题1. BOGO策略下消费者的购买决策如下:

p BN p BD <h<1 ,当 0v< p BN 时,消费者的购买决策是(0, 0),否则(1, 1)。

0<h p BN p BD ,当 0<θ< p BD +h p BN 时,估值 v[ 0, p BN ] 的消费者购买决策是(0, 0),估值 v( p BN ,1 ] 的消费者购买决策是(1, 1);当 p BD +h p BN θ1 ,消费者购买决策出现了三种情况:当估值 v[ 0, p BN + p BD +h 1+θ ] 的消费者购买决策是(0, 0),估值 v[ p BN p BD h 1θ ,1 ] 的消费者购买决策是(1, 1),估值 v( p BN + p BD +h 1+θ , p BN p BD h 1θ ) 的消费者购买决策是(2, 0)。

Figure 2. Consumer choice in two phases under BOGO strategy

2. BOGO策略下消费者的两期选择

证明:令四个效用两两相等,可得消费者在BOGO模式下的基础效用阈值分别为 v 0020 * = p BN + p BD +h 1+θ v 0011 * = v 0010 * = v 1011 * = p BN v 2011 * = p BN p BD h 1θ v 1020 * = p BD +h θ 。经计算,上述效用阈值两两取等后,获得的边际估值因子阈值 θ * p BD +h p BN 。当 h> p BN p BD (这意味着持有成本要大于折扣所节省的支付成本)时, p BD +h p BN >1 ,此时 θ< θ * 恒成立,那么 v 2011 * <0< v 0011 * = v 0010 * = v 1011 * <1< v 0020 * < v 1020 * 恒成立。当 0<h< p BN p BD 时, 0< p BD +h p BN <1 。当 θ * <θ1 时, 0< v 1020 * < v 0020 * < v 0011 * = v 0010 * = v 1011 * < v 2011 * <1 。当 1<θ< θ * 时, 0< v 2011 * < v 0011 * = v 0010 * = v 1011 * < v 0020 * < v 1020 * <1 。根据不同情况下四个效用的大小关系,便可得出某估值范围下该采取哪种购买策略,如图2所示。证毕。

命题1阐述了在BOGO策略下消费者的购买决策。当第1单位商品的常规价格与第2单位商品的折扣价格之差小于消费者的持有成本时,其购买决策主要取决于商品的基础估值是否低于 p BN 。这是因为,当持有成本较高时,消费者会更加关注商品的总价值是否超过他们愿意支付的价格。如果第一单位商品的价格已经接近或高于他们的基础估值,他们就不会购买。

然而,当持有成本较低,即 0<h p BN p BD 时,消费者的购买决策会变得更加复杂,此时需要综合考虑边际估值因子和基础估值。如果边际估值因子较小,那么当基础估值较大时,消费者会在两期都进行购买;反之,如果基础估值较小,他们则都不会购买。而当边际估值因子较大时,消费者在原有购买情况的基础上,会出现第一期购买两单位商品的情况。

Table 2. Consumer choice in two phases under BOGO strategy

2. BOGO策略下消费者的两期选择

h

θ

v

购买决策

Case

p BN p BD <h<1

( 0,1 )

N\A

(2, 0)

1

p BN v1

(1, 1)

N\A

(1, 0)

0v< p BN

(0, 0)

0<h p BN p BD

p BD +h p BN θ1

p BN + p BD +h 1+θ <v< p BN p BD h 1θ

(2, 0)

2

p BN p BD h 1θ v1

(1, 1)

N\A

(1, 0)

0v p BN + p BD +h 1+θ

(0, 0)

0<θ< p BD +h p BN

N\A

(2, 0)

3

p BN v1

(1, 1)

N\A

(1, 0)

0v< p BN

(0, 0)

消费者选择的相关条件见表2,通过选择表2中的四种行动中的一种来最大化他们的效用。如果网络零售商制定的价格使 p BN p BD <h<1 ,可能出现情形1;若网络零售商制定的价格使 0<h< p BN p BD ,可能出现情形2和3。在表2的情形1、情形2和情形3中,网络零售商的期望利润分别为

π Br,1 = 0 p BN 0dv + p BN 1 ( 2 p BN 2 w B )dv c=2( p BN w B )( 1 p BN )c

π Br,2 = 0 p BN + p BD +h 1+θ 0dv + p BN + p BD +h 1+θ p BN p BD h 1θ ( p BN + p BD 2 w B )dv + p BN p BD h 1θ 1 ( 2 p BN 2 w B )dv c = 2( p BN w B )( 1h P BD + p BN +θ ) 1+θ + 2( p BD + p BN 2 w B )( h+ p BD θ p BN ) 1+ θ 2 c

π Br,3 = 0 p BN 0dv + p BN 1 ( 2 p BN 2 w B )dv c=2( p BN w B )( 1 p BN )c

网络供应链的最优决策如命题2和命题3所示。

命题2. 在具有BOGO的Stackelberg博弈直播供应链中,对于批发价格,网络零售商的最优决策如下:

1) 如果 h> ( w B 1 )( w B +3 ) 4 ,则提供BOGO优惠,此时取到边界解,即 p BN * = p BD +h

2) 否则,提供EDLP日常低价策略。

命题2明确了在含BOGO策略的Stackelberg博弈直播供应链中,网络零售商选择批发价格策略的核心逻辑。当消费者持有成本较高时,意味着消费者更倾向即时购买、不愿为囤货承担额外成本。而BOGO策略的本质是“单次购多件、单件价更低”,恰好能刺激消费者批量购买——这种策略既能提升单客销量,又能通过规模效应摊薄批发成本,最终推高网络零售商的利润,因此此时会选择BOGO策略,并采用边界解 p BN * = p BD +h

若消费者持有成本较低,消费者则更倾向低价囤货、对价格的敏感度也更高。此时EDLP策略的“单一低价”属性,既能匹配消费者的囤货需求、稳定销量,又能避免BOGO策略的“第二件折扣”对利润空间的挤压,因此选择日常低价策略更优。

命题3. 对于具有BOGO策略的Stackelberg博弈直播供应链:

1) 如果 h> ( w B 1 )( w B +3 ) 4 ,则提供BOGO优惠,此时均衡价格与均衡利润为: w B * =1+2 1+h p BD * =1 p BN * =1+h π OB * =2+4 1+h 2k π rB * =4c+2h4 1+h

2) 否则,提供单一价格(即EDLP,日常低价策略),此时均衡价格与均衡利润为: w E * = 1+k 2 p EN * = 3+k 4 π OE * = 1 4 ( k1 ) 2 π rE * = 1 8 ( ( k1 ) 2 8c )

命题3基于消费者持有成本来判断策略优劣,并计算出具体的均衡利润。当 h> ( w B 1 )( w B +3 ) 4 ,BOGO

策略更优。此时,第二件商品折扣价定为1,刺激批量购买;第一件商品常规价定为 1+h ,覆盖持有成本,利润随 h 增长而提升。若 h 低于阈值,EDLP策略更合适,价格围绕生产成本 k 制定,利润结构更简单。

2.3. PR策略

PR策略可能的两期购买组合也有四种:(0, 0)、(1, 0)、(1, 1)、(2, 0),其中,(0, 1)的收益小于(1, 0),故予以剔除。网络零售商将第1期的价格设定为 p PN ,第2期的价格设定为 p PD p PD < p PN 。如果提供EDLP策略是最优的,零售商以 p EN 的单一价格销售产品。消费者可以获得四个效用,分别为 u P,00 =0 u P,20 =( 1+θ )v2 p PD h u P,11 =2v p PN p PD u P,10 =v p PD

命题4. PR策略下消费者的购买决策如下:

1) 若 p PN p PD <h<1 ,估值 v[ 0, p PD ) 消费者的购买决策是(0, 0),估值 v[ p PD , p PN ] 消费者的购买决策是(1, 0),否则是(1, 1)。

2) 若 0<h p PN p PD ,当 0<θ< p PD +2h h+ p PN 时,估值 v[ 0, p PD ) 消费者的购买决策是(0, 0),估值 v[ p PD , p PN ] 消费者的购买决策是(1, 0),否则是(1, 1);当 p PD +2h h+ p PN θ1 ,消费者购买决策出现了四种情况:估值 v[ 0, p PD ] 的消费者购买决策是(0, 0),估值 v( p PD , p PD +h θ ) 的消费者购买决策是(1, 0),估值 v[ p PD +h θ , p PN p PD h 1θ ] 的消费者购买决策是(2, 0),估值 v( p PN p PD h 1θ ,1 ] 的消费者购买决策是(2, 0)。

证明:令四个效用两两相等,可得消费者在PR模式下的基础效用阈值分别为 v 0020 * = 2 p PD +h 1+θ v 0011 * = p PD + p PN 2 v 0010 * = p PD v 1011 * = p PN v 2011 * = p PN p PD h 1θ v 1020 * = p PD +h θ 。经计算,上述效用阈值两两取等后,获得 v 0020 * 分别与 v 0011 * v 1011 * v 2011 * 边际估值因子阈值 θ 1 * = θ 3 * = 3 p PD +2h p PN p PD + p PN θ 2 * = p PD +h p PN p PN v 1020 * 分别与 v 2011 * v 1011 * 的阈值 θ 4 * = p PD +2h h+ p PN θ 5 * = p PD +h p PN 。当 p PN p PD <h<1 时, θ m * >1 m{ 1,3,4,5 } θ 2 * ( 0,1 ) 。此时当 0<θ< θ 2 * 时, 0< v 0010 * < v 0011 * < v 2011 * < v 1011 * < v 0020 * < v 1020 * <1 ;当 θ 2 * <θ<1 时, 0< v 0010 * < v 0011 * < v 2011 * < v 0020 * < v 1011 * < v 1020 * <1 。当 <0<h< p PN p PD 0< θ 2 * < θ 5 * < θ 4 * < θ 1 * = θ 3 * <1 。此时当 0<θ< θ 2 * 时, 0< v 0010 * < v 0011 * < v 2011 * < v 1011 * < v 0020 * < v 1020 * <1 ;当 θ 2 * <θ< θ 5 * 时, 0< v 0010 * < v 0011 * < v 2011 * < v 0020 * < v 1011 * < v 1020 * <1 ;当 θ 5 * <θ< θ 4 * 时, 0< v 0020 * < v 0010 * < v 0011 * < v 2011 * < v 1020 * < v 1011 * <1 ;当 θ 4 * <θ< θ 1 * 时, 0< v 0020 * < v 0010 * < v 0011 * < v 1020 * < v 2011 * < v 1011 * <1 ;当 θ 1 * <θ1 时, 0< v 0020 * < v 0010 * < v 0011 * < v 1020 * < v 1011 * < v 2011 * <1 。根据不同情况下四个效用的大小关系,便可得出某估值范围下该采取哪种购买策略,如图3所示。证毕。

Figure 3. Consumer choice in two phases under PR strategy

3. PR策略下消费者的两期选择

命题4描述了在PR策略下,消费者的购买决策如何受到持有成本、边际估值因子和估值的影响。当持有成本较高时,估值低于 p PD 的消费者认为商品不值这个价,因此选择不购买。估值在促销价和常规价之间的消费者认为第一期促销价有吸引力,但第二期常规价相对于第一期促销价的提升不够大(因为 p PN p PD <h ),因此不值得等待第二期购买。估值高于 p PN 的消费者则愿意在两期都购买。

当持有成本较低时,若边际估值因子较高,同理低估值的消费者认为商品不值,因此选择不购买。估值在促销价和 p PD +h θ 之间的消费者认为第一期促销价有吸引力,但由于 θ 较大,消费者对额外商品单位的估值较高,因此不愿意在第二期购买。估值高于 p PN p PD h 1θ ,消费者倾向于首期购两单位、放弃二期。若边际估值因子较低,消费者购买逻辑与高持有成本情形相近。

消费者选择的相关条件见表3,通过选择表3中的四种行动中的一种来最大化他们的效用。若网络零售商制定的价格使 p PN p PD <h<1 ,可能出现情形1;若网络零售商制定的价格使 0<h p PN p PD ,可能出现情形2和3。在表3的情形1、情形2和情形3中,网络零售商的期望利润分别为

π Pr,1 = 0 p PD 0dv + p PD p PN ( p PD w P )dv + p PN 1 ( p PD + p PN 2 w P )dv c = p PD p PD 2 + p PN p PN 2 +( 2+ p PD + p PN ) w P c

π Pr,2 = 0 p PD 0dv + p PD p PD +h θ ( p PD w P )dv + p PD +h θ p PN p PD h 1θ ( 2 p PD 2 w P )dv + p PN p PD h 1θ 1 ( p PD + p PN 2 w P )dv c = p PN 2 w P + p PD ( 1 p PD + w P )+ ( p PD p PN )( h+ p PD p PN ) 1+θ ( h+ p PD )( p PD w P ) θ c

π Pr,3 = 0 p PD 0dv + p PD p PN ( p PD w P )dv + p PN 1 ( p PD + p PN 2 w P )dv c = p PD p PD 2 + p PN p PN 2 +( 2+ p PD + p PN ) w P c

网络供应链的最优决策如命题5和命题6所示。

命题5. 在具有PR的Stackelberg博弈直播供应链中,对于批发价格,网络零售商的最优决策如下:

1) 如果 max{ ( 1+θ )( w P +( 2+ w P )θ ) 1+3θ , w P +θ 2( 1+ w P )θ 1+( 2+θ )θ }h min{ 1θ, w P +θ( 2+ w P ) θ 2 + θ 3 3+θ( 2+3θ ) , ( 1+θ ) 2 θ+ ( 1+ w P ) 2 ( 1+θ ) 3 θ( 1+θ ) + w P ( 1+ θ 2 ) 1+ θ 2 } w P < 2 θ 2 θ 3 θ 1 θ 2 ,则提供PR优惠。

2) 否则,提供单一价格(即EDLP,日常低价策略)

命题5界定了Stackelberg博弈直播供应链中,网络零售商在PR策略与EDLP策略之间的批发价格决策规则。当商品持有成本 h 处于由消费者边际估值因子 θ 、PR策略下批发价 w P 共同确定的合理区间,且 w P 低于某一临界水平时,采用PR优惠策略更为适宜;反之,则选择EDLP策略更优。该命题的核心逻辑在于通过关键变量的约束实现收益与风险的平衡:从成本角度分析,较低的 w P 能够减轻零售商首期促销的成本压力,而 h 的区间限制可确保消费者跨期购买行为保持稳定,进而帮助零售商通过差异化定价实现盈利;从消费者行为角度来看, θ 反映了消费者对多单位商品的价值判断,相关约束条件的临界值设置能够使定价与消费者的实际需求及效用感知相匹配;从信息角度而言,PR策略的两期差异化价格可用于探寻消费者的真实估值水平,若上述变量偏离合理区间,价格信号将失去参考意义,此时EDLP策略的稳定定价模式更有利于控制经营风险。

命题6. 对于具有PR的Stackelberg博弈直播供应链:

1) 如果 max{ ( 1+θ )( w P +( 2+ w P )θ ) 1+3θ , w P +θ 2( 1+ w P )θ 1+( 2+θ )θ }h min{ 1θ, w P +θ( 2+ w P ) θ 2 + θ 3 3+θ( 2+3θ ) , ( 1+θ ) 2 θ+ ( 1+ w P ) 2 ( 1+θ ) 3 θ( 1+θ ) + w P ( 1+ θ 2 ) 1+ θ 2 } w P < 2 θ 2 θ 3 θ 1 θ 2 ,则提供PR优惠,此时均衡价格与均衡利润为: w P * = h+k+( 2+k )θ 2( 1+θ ) p PD * = 3h+k+( 6+k )θ 4( 1+θ ) p PN * = 2h+k+( 6+2h+k )θ2 θ 2 4( 1+θ ) π OP * = ( h+k+( 2+k )θ ) 2 8θ( 1+θ ) π rP * = 1 16 ( 816c+8h4k+ k 2 4 h 2 1+θ + ( h+k ) 2 θ 4θ ( 2+h ) 2 1+θ )

2) 否则,提供单一价格(即EDLP,日常低价策略),此时均衡价格与均衡利润为: w E * = 1+k 2 p EN * = 3+k 4 π OE * = 1 4 ( k1 ) 2 π rE * = 1 8 ( ( k1 ) 2 8c )

Table 3. Consumer choice in two phases under PR strategy

3. PR策略下消费者的两期选择

h

θ

v

购买决策

Case

p PN p PD <h<1

0<θ1

N\A

(2, 0)

1

p PN v1

(1, 1)

p PD v p PN

(1, 0)

0v< p PD

(0, 0)

0<h p PN p PD

p PD +2h h+ p PN θ1

p PD +h θ v p PN p PD h 1θ

(2, 0)

2

p PN p PD h 1θ <v1

(1, 1)

p PD <v< p PD +h θ

(1, 0)

0v p PD

(0, 0)

0<θ< p PD +2h h+ p PN

N\A

(2, 0)

3

p PN <v1

(1, 1)

p PD v p PN

(1, 0)

0v< p PD

(0, 0)

在该直播供应链中,PR与EDLP策略下的批发价、售价及利润,是网络供应链主体围绕成本约束与消费者行为特征博弈形成的均衡结果。PR策略的批发价、促销价与常规价,需同时覆盖品牌商生产成本 k 与网络零售商运营成本 c ,并匹配消费者跨期持有成本 h 与边际估值因子 θ 的影响,因此其价格表达式包含上述核心参数;对应的供应链主体利润遵循“(价格–成本) × 需求”的核算逻辑,而需求规模由消费者估值水平与价格区间的匹配关系决定,故利润函数亦纳入价格、成本及消费者行为相关参数。EDLP策略作为单一低价策略,无需考量消费者跨期决策因素,其批发价与售价仅与品牌商生产成本 k 相关,利润水平也仅由 k 与零售商直播成本 c 决定,这一特征源于EDLP策略下市场需求具备更高的稳定性。

3. 数值模拟

为进一步明确三种促销策略在直播供应链中的实际应用价值,下文将从批发价格、零售价格、品牌商利润、网络零售商利润四大核心维度,对BOGO策略、PR策略与基准的EDLP策略进行直观对比,为供应链主体的策略选择提供支撑。

图4所示,BOGO策略下的批发价 w B h 上升而持续走高,而EDLP策略的 w E 始终稳定——这是因为BOGO策略适配高持有成本场景, h 越高时消费者更依赖“第二件折扣”来摊薄成本,品牌商可通过提高批发价分享策略红利;PR策略的 w P 则随 h 上升而下降,因为PR是“首期降价、二期恢复原价”, h 越高消费者囤货意愿越低,品牌商只能降低批发价来维持零售商的促销动力,而EDLP策略的批发价不受 h 影响,始终保持基础水平。

Figure 4. Structure of the live streaming supply chain

4. 不同促销策略下的批发价格对比

Figure 5. Structure of the live streaming supply chain

5. 不同促销策略下的零售价格对比

图5所示,BOGO策略的常规零售价 p BN h 同步上升,折扣价 p BD 则稳定在低位,这是“首件覆盖成本、次件刺激囤货”的策略设计,而EDLP策略的零售价 p EN 始终固定;PR策略中,二期原价 p PN h 小幅上升(匹配高估值消费者的即时购买),首期促销价 p PD 则随 h 下降(吸引低估值消费者首期囤货),同样是为了适配 h 变化下的消费者购买决策。

图6所示,BOGO策略对应的品牌商利润 π OB h 上升持续增长,而EDLP策略的 π OE 始终稳定,这是因为 h 越高,消费者越倾向“两期各买1件”而非囤货,BOGO策略的“第二件折扣”既能刺激购买,又不会过度压缩品牌商的利润空间,同时高 h 下品牌商可通过提高批发价,将策略红利转化为自身利润;而PR策略对应的品牌商利润 π OP h 上升逐渐下降,原因是 h 越高消费者囤货意愿越低,PR“首期降价”的促销设计会更多挤压品牌商的利润,此时品牌商难以通过批发价调整弥补利润损失,因此利润随 h 增长而缩减,EDLP策略的利润则因固定低价策略,不受 h 变化的影响,始终保持在基础水平。

图7所示,BOGO策略下的零售商利润 π rB h 上升显著增长,EDLP策略的 π rE 保持稳定,这是因为 h 越高,消费者更依赖BOGO策略的“第二件折扣”进行即时购买,零售商既能通过常规价与折扣价的价

Figure 6. Structure of the live streaming supply chain

6. 不同促销策略下的品牌商利润对比

Figure 7. Comparison of online retailers’ profits under different promotional strategies

7. 不同促销策略下的网络零售商利润对比

差获取收益,又能借助品牌商的高批发价策略,在保证销量的同时扩大利润空间;PR策略对应的零售商利润 π rP h 上升持续增长,是因为 h 越高,消费者囤货行为减少,零售商可通过控制首期促销价的降幅,在高 h 场景下从即时购买的消费者中获取更多价差收益,而EDLP策略的零售商利润同样因固定低价策略,利润空间始终维持在稳定的基础水平,不受 h 变化的影响。

值得一提的是,BOGO策略与EDLP策略存在着零售商利润交叉点。当单位商品的持有成本 h 较低时,EDLP策略下的零售商利润较高,这是因为消费者对价格更敏感,此时每期商品保持固定底价则可以维持利润,BOGO策略下零售商需要大幅折让第二件,利润被压缩,使得零售商利润不及EDLP策略;而当单位商品的持有成本 h 较高时,消费者的购买阈值上升,BOGO策略用次件折扣把二期需求提前锁定,并可同步抬高首件价,价差扩大,最终提升其利润,以至于反超固定低毛利的EDLP策略。

4. 结论

随着AI主播在直播电商中的广泛应用,由品牌商与采用数字人技术的网络零售商构成的新型供应链模式日益普及。在此背景下,本文聚焦包装零食等需求稳定的快消品,将消费者跨期购买行为、单位持有成本与边际估值递减特征考虑到模型内,系统构建了“买一送一”(BOGO)、“阶段性降价”(PR)与“天天低价”(EDLP)三类促销策略下的两期Stackelberg博弈模型。通过求解各策略下的均衡价格与利润,并结合参数比较与数值模拟,重点考察了消费者持有成本、边际估值因子及AI主播固定成本对定价决策与渠道绩效的影响。

主要结论与管理启示如下:

1) 当消费者持有成本较高时,BOGO策略优于EDLP。此时消费者不愿承担囤货成本,更倾向于在促销期内一次性购买两单位以获得促销优惠,网络零售商可通过设定第二单位折扣价有效激励即时批量购买;同时,品牌商亦能借此提升批发价格,实现自身利润增长。反之,在持有成本较低的环境中,消费者倾向跨期分散购买或低价囤货,EDLP凭借其价格稳定性与对囤货需求的弱依赖性,展现出更稳定的收益。

2) PR策略仅在持有成本与边际估值因子在特定区间内时具备优势。其利润表现对参数高度敏感,适用场景相对受限,过高或过低的持有成本均会削弱首期降价的激励效果,导致策略失效。因此,采用PR需建立在对消费者估值分布与跨期偏好的精准把握之上。

3) AI主播的固定成本虽不直接影响均衡定价结构,但会压缩网络零售商的整体利润空间。这强调了在AI背景下,选择能够提升单客销量或稳定需求的促销机制,尤其是BOGO,对摊薄技术成本、优化投入回报的重要性。

本文为直播电商供应链中的促销策略选择提供了新的理论视角,揭示了消费者行为特征如何通过跨期效用机制影响品牌商和零售商的博弈。研究结果有助于供应链主体根据市场环境动态匹配促销工具,优化AI直播投入回报。

本文仍存在一定局限。模型未考虑多品牌竞争或电商里常见的退货问题。未来研究可拓展至多产品、多主播协同或引入消费者退货行为,进一步丰富直播电商供应链的决策理论体系。

参考文献

[1] Blattberg, R.C., Eppen, G.D. and Lieberman, J. (1981) A Theoretical and Empirical Evaluation of Price Deals for Consumer Nondurables. Journal of Marketing, 45, 116-129. [Google Scholar] [CrossRef
[2] Blattberg, R.C. and Levin, A. (1987) Modelling the Effectiveness and Profitability of Trade Promotions. Marketing Science, 6, 124-146. [Google Scholar] [CrossRef
[3] Assunção, J.L. and Meyer, R.J. (1993) The Rational Effect of Price Promotions on Sales and Consumption. Management Science, 39, 517-535. [Google Scholar] [CrossRef
[4] Gönül, F. and Srinivasan, K. (1996) Estimating the Impact of Consumer Expectations of Coupons on Purchase Behavior: A Dynamic Structural Model. Marketing Science, 15, 262-279. [Google Scholar] [CrossRef
[5] Chan, T., Narasimhan, C. and Zhang, Q. (2008) Decomposing Promotional Effects with a Dynamic Structural Model of Flexible Consumption. Journal of Marketing Research, 45, 487-498. [Google Scholar] [CrossRef
[6] Sinha, I. and Smith, M.F. (2000) Consumers’ Perceptions of Promotional Framing of Price. Psychology and Marketing, 17, 257-275. [Google Scholar] [CrossRef
[7] Hardesty, D.M. and Bearden, W.O. (2003) Consumer Evaluations of Different Promotion Types and Price Presentations: The Moderating Role of Promotional Benefit Level. Journal of Retailing, 79, 17-25. [Google Scholar] [CrossRef
[8] Kamins, M.A., Folkes, V.S. and Fedorikhin, A. (2009) Promotional Bundles and Consumers’ Price Judgments: When the Best Things in Life Are Not Free. Journal of Consumer Research, 36, 660-670. [Google Scholar] [CrossRef
[9] Gordon-Hecker, T., Pittarello, A., Shalvi, S. and Roskes, M. (2020) Buy-One-Get-One-Free Deals Attract More Attention than Percentage Deals. Journal of Business Research, 111, 128-134. [Google Scholar] [CrossRef
[10] Kim, K., Lee, C. and Park, S. (2016) Dynamic Pricing with ‘BOGO’ Promotion in Revenue Management. International Journal of Production Research, 54, 5283-5302. [Google Scholar] [CrossRef
[11] Ailawadi, K.L., Harlam, B.A., César, J. and Trounce, D. (2006) Promotion Profitability for a Retailer: The Role of Promotion, Brand, Category, and Store Characteristics. Journal of Marketing Research, 43, 518-535. [Google Scholar] [CrossRef
[12] Corbett, C.J. and de Groote, X. (2000) A Supplier’s Optimal Quantity Discount Policy under Asymmetric Information. Management Science, 46, 444-450. [Google Scholar] [CrossRef
[13] Cho, S., McCardle, K.F. and Tang, C.S. (2009) Optimal Pricing and Rebate Strategies in a Two‐Level Supply Chain. Production and Operations Management, 18, 426-446. [Google Scholar] [CrossRef
[14] Levin, Y., Nediak, M. and Bazhanov, A. (2014) Quantity Premiums and Discounts in Dynamic Pricing. Operations Research, 62, 846-863. [Google Scholar] [CrossRef
[15] Lu, Y., Chen, Y., Song, M. and Yan, X. (2014) Optimal Pricing and Inventory Control Policy with Quantity-Based Price Differentiation. Operations Research, 62, 512-523. [Google Scholar] [CrossRef
[16] Liu, Y. and Zhang, Z.J. (2006) Research Note—The Benefits of Personalized Pricing in a Channel. Marketing Science, 25, 97-105. [Google Scholar] [CrossRef
[17] Adida, E. and Özer, Ö. (2019) Why Markdown as a Pricing Modality? Management Science, 65, 2161-2178. [Google Scholar] [CrossRef
[18] 胡娇, 李莉, 张华, 等. 考虑参照效应和主播影响力的网络直播平台动态定价决策[J]. 系统工程理论与实践, 2022, 42(3): 755-766.
[19] 刘洋, 李琪, 殷猛. 网络购物节氛围对消费者冲动购物行为的刺激作用[J]. 商业研究, 2018(7): 18-23.
[20] Hsin Chang, H. and Wen Chen, S. (2008) The Impact of Online Store Environment Cues on Purchase Intention: Trust and Perceived Risk as a Mediator. Online Information Review, 32, 818-841. [Google Scholar] [CrossRef
[21] Liu, Y., Li, H. and Hu, F. (2013) Website Attributes in Urging Online Impulse Purchase: An Empirical Investigation on Consumer Perceptions. Decision Support Systems, 55, 829-837. [Google Scholar] [CrossRef
[22] Tong, J. (2017) A Study on the Effect of Web Live Broadcast on Consumers’ Willingness to Purchase. Open Journal of Business and Management, 5, 280-289. [Google Scholar] [CrossRef
[23] Liu, F., Meng, L., Chen, S., et al. (2020) The Impact of Network Celebrities’ Information Source Characteristics on Purchase Intention. Chinese Journal of Management, 17, 94-104.
[24] 王玉燕, 丁露萍, 霍宝锋. 直播电商供应链中制造商的直播引入策略研究[J]. 系统科学与数学, 2025, 45(5): 1471-1493.
[25] Du, Z., Fan, Z. and Sun, F. (2023) Live Streaming Sales: Streamer Type Choice and Limited Sales Strategy for a Manufacturer. Electronic Commerce Research and Applications, 61, Article 101300. [Google Scholar] [CrossRef
[26] Wang, L., Song, Y. and Fan, T.J. (2024) Strategies of Manufacturers Introducing Live Streaming. Chinese Journal of Management Science, 32, 276-284.
[27] Zhen, X., Wang, P. and Li, X. (2024) The Streamer’s Sales Strategy Choice Considering Sales Effort. Journal of Retailing and Consumer Services, 78, Article 103745. [Google Scholar] [CrossRef
[28] 王翠翠, 徐静, 秦海生, 等. 电商主播类型对消费者购买行为的影响: AI主播和真人主播[J]. 管理科学, 2023, 36(4): 30-43.
[29] Niu, B., Yu, X. and Dong, J. (2023) Could AI Livestream Perform Better than KOL in Cross-Border Operations? Transportation Research Part E: Logistics and Transportation Review, 174, Article 103130. [Google Scholar] [CrossRef
[30] 程永伟. 直播带货的合作模式与决策优化[J]. 中国管理科学, 2024, 32(5): 297-306.
[31] Baucells, M. and Sarin, R.K. (2007) Satiation in Discounted Utility. Operations Research, 55, 170-181. [Google Scholar] [CrossRef
[32] Baucells, M. and Sarin, R.K. (2010) Predicting Utility under Satiation and Habit Formation. Management Science, 56, 286-301. [Google Scholar] [CrossRef
[33] Özer, Ö. and Zheng, Y. (2016) Markdown or Everyday Low Price? The Role of Behavioral Motives. Management Science, 62, 326-346. [Google Scholar] [CrossRef