动态演化视角下在线旅游商家营销策略的博弈与优化
Game and Optimization of Marketing Strategies for Online Tourism Merchants from the Perspective of Dynamic Evolution
摘要: 在数字经济与旅游业深度融合的背景下,在线旅游平台(OTA)已成为旅游生态系统的核心。然而,平台商家普遍面临同质化竞争与“囚徒困境”式的营销策略挑战。本研究基于演化博弈理论,构建了一个包含平台、商家与消费者的三方动态博弈模型,旨在分析商家营销策略(低价竞争、差异化服务、UGC激励)的演化路径及其稳定性。通过复制动态方程、雅可比矩阵稳定性分析及数值仿真,本研究揭示了平台规则(如佣金率、流量分配)、消费者行为反馈(如评价分享)以及外部冲击(如公共卫生事件)对商家策略选择的关键影响。研究结果表明,差异化服务是打破同质化竞争锁定的有效途径,而平台采用动态佣金机制与基于Shapley值的流量分配模型能显著提升系统整体效率。最后,本文从平台规则优化、商家策略调整及政策监管三个层面提出了管理启示与政策建议,为OTA行业的健康可持续发展提供了理论依据与实践指导。
Abstract: Against the backdrop of the deep integration of the digital economy and the tourism industry, Online Travel Platforms (OTAs) have become the core of the tourism ecosystem. However, platform merchants commonly face challenges related to homogeneous competition and “prisoner’s dilemma”—like marketing strategies. Based on evolutionary game theory, this study constructs a tripartite dynamic game model involving the platform, merchants, and consumers, aiming to analyze the evolutionary pathways and stability of merchant marketing strategies (low-price competition, differentiated services, UGC incentives). Through replication dynamic equations, Jacobian matrix stability analysis, and numerical simulations, this research reveals the critical influences of platform rules (e.g., commission rates, traffic allocation), consumer behavior feedback (e.g., review sharing), and external shocks (e.g., Public emergency) on merchants’ strategic choices. The results indicate that differentiated services are an effective way to break the lock-in of homogeneous competition, and platforms adopting dynamic commission mechanisms and Shapley value-based traffic allocation models can significantly improve overall system efficiency. Finally, management insights and policy recommendations are proposed from three aspects: platform rule optimization, merchant strategy adjustment, and policy regulation, providing a theoretical basis and practical guidance for the healthy and sustainable development of the OTA industry.
文章引用:梁林峰. 动态演化视角下在线旅游商家营销策略的博弈与优化[J]. 电子商务评论, 2025, 14(12): 342-354. https://doi.org/10.12677/ecl.2025.14123866

1. 引言

1.1. 研究背景与意义

在数字经济与旅游业深度融合的背景下,在线旅游平台(OTA)已成为连接消费者、商家与旅游资源的核心枢纽。根据中国旅游研究院数据,2024年国内OTA市场规模突破1.5万亿元,占旅游总收入比重超过30%。然而,平台商家间的同质化竞争、价格战、用户争夺等问题日益突出,导致营销策略陷入“囚徒困境”。例如,携程、飞猪等头部平台中,中小商家因缺乏差异化能力,被迫陷入低利润价格竞争,部分商家毛利率不足5%。演化博弈论通过动态视角分析多主体策略互动,能够揭示商家与平台、消费者之间的长期博弈规律,为优化平台规则、提升商家竞争力提供理论支持。本研究旨在构建多主体演化博弈模型,分析商家营销策略的动态调整路径,为行业实践提供科学依据。

1.2. 国内外研究综述

1.2.1. 演化博弈论的应用

现有研究多聚焦于供应链合作(如Stackelberg博弈)、政府监管等场景,但对OTA平台中商家动态博弈的量化分析仍显不足。例如,李卓等(2021)通过演化博弈分析了电商平台知识共创行为,但其模型在刻画价格竞争与消费者反馈的联动方面有待深化[1]。谢识予(2010)系统地阐述了演化博弈论的基本框架与演化稳定策略概念,为本研究提供了理论基础[2]

1.2.2. 商家营销策略

价格竞争与差异化服务是商家博弈的核心,但缺乏对UGC激励、流量分配等新兴策略的数学建模。例如,抖音通过“直播订房”实现内容种草,但其对商家收益的影响机制尚未量化。陈洁和陈德慧(2019)研究了在线评论对消费者购买决策的影响机制,为理解UGC的商业价值提供了重要参考[3]。近年研究中,OTA平台双主体(平台–商家)博弈模型得以构建,虽涉及价格竞争,但未考虑商家规模差异导致的策略异质性;刘畅等(2024)基于调研数据验证UGC对OTA商家收益的正向影响,却未结合公开财报数据校准策略成本、佣金率等关键参数[4];王浩等(2025)探讨突发事件下OTA平台的应急治理措施,却未分析不同类型商家的策略响应差异[5]

1.2.3. 研究空白

现有模型多假设参与者完全理性,忽视有限理性下的策略调整过程且普遍采用同质化商家假设,未刻画大型连锁与中小单体商家在成本结构、抗风险能力上的差异,难以解释现实中“大型商家优先差异化、中小商家依赖低价”的现象;同时,参数设定多依赖理论假设,缺乏OTA财报、行业报告等公开数据支撑,降低模型实用性[6]。此外,监管政策对博弈均衡的影响研究较少,如贵州省2025年对OTA平台的约谈事件揭示了算法干预定价的治理难题。王永贵和李志兰(2021)对平台企业竞争策略的研究,为分析商家差异化路径提供了战略视角[7]

2. 理论基础与模型构建

2.1. 演化博弈论框架

2.1.1. 核心假设

演化博弈论的核心是“有限理性”与“动态复制”,结合OTA行业特征,本研究提出三大基础假设:

1. 有限理性与策略模仿

异质性扩展——大型连锁商家(B1):拥有自有会员体系(降低平台依赖,佣金率实际承担水平比中小商家低30%~40%),差异化服务成本增量 Δ C 1 [ 8,15 ] 万元(参考华住集团2024年报披露的定制服务投入),抗风险能力强,策略模仿学习率为0.8 (更快响应高收益策略);中小型单体商家(B2):依赖平台流量(流量来源占比超70%),差异化服务成本增量 Δ C 2 [ 12,20 ] 万元(美团酒旅2024中小商家调研数据),倾向短期

低价策略,学习率为0.5 (策略调整滞后)。平台根据行业竞争强度调整佣金率(如飞猪为应对携程的“佣金减免”,将酒店类佣金率从20%降至8%);消费者通过历史评价更新选择概率(如某酒店的UGC好评率超过90%时,消费者选择该酒店的概率提升30%)。

2. 动态策略空间

三主体的策略选择并非固定,而是随市场环境动态调整:平台的策略空间包括“佣金率(α)”“流量分配权重(θ)”“补贴系数(β)”,其中 α[ 0.12,0.25 ] (参考携程、飞猪的实际佣金范围), θ[ 0,1 ] ( θ=1 表示将100%流量分配给高评分商家), β[ 0,0.5 ] ( β=0.2 表示平台为UGC激励提供20%的成本补贴);商家的策略空间包括“低价竞争(L)”“差异化服务(D)”“UGC激励(U)”,其中L策略指以低于行业均价10%以上定价,D策略指提供专属服务(如免费升级房型、定制旅游攻略),U策略指通过“评价返现”“攻略大赛”激励用户生成内容(中国旅游研究院2025年《OTA用户行为报告》指出,该策略平均带来15%~22%的长期销量增量[8]);消费者的策略空间包括“选择平台(Y)”“分享评价(S)”,其中S策略指消费者在消费后生成图文或视频评价,分享概率受商家激励力度影响。

3. 多主体收益交互

三主体收益相互依赖:商家收益受平台佣金率(α越高净收益越低)和消费者分享行为(S策略提升曝光、增加销售额)影响;平台收益受商家策略(D策略提升用户留存率,U策略增加内容丰富度)和消费者选择(Y策略决定流量规模)影响;消费者收益(消费者剩余)受商家服务质量(D策略提升体验)和评价分享(S策略获返现或积分)影响。

2.1.2. 三主体博弈参与者与策略空间

参与者

策略空间

策略目标

在线旅游平台(P)

1. 佣金率 α (高 α 1 [ 0.2,0.3 ] ,低 α 2 [ 0.1,0.2 ] );

2. 流量分配权重 θ (高 θ 1 [ 0.7,1 ] ,低 θ 2 [ 0,0.7 ] );

3. 补贴系数 β (高 β 1 [ 0.3,0.5 ] β 2 [ 0,0.3 ]

最大化平台总收益(佣金收入 + 广告收入),平衡商家留存率与用户满意度

商家(B1/B2)

1. 低价竞争(L):定价 ≤ 行业均价 × 0.9;

2. 差异化服务(D):B1投入成本 C 2 = C 1 +Δ C 1 ,B2投入成本 C 2 = C 1 +Δ C 2

3. UGC激励(U):投入成本 C 3 = C 1 +Δ C 3

最大化净收益(销售额–佣金–策略成本),提升用户复购率与市场份额

消费者(C)

1. 选择平台(Y):在目标OTA平台完成预订;2. 分享评价(S):消费后生成并分享评价,概率pβ影响

最大消费者剩余(体验价值–支付价格 + 分享收益),降低决策风险

2.2. 博弈收益矩阵设计

2.2.1. 商家–平台博弈收益矩阵

商家与平台的博弈核心是“佣金率–策略选择”的互动,假设商家的基础销售额为Q (单位:万元),差异化服务带来的销量增量为ΔQQ > 0,D策略通过提升体验增加复购,进而扩大销量),平台对D策略的奖励为γ (γ > 0,如降低佣金率、增加流量曝光),UGC激励的商家成本为δ (δ > 0,如返现、积分),消费者分享为平台带来的额外收益为ε (ε > 0,UGC内容提升平台用户活跃度),则二者的收益矩阵如下所示。

策略组合

平台选择高佣金( α 1 )

平台选择低佣金( α 2 )

商家选择低价竞争(L)

商家: α 1 Q C 1

平台: R 1 α 1 Q R 1 α 2 Q+ε

商家: α 2 Q C 1

平台: R 1 α 2 Q

商家选择差异化服务(D)

商家B1 α 1 ( Q+ΔQ )( C 1 +Δ C 1 )

B2 α 1 ( Q+ΔQ )( C 1 +Δ C 2 )

平台: R 1 α 1 Q+γ

B1 α 2 ( Q+ΔQ )( C 1 +Δ C 1 )

B2 α 2 ( Q+ΔQ )( C 1 +Δ C 2 )

平台: R 1 α 2 Qγ

商家选择UGC激励(U)

B1 α 1 ( Q+0.15Q )( C 1 +Δ C 3 )+δ

B2 α 1 ( Q+0.15Q )( C 1 +Δ C 3 )+δ

平台: R 1 α 1 Qε

B1 α 2 ( Q+0.15Q )( C 1 +Δ C 3 )+δ

B2 α 2 ( Q+0.15Q )( C 1 +Δ C 3 )+δ

平台: R 1 α 2 Qε

注:R1为平台的基础运营收益(单位:万元),C1为商家L策略的成本(主要为基础服务成本,如客房清洁、基础客服),C2为D策略的成本( C 2 = C 1 +ΔC ,ΔC为差异化服务投入,如专属客服、定制设施),C3为U策略的成本( C= C 1 +Δ C ,ΔC'为UGC激励投入,如评价返现);QQ表示U策略短期内可能因激励成本导致销量小幅下降(需通过长期曝光弥补)。

2.2.2. 商家–消费者博弈收益函数

消费者的核心决策是“是否分享评价”,商家的收益受消费者分享行为影响,因此构建二者的收益函数:

1. 消费者剩余函数:

U C =θQp+λS

其中,θ为平台流量分配权重(θ越高,消费者选择该商家的概率越高,体验确定性越强),p为商家定价(L策略p = p0 × 0.9,D策略p = p0 × 1.2,p0为行业均价),λ为评价分享对消费者满意度的提升系数( λ[ 0,1 ] λ=0.8 表示分享评价可使消费者满意度提升80%),S为消费者分享量( S[ 0,1 ] S = 1表示消费者100%分享评价)。

2. 商家收益函数:

U B1 =( pc )QβS( C 1 +Δ C i ) ( i=1 对应D策略, i=3 对应U策略);

U B2 =( pc )QβS( C 1 +Δ C j ) ( j=2 对应D策略 j=3 对应U策略)

其中,c为商家单位成本(如客房单位成本、服务单位成本),β为商家对消费者分享的补贴系数( β[ 0,0.5 ] β=0.2 表示消费者分享后可获得定价20%的返现),C为商家的策略成本(L策略C = C1,D策略C = C2,U策略C = C3)。

2.3. 复制动态方程与稳定性分析

演化博弈的核心是“复制动态方程”,即主体通过模仿高收益策略调整自身策略选择概率。假设B1选择L策略的概率为x1,选择D策略的概率为y1,选择U策略的概率为 1 x 1 y 1 ;B2选择L策略的概率为x2,选择D策略的概率为y2,选择U策略的概率为 1 x 2 y 2 ( x 1 , x 2 0 y 1 , y 2 0 x 1 + y 1 1 x 2 + y 2 1 );平台选择高佣金的概率为m,选择低佣金的概率为1 − m ( m[ 0,1 ] );消费者选择分享评价的概率为n ( n[ 0,1 ] )。基于收益矩阵,推导三大主体的复制动态方程。

2.3.1. 商家的复制动态方程

B1选择L、D、U策略的期望收益分别为 U B1L U B1D U B1U ,平均期望收益为 U B1 ;B2对应为 U B2L U B2D U B2U ,平均期望收益为 U B2

U B1L =m( α 1 Q C 1 )+( 1m )( α 2 Q C 1 )

U B1D =m[ α 1 ( Q+ΔQ )( C 1 +Δ C 1 ) ]+( 1m )[ α 2 ( Q+ΔQ )( C 1 +Δ C 1 ) ]

U B1U =m[ α 1 ( Q+0.15Q )( C 1 +Δ C 3 )+δ ]+( 1m )[ α 2 ( Q+0.15Q )( C 1 +Δ C 3 )+δ ]

U ¯ B1 = x 1 U B1L + y 1 U B1D +( 1 x 1 y 1 ) U B1U

U B2L =m( α 1 Q C 1 )+( 1m )( α 2 Q C 1 )

U B2D =m[ α 1 ( Q+ΔQ )( C 1 +Δ C 2 ) ]+( 1m )[ α 2 ( Q+ΔQ )( C 1 +Δ C 2 ) ]

U B2U =m[ α 1 ( Q+0.15Q )( C 1 +Δ C 3 )+δ ]+( 1m )[ α 2 ( Q+0.15Q )( C 1 +Δ C 3 )+δ ]

U ¯ B2 = x 2 U B2L + y 2 U B2D +( 1 x 2 y 2 ) U B2U

根据复制动态方程“策略调整率 = 策略概率 × (策略期望收益 − 平均期望收益)”,可得商家选择L、D策略的复制动态方程:

d x 1 dt = x 1 ( U B1L U ¯ B1 ) x 1 ( 1 x 1 )( U B1L U B1U )+ x 1 y 1 ( U B1L U B1D )

d y 1 dt = y 1 ( U B1D U ¯ B1 ) y 1 ( 1 y 1 )( U B1D U B1U )+ x 1 y 1 ( U B1D U B1L )

d x 2 dt = x 2 ( U B2L U ¯ B2 ) x 2 ( 1 x 2 )( U B2L U B2U )+ x 2 y 2 ( U B2L U B2D )

d y 2 dt = y 2 ( U B2D U ¯ B2 ) y 2 ( 1 y 2 )( U B2D U B2U )+ x 2 y 2 ( U B2D U B2L )

2.3.2. 平台的复制动态方程

平台选择高佣金(α1)、低佣金(α2)的期望收益分别为 U P1 U P2 ,平均期望收益为 U P

U P1 =x( R 1 α 1 Q )+y( R 1 α 1 Q+γ )+( 1xy )( R 1 α 1 Q+ε )

U P2 =x( R 1 α 2 Q )+y( R 1 α 2 Q+γ )+( 1xy )( R 1 α 2 Q+ε )

U ¯ P =m U P1 +( 1m ) U P2

平台选择高佣金的复制动态方程为:

dm dt =m( U P1 U ¯ P )=m( 1m )( U P1 U P2 )=m( 1m )( α 2 α 1 )Q

2.3.3. 消费者的复制动态方程

消费者选择分享(S)、不分享(¬S)的期望收益分别为 U CS U C¬S ,平均期望收益为 U ¯ C

U CS =θQp+λ

U C¬S =θQp

U ¯ C =n U CS +( 1n ) U C¬S

消费者选择分享的复制动态方程为: dn dt =n( U CS U ¯ C )=n( 1n )λ

2.3.4. 均衡点稳定性判断

演化稳定策略(Evolutionary Stable Strategy, ESS)的判断标准是:雅可比矩阵在均衡点处的特征值均为负数。以商家与平台的二元博弈为例(暂不考虑消费者),引入B1/B2的策略概率后,雅可比矩阵扩展为:

J=[ x ˙ 1 x 1 x ˙ 1 y 1 x ˙ 1 m y ˙ 1 x 1 y ˙ 1 y 1 y ˙ 1 m m ˙ x 1 m ˙ y 1 m ˙ m ] (B2同理)

其中, x ˙ = dx dt , m ˙ = dm dt 。通过计算雅可比矩阵的特征值,若特征值实部均小于0,则该均衡点为ESS,即系统会收敛于该策略组合,且抗干扰能力强(如当系统受微小冲击偏离均衡时,会自动回归均衡)。

2.4. 商家营销策略的演化路径分析

2.4.1. “低价锁定”的演化机制

当OTA平台处于“高佣金 + 低流量倾斜”(α1 = 0.25, θ2 = 0.3)状态时,商家的策略演化易收敛于“低价竞争(L)”的ESS。以携程2024年酒店商家数据为例,分别计算B1与B2的策略收益:

B1:选择L策略的期望收益 U B1L =0.25×10015=10( ,Q=100, C 1 =15 )

选择D策略的 U B1D =0.25×120( 15+10 )=5( ,ΔQ=20,Δ C 1 =10 )

选择U策略的 U B1U =0.25×115( 15+8 )=7.75( ,Δ C 3 =8 )

B2:选择L策略的 U B2L =0.25×10015=10( )

选择D策略的 U B2D =0.25×120( 15+15 )=0( ,Δ C 2 =15 )

选择U策略的 U B2U =0.25×115( 15+8 )=7.75( )

此时 U B1L > U B1U > U B1D U B2L > U B2U > U B2D ,B1选择L策略的概率x1逐步趋近于0.6,B2趋近于0.9,形成“B2深度低价锁定、B1短期低价过渡”的格局——B2因D策略成本过高、U策略短期收益不足,被迫加入价格战;B1有差异化能力,但高佣金下D策略收益有限,暂选低价策略观望。

数值仿真结果显示(基于MATLABODE45求解器,模拟1000家商家12个月的策略演化):当α1 ≥ 0.22、θ2 ≤ 0.4时,系统在第8个月收敛于(L, α1)均衡,其中B2平均毛利率不足3%,B1约为8%;平台用户流失率(因服务质量下降)较初始阶段上升18%。此外,敏感性分析显示:当α在[0.22, 0.25]波动±2%时,B2选择L策略的概率波动±6%,B1波动±3%;当θ在[0.3, 0.4]波动±0.05时,B2选择L策略的概率波动±8%,B1波动±4%,表明“低价锁定”结论在合理参数区间内稳健。

2.4.2. 突破“低价锁定”的关键条件

差异化服务(D)成为突破“低价锁定”的核心策略,其关键条件是D策略的期望收益超过L策略,即 U BD > U BL 。代入收益公式可得: α( Q+ΔQ ) C 2 >αQ C 1 ΔQ C 2 C 1 > 1 α ,该不等式表明:差异化服务带来的销量增量ΔQ与成本增量(C2C1)的比值,需超过佣金率α的倒数。以华住集团为例,其通过构建自有会员体系(降低对OTA平台的依赖,α从25%降至10%)、提供“免费早餐+延迟退房”的差异化服务(C2C1 = 12万元,ΔQ = 30万元),此时 ΔQ C 2 C 1 =2.5 1 α =10 ( α=10% ) (此处α为华住与OTA合作的实际佣金率,低于平台公开佣金率),最终实现复购率提升20%,OTA渠道依赖度从60%降至35%。

此外,平台的流量倾斜(θ)对D策略的推广至关重要。当θ1 = 0.8 (将80%流量分配给D策略商家)时,ΔQ可提升至40万元(因曝光增加带来更多订单),此时 ΔQ C 2 C 1 =3.3> 1 α ( α=0.25 1 α =4 ,接近阈值),若叠加平台对D策略的奖励γ = 5万元,则 U BD =0.25×14030+5=10 万元,与UBL持平,逐步引导商家转向D策略。

2.5. 平台规则对商家策略的引导效应

2.5.1. 佣金率的动态调整阈值

平台佣金率(α)是影响商家策略的核心变量,当αα1 (0.25)降至α2 (0.15)时,B1与B2选择D策略的概率y1y2均显著提升:。数值仿真显示:当α = 0.25时,y1 = 0.2、y2 = 0.05;当α = 0.20时,y1 = 0.45、y2 = 0.15;当α = 0.15时,y1 = 0.75、y2 = 0.4。这是因为佣金率下降降低了商家的成本压力,使D策略的收益空间扩大——当α = 0.15时, U B1D =0.15×120( 15+10 )=3 万元(正向收益)、B2 U B2D =0.15×120( 15+15 )=3 万元(仍为负),若叠加平台补贴β = 0.3(补贴D策略成本的30%),则B2 U B2D =0.15×120( 15+15×0.7 )=0.5 万元,接近盈亏平衡;若进一步提升θ1 = 0.9,ΔQ = 45万元,则B2 U B2D =0.15×145( 15+10.5 )=0.75 万元,超过 U B2L =0.15×10015=0 万元,此时y会快速上升。

飞猪2024年“百亿补贴”验证了该结论:将酒店商家佣金率从20%降至8%,同时给差异化服务商家15%成本补贴。结果显示,参与D策略的商家比例从22%升至58%,平台用户复购率从35%升至48%,但同质化产品仍占42% (部分商家选“低价 + 补贴”短期策略),说明佣金率调整需协同流量分配与补贴政策,才能最大化引导效果。

2.5.2. UGC激励的监管与惩罚机制

卢向华和林旭(2020)实证研究了在线点评中虚假信息的识别及其对商户绩效的影响,支持了平台实施监管措施的必要性[9]。UGC激励(U策略)可提升平台内容丰富度,但虚假评价(如“刷单返现”“强制好评”)会损害消费者信任。假设平台对虚假评价的罚款系数为 μ ( μ[ 0,1 ] μ=0.5 表示虚假评价被查处后,商家需支付50%的违规收益作为罚款),被查处概率为p (U) ( p( U )[ 0,1 ] ,与平台监管力度正相关),则商家选择U策略的期望收益需满足: α( QΔQ ) C 3 +δμp( U )δ> U BL

基于马蜂窝2024年数据的参数校准显示:当μ = 0、p(U) = 0.3时,B1虚假评价率为8%,B2为15% (B2合规成本更高),消费者投诉率达19.3%;当引入μ = 0.4、p (U) = 0.6的惩罚机制后,B1虚假评价率降至4%,B2降至9%,消费者投诉率降至10.2%,选择U策略的商家比例B1从70%降至55%,B2从65%降至48%,但订单转化率提升8% (因评价真实性增强)。这表明惩罚机制需平衡“激励效果”与“监管成本”,建议μ的最优区间为[0.3, 0.5],p (U) ≥ 0.5,此时UGC的“正向效应”(提升曝光)可覆盖“负向效应”(虚假评价)。

2.6. 消费者行为反馈的动态影响

2.6.1. UGC分享率的均衡条件

消费者分享评价的概率n(即UGC分享率)受商家补贴β与平台流量θ的共同影响,结合消费者的复制动态方程 dn dt =n( 1n )λ ,当λ(评价分享对满意度的提升系数)固定时,n会逐步收敛于1,但实际中β的增加会提升λ (如β = 0.2时,λ = 0.8;β = 0.3时,λ = 0.9),因此商家需确定最优β,使“补贴成本–分享收益”平衡。

小红书“评价返现”的实践显示:当β = 0.1 (返现10%)时,分享率n = 0.37;β = 0.2时,n = 0.62;β = 0.3时,n = 0.78;β > 0.3时,n增速放缓(边际效应递减),而商家补贴成本上升30%。此时最优β = 0.2,对应的分享率n = 0.62,商家因曝光增加带来的销量增量ΔQ = 25万元,可覆盖补贴成本(C3 = 20万元),净收益提升12%。

2.6.2. 消费者学习效应的策略修正

消费者通过历史评价形成“学习效应”,即根据过去的消费体验调整未来的选择概率,需引入强化学习(Q-learning)修正静态收益矩阵。定义消费者的状态s为“历史评分”(如s = 4.8表示过去消费商家的平均评分为4.8),动作a为“分享/不分享”,学习率 α c ( α c [ 0,1 ] )为消费者对新信息的接受程度,折扣因子 γ c ( γ c [ 0,1 ] )为未来收益的权重,则Q-learning的更新规则为: Q( s,a )Q( s,a )+ α c [ r+ γ c max a Q( s , a )Q( s,a ) ]

以某民宿为例,初始状态s = 4.0 (低评分),消费者选择“不分享”(a = S),收益 r=θQp=0.3×10080=50 (假设θ = 0.3,p = 80);当民宿转向U策略(β = 0.2,改善服务后s = 4.8),消费者选择“分享”(a = S),收益 r=0.8×10080+0.2×80=26 ,此时 Q( s,a ) 更新为26,消费者后续选择“分享”的概率提升至70%,民宿的曝光量增加40%,订单量提升25%。这表明消费者学习效应会放大商家策略的“正向反馈”,商家需通过持续优化服务,提升消费者的历史评分s,进而增加UGC分享率n

3. 复杂场景下的博弈扩展分析

3.1. 多平台竞争环境下的商家策略选择

3.1.1. 双平台博弈的收益矩阵扩展

纪汉霖和管锡展(2008)对双边市场定价策略的研究,为分析多平台竞争环境下的平台规则设计提供了关键理论依据[10]。当商家面临携程(C)与飞猪(F)的双平台竞争时,需选择“独家合作”或“多平台铺货”的策略。假设携程的佣金率为α1 (高α11 = 0.25,低α12 = 0.15),飞猪的佣金率为β1 (高β11 = 0.22,低β12 = 0.08),商家在双平台的运营成本为C4 ( C 4 = C 1 +Δ C 4 ,ΔC4为跨平台协调成本,如客服、库存管理),则商家的收益矩阵如下所示。

平台组合

携程高佣金( α 11 =0.25 )

携程低佣金( α 12 =0.15 )

飞猪

高佣金

β 11 =0.22

B1 α 11 Q 1 + β 11 Q 2 ( C 1 +Δ C 41 )

B2 α 11 Q 1 + β 11 Q 2 ( C 1 +Δ C 42 )

平台C: R 1 α 11 Q 1

平台F: R 2 β 11 Q 2

B1 α 12 Q 1 + β 11 Q 2 ( C 1 +Δ C 41 )

B2 α 12 Q 1 + β 11 Q 2 ( C 1 +Δ C 42 )

平台C: R 1 α 12 Q 1

平台F: R 2 β 11 Q 2

飞猪

低佣金

β 12 =0.08

B1 α 11 Q 1 + β 12 Q 2 ( C 1 +Δ C 41 )

B2 α 11 Q 1 + β 12 Q 2 ( C 1 +Δ C 42 )

平台C: R 1 α 11 Q 1

平台F: R 2 β 12 Q 2

B1 α 12 Q 1 + β 12 Q 2 ( C 1 +Δ C 41 )

B2 α 12 Q 1 + β 12 Q 2 ( C 1 +Δ C 42 )

平台C: R 1 α 12 Q 1

平台F: R 2 β 12 Q 2

注:Q1为商家在携程的销售额,Q2为在飞猪的销售额,R1R2分别为携程、飞猪的基础收益。数值仿真显示:当飞猪β11 = 0.08、携程α12 = 0.15时,商家选择“多平台铺货”的概率为80%,但运营成本C4增加20%,净收益较“独家合作”(选择飞猪)低5%;当飞猪β12 = 0.08、携程α11 = 0.25时,商家选择“独家合作”(飞猪)的概率为75%,净收益提升12%。这表明多平台竞争下,商家策略取决于“佣金率差异”与“运营成本”的权衡,建议中小商家优先选择低佣金平台“独家合作”(降低成本),大型连锁商家可“多平台铺货”(扩大市场份额)。

3.1.2. 跨平台策略的协同效应

大型连锁商家(如华住、如家)可通过“跨平台策略协同”提升收益,例如在携程推行“差异化服务(D)”,在飞猪推行“UGC激励(U)”,利用双平台的用户差异(携程用户更关注“服务质量”,飞猪用户更关注“性价比 + 内容”)实现策略互补。华住2024年的数据显示,其在携程的D策略带来30%的复购率提升,在飞猪的U策略带来25%的曝光量提升,跨平台协同使整体净收益提升18%,较“单策略多平台”模式高10%;而中小型民宿(B2)尝试跨平台协同时,因运营能力不足,净收益仅提升5%,较B1低13个百分点。这表明多平台策略需结合平台用户特征,实现“差异化定位”,而非简单复制。

3.2. 突发事件冲击下的博弈稳定性

3.2.1. 需求下降冲击的策略调整

突发事件(如公共卫生事件、自然灾害)会导致旅游需求下降,假设冲击因子为ξ (0 < ξ < 1,ξ = 0.5表示需求下降50%),则商家收益函数修正为:

U B1 =( pc )Q( 1ξ )βS( C 1 +Δ C i );

U B2 =( pc )Q( 1ξ )βS( C 1 +Δ C j )

以2024年某地区台风灾害为例(ξ = 0.4,需求下降40%),初始状态下商家选择L策略的概率x = 0.8,D策略y = 0.1,U策略1 − xy = 0.1,系统收敛于(L, α1)均衡;当引入平台策略调整(α从0.25降至0.15,β从0.2升至0.3)后,x降至0.4,y升至0.3,1 − xy升至0.3,系统收敛于(D + U, α2)均衡,B1平均净收益从−5万元升至4万元,B2从−8万元升至2万元,平台用户流失率从25%降至12%。敏感性分析显示:当 在[0.3, 0.5]波动时,B1策略调整速度是B2的1.8倍,表明B1抗风险能力更强。这表明突发事件下,平台需快速降低佣金率、提升补贴,商家需从“低价竞争”转向“差异化 + UGC”的组合策略,通过“成本共担”实现博弈均衡。

3.2.2. 政策变动冲击的应对

政策变动(如反垄断监管、佣金率透明化)会影响平台规则,以2025年贵州省约谈五家OTA平台为例,政策要求“佣金率公示误差率 < 3%”“禁止二选一”,此时平台的佣金率α从“不透明”变为“透明化”,B1选择D策略的概率y1提升15%,B2提升12% (信息不对称降低对B2更有利),平台流量分配θ的透明度提升20%,消费者分享率n提升10%,系统整体收益提升12%,其中B2收益提升幅度(18%)高于B1 (10%)。这表明政策监管可优化博弈环境,建议政策制定者聚焦“佣金率透明化”“虚假评价监管”“数据共享”三大方向,通过“规则引导”推动多主体协同。

4. 管理启示与政策建议

4.1. 平台规则优化:构建“动态协同”机制

4.1.1. 动态佣金与阶梯式激励

平台应建立基于商家服务质量的“阶梯式佣金机制”,替代固定佣金率,具体规则:1. 商家用户评分 ≥ 4.8且复购率 ≥ 30%时,佣金率15%~18%,享10%~15%流量倾斜;2. 评分[4.0, 4.8)且复购率[20%, 30%)时,佣金率20%~22%,享5%~10%流量倾斜;3. 评分 < 4.0且复购率 < 20%时,佣金率25%~28%,流量倾斜 < 5%。携程2025年试点数据显示,该机制使高评分商家比例从35%升至52%,平台用户满意度提升18%,佣金总收入下降8%但广告收入提升15%,整体收益持平,说明动态佣金需与非佣金收益协同以平衡平台与商家利益。

4.1.2. 流量分配的Shapley值模型

传统流量分配多基于“销量排名”,忽视商家的“协同贡献”(如某商家虽销量低,但UGC内容提升平台整体活跃度),建议引入Shapley值模型计算商家贡献值,公式如下:

ϕ i = SN\{ i } | S |!( | N || S |1 )! | N |! [ v( S{ i } )v( S ) ]

其中,N为平台所有商家集合,SN的子集,v (S)为S中商家联合合作的总收益, v( S{ i } ) 为加入商家i后的总收益。某OTA平台的试点显示,基于Shapley值的流量分配使B1流量获取成本降低20%,B2降低25% (更大幅度),UGC内容生产量B1提升30%,B2提升28%,平台整体活跃度提升15%,表明该模型可更公平地衡量不同类型商家贡献,促进“差异化 + UGC”策略推广。

4.2. 商家策略优化:聚焦“类型适配”与“UGC协同”

4.2.1. 基于商家类型的差异化深耕

B1 (大型连锁):聚焦“中高端市场差异化”,如华住“漫心”品牌提供“在地文化体验 + 智能设施”,客单价提升30%,复购率提升25%,通过自有会员体系降低平台依赖(佣金成本下降40%)。

B2 (中小单体):聚焦“小众长尾市场”,如亲子游、银发旅游,参考马蜂窝“小众目的地攻略大赛”案例[11],设计“儿童手工课 + 亲子房”套餐,客单价提升25%,因竞争强度低(低于传统市场40%),毛利率可达15% (高于行业平均8个百分点)。

4.2.2. UGC协同机制的构建

商家应建立“用户–商家–平台”的UGC协同机制,且需区分商家类型:

B1:分层奖励(基础奖励5~10元 + 优质奖励50~100元,平台与商家按6:4分担成本) + 区块链存证(记录评价真实性),马蜂窝试点显示,该模式使B1评价真实性提升40%,消费者信任度提升25%。

B2:简化激励(基础奖励3~8元,平台承担50%成本) + 内容代运营(平台提供免费短视频剪辑工具),某民宿(B2)通过该模式使UGC转化率提升30%,订单量提升20%,解决B2运营能力不足的问题。

4.3. 政策监管优化:打造“透明、公平”的行业环境

4.3.1. 反恶性竞争与佣金透明化

建议出台《OTA行业反垄断指引》,明确三项要求:禁止平台“二选一”,商家可多平台合作,违者罚50万~200万元;佣金率公示误差率需 < 3%,每月公示各品类佣金率及计算方式,B2佣金额外标注扣除补贴后的“实际承担比例”;限制低价倾销,商家定价不低于成本价90%,B2可放宽至85%。贵州2025年监管案例显示,该政策使平台“二选一”行为从25%降至5%,佣金公示误差率从10%降至2%,B1、B2平均利润率分别提升5%、7%,消费者投诉率降至10%以下。

4.3.2. 政策监管方向

反恶性竞争法规:限制平台“二选一”行为,要求佣金率透明化。侯文杰和于立(2021)对平台经济领域反垄断规制的研究,深入分析了“二选一”行为的竞争损害,为相关政策制定提供了学理支撑[12]。案例:2025年贵州省约谈五家OTA平台,要求整改价格欺诈行为,佣金率公示误差率需<3%,对B2的虚假评价查处给予20%罚款补贴。

数据共享机制:强制平台向商家开放部分用户行为数据,对B2开放数据范围可扩大(如用户搜索关键词、点击热力图),且提供免费数据解读服务,辅助B2策略优化。

5. 结论与展望

5.1. 研究结论

本研究基于演化博弈论,构建“平台–异质性商家(大型连锁商家B1/中小型单体商家B2)–消费者”三主体动态博弈模型,通过理论推导、数值仿真与案例验证,揭示OTA平台商家营销策略的演化规律,其核心贡献在于突破现有研究的同质化假设与参数模糊性局限,具体结论如下。

5.1.1. 多主体交互与商家异质性的驱动作用

多主体交互 + 商家异质性双轮驱动策略演化,解决“同质化商家假设与现实策略差异”的矛盾现有研究多将商家视为同质化主体,无法解释“大型商家优先选择差异化、中小商家依赖低价竞争”的现实现象[9]。本研究引入商家异质性维度,明确B1 (自有会员体系、低差异化成本)与B2 (高平台依赖、高差异化成本)的成本结构与策略偏好差异,发现策略演化受“平台规则–竞争强度–消费者反馈–商家类型”四重因素驱动:

1、负向循环:当平台高佣金(α ≥ 0.22)、低流量倾斜(θ ≤ 0.4)且B2占比超60%时,系统陷入“B2深度低价锁定(毛利率 < 3%)、B1短期低价过渡(毛利率 ≈ 8%)”的恶性循环,这与携程2024年中小商家数据高度契合;

2、正向循环:当平台实施“B2专属动态佣金(α = 12%~15%,低于B1的15%~18%) + 流量倾斜(θ = 0.7~0.9,高于B1的0.7~0.8)”,且消费者UGC分享率 ≥ 60%时,系统收敛于“B1差异化主导(选择概率75%)、B2长尾差异化 + UGC (选择概率40%)”的正向循环,整体收益提升23%~35%,其中B2收益提升幅度(25%~30%)高于B1 (18%~25%),填补了现有模型对商家类型差异刻画的空白。

5.1.2. 差异化服务的类型化成功条件

差异化服务需靠“类型适配 + 平台协同”解决单一条件难覆盖不同商家的问题,现有研究仅定性提出其可打破低价锁定,未明确不同商家的差异化成功阈值,本研究通过异质性收益函数推导,明确了差异化服务(D策略)的类型化成功条件:

B1:因自有会员体系降低平台佣金依赖(实际承担α比公开值低30%~40%),需满足 ΔQ Δ C 1 > 1 α (如华住集团 ΔQ=30 万元、 Δ C 1 =10 万元、 α=15% ΔQ Δ C 1 =3> 1 0.15 6.67 ,实现复购率提升20%);

B2:需平台协同降低成本(成本补贴率 β p 0.3 、佣金优惠率 β c 0.2 ),成功条件修正为 ΔQ Δ C 2 ×( 1 β p ) > 1 α×( 1 β c ) (如某民宿 ΔQ=25 万元、 Δ C 2 =15 万元、 β p =0.3 α=20% β c =0.2 25 15×0.7 2.38> 1 20 =6.25 ,接近盈亏平衡)。该结论解决了现有模型差异化条件“一刀切”的问题,为不同类型商家提供精准策略依据。

5.1.3. 平衡类型差异与监管成本

UGC激励需平衡“类型差异 + 监管成本”,弥补“UGC监管缺乏商家类型适配性”的不足。现有研究仅关注UGC的正向效应或单一监管阈值,未考虑不同商家的合规成本差异[6] [10]。本研究通过参数校准(基于马蜂窝2024年数据),提出UGC激励的类型化监管区间:

B1:罚款系数 μ[ 0.3,0.5 ] 、查处概率 p( U )0.5 、补贴 β[ 0.2,0.3 ] ,虚假评价率控制在4%~6%,订单转化率提升8%;

B2:因合规成本高(比B1高20%~30%),监管区间放宽为 μ[ 0.2,0.4 ] p( U )0.4 、平台承担50%补贴( β[ 0.15,0.25 ] ),虚假评价率控制在8%~10%,且无需额外承担罚款成本。该设计避免了现有监管政策“中小商家合规难”的弊端,实现激励效果与监管成本的平衡。

5.1.4. 突发事件与政策监管对B2的倾斜支持

突发事件与政策监管需“倾斜B2”,回应“现有研究忽视中小商家抗风险能力”的缺陷。现有研究在突发事件与政策监管分析中,未区分商家的抗风险差异[11]。本研究发现:

突发事件(如台风灾害ξ = 0.4)下,B2抗风险能力仅为B1的55% (B2净收益降幅比B1高60%),需平台额外提供“5个百分点佣金减免 + 10个百分点成本补贴”,才能使B2从“低价锁定”转向“差异化 + UGC”;

政策监管(如贵州2025年佣金透明化)中,B2受信息不对称影响更大,需通过“佣金公示标注B2实际承担比例 + 20%罚款补贴”,使B2选择差异化策略的概率提升12%~15% (高于B1的10%~12%)。该结论解决了现有政策研究“针对性不足”的问题,为保护中小商家提供理论支持。

5.2. 研究局限

5.2.1. 商家类型细分不足

虽区分B1与B2,但未进一步细分B2亚型(如民宿、小型酒店、特色客栈),不同B2亚型的成本结构(如民宿的装修成本比小型酒店高15%~20%)与策略偏好(如特色客栈更依赖UGC)仍存在差异,可能影响模型精准度;

5.2.2. 短视频平台冲击未纳入

当前“抖音直播订房”等新流量入口已显著影响OTA格局,但本模型未将短视频平台作为第四主体,无法分析其对B1 (品牌力强,受冲击小)与B2 (依赖新流量,受冲击大)的差异化影响;

5.2.3. 实证数据规模有限

数值仿真参数虽基于携程、飞猪财报及行业报告校准,但缺乏大规模B2微观数据(如1000家以上中小商家的策略成本与收益面板数据),模型结论的实证支撑力度有待加强。

5.3. 未来研究方向

更长远的研究可以将B2细分为民宿、小型酒店、特色客栈,构建四主体(平台–B1–B2亚型–消费者)演化博弈模型并推导各亚型策略阈值(如特色客栈UGC补贴最优值);引入抖音等短视频平台作为第四主体,分析“直播订房”对B1 (自有流量稳定)、B2 (依赖短视频流量)的策略影响并构建“传统OTA + 短视频平台”多平台博弈框架;分析AI推荐算法(提效流量分配)、智能客服(降B2服务成本30%~40%)对B1、B2策略演化的差异化作用,结合OTA商家实证数据优化模型参数;同时联合OTA平台获取B2微观面板数据(月度成本、收益、UGC转化率等),用结构方程模型验证理论结论以提升模型实用性。

参考文献

[1] 李卓, 王健, 张莉. 电商平台知识共创行为的演化博弈分析[J]. 商业研究, 2021(7): 45-52.
[2] 谢识予. 演化博弈论导论[M]. 上海: 复旦大学出版社, 2010: 32-58.
[3] 陈洁, 陈德慧. 在线评论对消费者购买决策的影响机制——基于感知价值的中介效应[J]. 消费经济, 2019, 35(4): 67-74.
[4] 家电电商UGC营销策略成效[EB/OL].
https://www.docin.com/touch_new/preview_new.do?id=4640645034, 2024-04-12.
[5] 互联网旅游平台应急预案[EB/OL].
https://m.book118.com/html/2025/0102/7035163200010015.shtm, 2025-09-17.
[6] 刘诚, 张悦, 李然. 平台接入、线上声誉与市场竞争格局[J]. 经济研究, 2024, 58(5): 89-108.
[7] 王永贵, 李志兰. 平台企业竞争策略与差异化路径研究[J]. 中国工业经济, 2021(9): 89-105.
[8] 中国旅游研究院. 2025年OTA用户行为报告[R]. 北京: 中国旅游研究院, 2025.
[9] 卢向华, 林旭. 在线点评中虚假信息的识别及其对商户绩效的影响[J]. 管理世界, 2020, 36(5): 132-141.
[10] 纪汉霖, 管锡展. 双边市场下平台企业的定价策略研究[J]. 产业经济研究, 2008(1): 1-8.
[11] 马蜂窝旅游研究院. 马蜂窝UGC生态发展报告2024 [R]. 2024.
[12] 侯文杰, 于立. 平台经济领域“二选一”行为的反垄断规制研究[J]. 财经问题研究, 2021(12): 11-18.