基于相对利润最大化的Stackelberg博弈均衡点的稳定性
Stability of Equilibrium Points in Stackelberg Game Based on Relative Profit Maximization
摘要: Stackelberg博弈是寡头市场中典型的序贯非合作动态博弈模型,更贴合现实中寡头市场的竞争模式。以相对利润最大化为决策准则,研究Stackelberg博弈模型的动态稳定性问题。采用雅可比矩阵特征值分析方法,结合Jury判别条件,对该动态博弈系统的边界均衡点与纳什均衡点稳定性进行分析,给出了纳什均衡点的稳定条件。本研究丰富了相对利润最大化下寡头动态博弈的稳定性研究体系,为寡头市场的竞争策略制定与市场调控提供了理论参考。
Abstract: As a typical sequential non-cooperative dynamic game model in oligopoly markets, the Stackelberg game is more consistent with the characteristics of real oligopoly market competition. This paper takes relative profit maximization as the decision criterion to investigate the dynamic stability of the Stackelberg game model. The research adopts the eigenvalue analysis method of the Jacobian matrix and combines with the Jury criterion to systematically analyze the stability of the boundary equilibrium points and Nash equilibrium point of the dynamic game system, and explicitly derives the stability conditions of the Nash equilibrium point. The research results enrich the stability research system of oligopolistic dynamic games under relative profit maximization, and provide theoretical support and reference for the formulation of competition strategies and market regulation in oligopoly market.
文章引用:刘政澎. 基于相对利润最大化的Stackelberg博弈均衡点的稳定性[J]. 应用数学进展, 2026, 15(3): 387-392. https://doi.org/10.12677/aam.2026.153113

1. 引言

Stackelberg博弈是寡头市场中典型的序贯非合作动态博弈模型,核心特征是参与主体存在领导者和追随者的层级决策关系,区别于Cournot博弈、Bertrand博弈的同时决策模式,更贴合现实中寡头市场的竞争格局。该模型中,领导者作为市场先动者,具备产量、价格等决策的先发优势,能精准预判追随者的最优反应策略,并将其纳入自身决策约束;追随者则在观察到领导者的决策行为后,在自身目标下做出最优响应,二者的策略互动形成动态博弈系统,其均衡点的动态稳定性成为博弈论与产业组织理论的核心研究方向。

经典Stackelberg博弈以绝对利润最大化作为目标函数,求解得到追随者关于领导者产量或价格的最优反应函数;随后领导者将该反应函数纳入自身利润最大化的约束条件,求解得到领导者的最优产量或价格,再回代至追随者的反应函数,得到追随者的最优产量或价格,二者共同构成Stackelberg均衡解。在动态稳定性分析中,经典模型进一步引入有限理性假设,动态调整产量决策,追随者则根据领导者的当期决策与自身前期收益,做出适应性响应,由此构建起离散型Stackelberg动态博弈系统。Naimzada和Tramontana [1]基于经典模型框架,构建异质参与者的线性成本Stackelberg双寡头动态模型,首次明确决策调整速度是影响均衡点稳定性的核心参数,证实领导者与追随者的产量调整系数均存在临界阈值,超出阈值将导致系统失稳。Xin等[2]突破线性成本假设,构建非线性离散Stackelberg动态博弈系统,将成本差异纳入模型框架。Böhnlein等[3]将经典模型拓展至调度博弈领域,构建凸成本下的Stackelberg动态模型,验证了绝对利润最大化下领导者收益的紧下界,同时证实成本凸性会降低系统的收敛速度。Ahmadi等[4]构建含边际成本的异质参与者Stackelberg双寡头动态模型,领导者为有限理性、追随者为适应性决策,通过分岔图与李雅普诺夫指数分析,推导了均衡点稳定条件,并提出状态反馈与参数调整结合的混沌控制方法,实现了混沌系统向纳什均衡的收敛。Chen等[5]针对时滞型逆向Stackelberg博弈,构建带时滞的倒向随机微分方程模型,推导了领导者与追随者的最优策略验证定理,明确了时滞参数对动态系统最优决策与稳定性的影响机制。Liu等[6]构建随机差分Stackelberg动态博弈模型,证实领导者的随机策略调整可降低追随者的反应敏感度,进而扩大均衡点的稳定域,为随机市场环境下的Stackelberg博弈稳定性调控提供了新路径。

绝对利润最大化假设下,企业仅以自身收益最大化为决策基准,忽略了寡头市场中企业相互参照、追求相对绩效优势的决策逻辑。现实中,龙头企业的决策不仅关注自身利润,更注重与追随者的利润差距,而追随者的决策也以缩小与领导者的利润差为重要目标,相对利润最大化更贴合这一实际竞争行为。相对利润最大化下,直接改变了Stackelberg博弈中追随者的最优反应函数与领导者的决策约束条件,进而重构了整个动态博弈系统的演化规律。从理论层面,相对利润最大化的引入,突破了传统Stackelberg博弈的决策目标框架,丰富了序贯动态博弈的研究维度,推动了Stackelberg博弈模型向现实市场的进一步贴近;从实践层面,基于该假设的Stackelberg博弈动态稳定性分析,能更准确揭示寡头市场中领导者与追随者的序贯策略互动规律,明确二者相对利润决策对市场均衡的动态影响,为龙头企业制定先发制人的动态竞争策略、中小跟随企业制定适应性调整策略,以及政府制定针对性的市场动态调控政策提供更具实操性的理论依据。

当前相对利润最大化下的博弈动态稳定性研究,多从Cournot以及Bertrand模型切入.在时滞影响方面,Ma等[7]构建时滞Bertrand动态模型。Zha等[8]验证了溢出效应对相对利润最大化寡头博弈均衡稳定区域的改变机制,证实正向溢出能扩大稳定域,而负向溢出会压缩稳定域,相关研究参见文献[9] [10]以及所引用的文献。

本文研究相对利润最大化下Stackelberg博弈模型的动态稳定性,利用雅可比矩阵特征值以及Jury判别条件给出动态系统的边界均衡点和纳什均衡点的稳定性。

2. 模型构建

假设企业1和企业2在市场上进行Stackelberg博弈,其中企业1为领导厂商,企业2为追随厂商,他们在市场上共同生产某种具有差异化的产品,市场的逆需求函数为

{ p 1 =a q 1 b q 2 p 2 =ab q 1 q 2

其中 p i 为产品的价格, q i 为产品的实际生产产量。 a 为正常数, 0<b<1 为产品的差异系数, b 越大说明产品的差异程度越小。假设企业的生产成本为

C i ( q i )= c i ( q i θ i ) 2 ,i=1,2

其中 c i >0 θ i 为企业的计划产量,在现实经济中,一般有 θ i q i ,关于该模型的相关解释参见文献[4]。企业的利润函数为

{ π 1 = q 1 ( a q 1 b q 2 ) c 1 ( q 1 θ 1 ) 2 π 2 = q 2 ( ab q 1 q 2 ) c 2 ( q 2 θ 2 ) 2

均衡点的稳定性

本文考虑企业的相对利润,即

{ k 1 = π 1 π 2 k 2 = π 2 π 1

在市场竞争中,企业以相对利润最大化为决策目标。求解相对利润关于产量的偏导数得

{ k 1 q 1 =a2( 1+ c 1 ) q 1 +2 c 1 θ 1 k 2 q 2 =a2( 1+ c 2 ) q 2 +2 c 2 θ 2

求得最大化问题的一阶条件,令 k i q i =0

{ q 1 = a+2 c 1 θ 1 2( 1+ c 1 ) q 2 = a+2 c 2 θ 2 2( 1+ c 2 )

q 1 q 2 代入 k 2 中并关于 θ 2 求导,由 k 2 θ 2 =0

θ 2 = a[ 1+ c 2 b( 1+ c 1 ) ]+2b c 2 ( 1+ c 1 ) θ 1 2 c 1 [ 1+ c 2 b( 1+ c 1 ) ]

θ 2 代回到 q 2 后,将 q 1 q 2 代回 k 1 并关于 θ 1 求导。令 k 1 θ 1 =0

θ 1 * = a[ 1+ c 1 b( 1+ c 2 ) ] 2 c 1 ( 1 b 2 )

将上式代入 θ 2 整理得

θ 2 * = a[ 1+ c 2 b( 1+ c 1 ) ] 2 c 2 ( 1 b 2 )

θ 1 * θ 2 * 代入 q 1 q 2 中得均衡产量

{ q 1 * = a[ 2+ c 1 b 2 b( 1+ c 2 ) ] 2( 1+ c 1 )( 1 b 2 ) q 2 * = a[ 2+ c 2 b 2 b( 1+ c 1 ) ] 2( 1+ c 2 )( 1 b 2 )

为了保证两家企业在市场上进行寡头竞争,企业的均衡产量应该为正,因此本文需要如下的约束条件

{ 2+ c 1 > b 2 +b( 1+ c 2 ) 2+ c 2 > b 2 +b( 1+ c 1 )

假设企业1和企业2都采用有限理性预期原则,我们构建离散动态系统如下:

{ q 1,t+1 = q 1,t +k q 1 k 1 q 1 q 2,t+1 = q 2,t +k q 2 k 2 q 2

其中 k>0 为产量调节系数。由前知

{ q 1,t+1 = q 1,t +k q 1,t [ a2( 1+ c 1 ) q 1 +2 c 1 θ 1 ] q 2,t+1 = q 2,t +k q 2,t [ a2( 1+ c 2 ) q 2 +2 c 2 θ 2 ] (1)

易知,动态系统(1)的边界均衡点为

E 0 =( 0,0 ) E 1 =( 0, a+2 c 2 θ 2 * 2( 1+ c 2 ) ) E 2 =( a+2 c 1 θ 1 * 2( 1+ c 1 ) ,0 )

纳什均衡点为

E * =( q 1 * , q 2 * )

为研究均衡点的稳定性,考虑动态系统(1)的雅各比矩阵

J( q 1 , q 2 )=( 1+k[ a4( 1+ c 1 ) q 1 +2 c 1 θ 1 ] 0 0 1+k[ a4( 1+ c 2 ) q 2 +2 c 2 θ 2 ] )

定理1边界均衡点 E 0 E 1 E 2 都是不稳定的。

证明:首先考虑 E 0 ,该点处的雅各比矩阵为

J( E 0 )=( 1+k( a+2 c 1 θ 1 ) 0 0 1+k( a+2 c 2 θ 2 ) )

显然,矩阵 J( E 0 ) 的两个特征值为 1+k( a+2 c i θ i )>0 ,故 E 0 是不稳定的。

现在考虑 E 1 ,该点处的雅各比矩阵为

J( E 1 )=( 1+k( a+2 c 1 θ 1 ) 0 0 1k( a+2 c 2 θ 2 ) )

J( E 1 ) 的一个特征值 1+k( a+2 c 1 θ 1 )>1 ,另一个特征值仅当 0<k< 2 a+2 c 2 θ 2 时小于1,故 E 1 是不稳定的。

同理, E 2 也是不稳定的。

定理2纳什均衡点 E 为局部稳定的充要条件为

2a AB <k< A+B AB

其中

A= a[ b 2 c 1 +b+b c 2 2 ] 1 b 2 <0

B= a[ b 2 c 2 +b+b c 1 2 ] 1 b 2 <0

证明:易知 J( E * ) 的迹为

T=2+k[ 2a4( 1+ c 1 ) q 1 +2 c 1 θ 1 4( 1+ c 2 ) q 2 +2 c 2 θ 2 ]

J( E * ) 的行列式为

D=[ 1+k( a4( 1+ c 1 ) q 1 +2 c 1 θ 1 ) ][ 1+k( a4( 1+ c 2 ) q 2 +2 c 2 θ 2 ) ]

由Jury判别条件, E * 为稳定的充要条件为

{ 1T+D>0 1+T+D>0 1D>0

q 1 * q 2 * θ 1 * θ 2 * 代入 T D ,计算整理知

1D>0 意味着 k< A+B AB

1T+D>0 意味着 k> 2a AB

1+T+D>0 等价于

AB k 2 +2[ ( A+B )+a ]k+4>0 (2)

关于 k 的二次函数的判别式

Δ=4 [ ( A+B )+a ] 2 16AB

A B 的值代入并注意到约束条件,知 Δ<0 。注意到 AB>0 ,故不等式(2)恒成立。此外,由 A B 的表达式易知 2a<( A+B ) 恒成立。

综上,定理2成立。

参考文献

[1] Naimzada, A. and Tramontana, F. (2010) Dynamic Duopoly Games with Heterogeneous Players. Journal of Economic Behavior & Organization, 73, 75-86.
[2] Xin, Y., Chen, L. and Zhang, J. (2020) Local Stability of a Nonlinear Discrete Stackelberg Duopoly Model. Nonlinear Dynamics, 99, 3081-3095.
[3] Böhnlein, T. and Harks, T. (2017) Stackelberg Scheduling Games with Convex Costs. Journal of Scheduling, 20, 289-304.
[4] Ahmadi, A., Roy, S., Mehrabbeik, M., Ghosh, D., Jafari, S. and Perc, M. (2023) The Dynamics of a Duopoly Stackelberg Game with Marginal Costs among Heterogeneous Players. PLOS ONE, 18, e0283757. [Google Scholar] [CrossRef] [PubMed]
[5] Chen, L., Zhou, P. and Xiao, H. (2023) Backward Stackelberg Games with Delay and Related Forward-Backward Stochastic Differential Equations. Mathematics, 11, Article No. 2898. [Google Scholar] [CrossRef
[6] Liu, J., Wang, W., Xu, J. and Zhang, H. (2023) Stackelberg Strategy of Two-Player Stochastic Difference Game with Time Delay. International Journal of Control, Automation and Systems, 21, 2904-2915. [Google Scholar] [CrossRef
[7] Ma, H., Wang, Y. and Liu, X. (2023) Stability Analysis of a Delayed Bertrand Duopoly Game with Relative Profit Maximization. Communications in Nonlinear Science and Numerical Simulation, 118, Article ID: 106892.
[8] Zha, M., Li, X. and Yang, L. (2020) Spillover Effects on the Stability of Oligopoly Games with Relative Profit Maximization. Economic Modelling, 87, 364-375.
[9] Askar, S.S. and Al-khedhairi, A. (2020) Dynamic Investigations in a Duopoly Game with Price Competition Based on Relative Profit and Profit Maximization. Journal of Computational and Applied Mathematics, 367, Article ID: 112464. [Google Scholar] [CrossRef
[10] Wei, Z., Tan, W., Elsadany, A.A. and Moroz, I. (2023) Complexity and Chaos Control in a Cournot Duopoly Model Based on Bounded Rationality and Relative Profit Maximization. Nonlinear Dynamics, 111, 17561-17589. [Google Scholar] [CrossRef