基于演化博弈的隧道大修分解监管策略研究

doi:10.12677/ojtt.2025.141015

期刊菜单

基于演化博弈的隧道大修分解监管策略研究
Research on Regulatory Strategies for Tunnel Overhaul Decomposition Based on Evolutionary Game

DOI: 10.12677/ojtt.2025.141015, PDF, HTML, XML,
作者: 金尔, 季陈懿：浙江大学建筑工程学院，浙江杭州；彭崇梅：上海城建城市运营(集团)有限公司，上海
关键词: 隧道大修分解；演化博弈；系统动力学；监管策略；运营管理；Tunnel Overhaul Decomposition； Evolutionary Game； System Dynamics； Regulatory Strategies； Operations Management

摘要: 本研究运用演化博弈和系统动力学理论，研究政府方和运维方的策略，将其视作博弈中的局中人设定支付矩阵，构建复制动态方程。根据博弈双方的策略行使概率及效用参数构建系统动力学模型，仿真政府监管策略，并对监管策略的变化敏感性分析；分析局中人单方面策略稳定性结果，讨论政府方监管概率阈值及运营方大修分解概率的稳定性，优化仿真隧道大修分解监管。

Abstract: This study applies the theory of evolutionary game and system dynamics to study the strategies of the government side and the operation and maintenance side, which are regarded as the players in the game to set the payment matrix and construct the replicated dynamic equations. According to the strategy exercise probability and utility parameters of the two sides of the game, this paper constructs a system dynamics model, simulates the government regulatory strategy, and the sensitivity analysis of the change of the regulatory strategy; analyzes the results of the stability of the one-sided strategy of the players in the bureau, discusses the threshold of the regulatory probability of the government side and the stability of the probability of the overhaul decomposition of the operation side, and optimizes the simulation of the overhaul decomposition of the tunnel regulation.

文章引用：金尔, 季陈懿, 彭崇梅. 基于演化博弈的隧道大修分解监管策略研究[J]. 交通技术, 2025, 14(1): 143-151. https://doi.org/10.12677/ojtt.2025.141015

1. 引言

目前隧道养护维修缺乏隧道养护措施的技术水平，传统的隧道养护方法，虽然有着良好的作用，但已经不能满足当今社会的需求并且隧道养护维修缺乏相对性专业技术人员，专业性养护人员稀缺，使其管理和控制不到位，并缺乏科学性、合理性[1]；隧道养护维修制度不够明确[2]；管理部门在隧道运营之后，忽视管理的重要性，导致很多养护管理机构难以发挥出其重要的作用[3]。传统的隧道管养往往以短周期的合同和指标作为其管理目标，过度重视短期效益，忽视长期规划和养护维修延续性，不仅降低了养护效率，而且影响了隧道的使用寿命。

王文轲等[4]通过构建多方演化博弈模型，探索影响监管部门与航空公司博弈结果的因素。程敏等[5]通过系统动力学建立演化博弈仿真模型，探讨建筑安全监管策略，认为加大对监管部门的奖惩力度，可以改善建筑安全生产状况。蔡玲如等[6]对环境污染博弈问题进行了研究，提出了动态惩罚策略，使得博弈系统存在一个演化稳定策略。

张伟等[7]对煤炭资源绿色开采监管中的演化博弈问题进行了研究，建议加强监管部门的监管能力与监管意愿、加大对违法行为的惩罚力度。周辉等[8]在研究旅游市场监管机制后，认为通过降低游客投诉成本、加大对宰客档位的处罚力度等方式，可以建立旅游市场监管的有效机制。任建超[9]认为对地方政府的监管应当正向激励而不是单纯地提高失责惩罚。李小莉[10]将声誉引入到公司合作项目的监管研究中，认为监管部门更应当建立合理的声誉激励机制，以促使私人部门有更高的积极性提供高质量的公共产品和服务。

顾鹏等[11]发现局中人行为要素的变动会使均衡点在源点、汇点和鞍点之间变动，其中企业违法排污额外收益过高、监管部门监管不严格等因素会使博弈结果锁定在不良状态。黄廷等[12]提出动态奖励策略，并改变博弈系统的某些边界条件，提高企业采取碳减排措施的概率。

而今，演化博弈理论已被广泛运用于政府监管的各个领域，具有很高的适用性。现有同类型研究通过采取动态惩罚或动态奖励策略，提高被监管者的执行稳定性，再改变监管环境(外部变量)提高被监管者的执行水平。这样的监管策略在实际工作中具有很大的操作难度，由于监管环境在较短时间内是很难改变的。为了更好地满足城市服务要求，建设科学高效的长寿命隧道运营体系，优化创新运维管理模式，本研究以隧道长寿命周期大修分解为背景，从演化博弈的视角探讨政府方的监管策略。

2. 隧道大修分解演化博弈模型构建

2.1. 隧道大修分解演化博弈问题描述

2.1.1. 演化博弈局中人定义

政府方：作为隧道运营维护项目的发包方，针对运维方采取的维护方案(大修分解方案)制定相关政策，以便监督和管理隧道大修分解的运维情况。

运维方：专门从事隧道在特许经营期内的运营维护，制定并执行隧道大修方案及其相关的各种工作或活动。

2.1.2. 演化博弈局中人假设

1) 博弈中两方局中人(政府方与运维方)都是有限理性的，即不是一次性做出最优决策，而是在博弈过程中，不断观察、学习和模仿收益更高的策略，通过多次的策略调整最终形成最优决策。

2) 政府方以验收日起12年内不需进行大修为目的，考虑其社会责任感。政府方有对运维方运营维护情况的监督管理能力，即运维方采用政府方非期望的大修分解方案时，政府方能够通过检查发现。

3) 根据第二章的研究成果可知，运维方不会完全忽略传统维修方式带来的负面效益，如交通封堵以及长期不维修带来的性能劣化隐患等等，即运维方能够积极主动承担社会责任且能较好地达成企业自身的经济效益，但运维方考虑的综合效益可能与政府方有所差距，因此运维方最期望的大修分解方案并不一定是政府方最期望的，比如运维方大修分解的细致程度(中小修频度)并不一定能达到政府方的期望。

2.1.3. 演化博弈问题描述

运维方有x的概率达成政府方所期望的面向全寿命周期的隧道大修分解养护。相反地，运维方有1 − x的概率无法到达政府方的期望。

为了便于后续演化博弈模型的构建，以上描述可以概括为：运维方以概率x选择大修分解，以概率1 − x选择非大修分解。在此基础上可以整理出运维方在两种决策下的相关参数及其含义如表1所示。

Table 1. Parameters and meanings related to the operator and maintainer

表1. 运维方相关参数及含义

参数	参数含义	参数符号
$C_{R}$	大修分解日常养护增量成本	$C_{R} > 0$
$C_{Z}$	大修分解专项养护增量成本	$C_{Z} > 0$
$C_{J}$	大修分解中大修节约成本	$C_{J} > 0$
$R_{1}$	大修分解未来收益	$R_{1} > 0$
$α$	大修分解未来收益转化系数	$0 \leq α \leq 1$
$π_{1}$	大修分解的经济奖励	$π_{1} > 0$
$F_{1}$	非大修分解经济惩罚	$F_{1} > 0$
$L_{1}$	非大修分解未来损失	$L_{1} > 0$
$β$	非大修分解未来损失转化系数	$0 \leq β \leq 1$
$x$	运维方选择大修分解的概率	$0 \leq x \leq 1$

政府方以概率y选择监管，那么以概率1 − y选择非监管。同理可以整理出政府方在两种决策下的相关参数及其含义如表2所示。

Table 2. Parameters and meanings related to the government side

表2. 政府方相关参数及含义

参数	参数含义	参数符号
$C_{2}$	政府方监管成本	$C_{2} > 0$
$P_{2}$	政府方失职追责	$P_{2} > 0$
$G_{2}$	维护方非大修分解造成的社会福利损失	$G_{2} > 0$
$y$	政府方监管概率	$0 \leq y \leq 1$

2.2. 隧道大修分解演化博弈模型构建

2.2.1. 博弈支付矩阵

运维方与政府方作为有限理性的局中人，会根据自身的收益情况选择策略。运维方的行为策略集合可表示为{大修分解，非大修分解}；政府方的行为策略集合可表示为{监管，非监管}，其行为策略矩阵如表3所示。

Table 3. Behavioral strategy matrix of game players

表3. 博弈局中人行为策略矩阵

		政府方
		监管(y)	非监管(1 − y)
运维方	大修分解(x)	{大修分解，监管}	{大修分解，非监管}
运维方	非大修分解(1 − x)	{非大修分解,监管}	{非大修分解,非监管}

经过策略分析，将有关参数代入各种策略情况，可以构建运维方和政府方博弈的支付矩阵，如表4所示。

Table 4. Game player payment matrix

表4. 博弈局中人支付矩阵

		政府方
		监管	非监管
运维方	大修分解	$- C_{R} - C_{Z} + C_{J} + α R_{1} + π_{1}$ , $- C_{2}$	$- C_{R} - C_{Z} + C_{J}$ , 0
运维方	非大修分解	$- F_{1} - β L_{1}$ , $- C_{2} - G_{2}$	0, $- G_{2} - P_{2}$

综合考虑策略矩阵和支付矩阵，构建运维方和政府方的演化博弈复制动态方程。

2.2.2. 复制动态方程

(1) 运维方复制动态方程

运维方执行大修分解的期望收益为：

$E_{1 Y} = y (- C_{R} - C_{Z} + C_{J} + α R_{1} + π_{1}) + (1 - y) (- C_{R} - C_{Z} + C_{J}) = y α R_{1} + y π_{1} - C_{R} - C_{Z} + C_{J}$ (1-1)

运维方不执行大修分解的期望收益为：

$E_{1 N} = y (- F_{1} - β L_{1}) = - y F_{1} - y β L_{1}$ (1-2)

根据式(1-1)和(1-2)，可得运维方演化博弈的复制动态方程为

$F (x) = \frac{d x}{d t} = x (1 - x) (E_{1 Y} - E_{1 N}) = x (1 - x) (y α R_{1} + y π_{1} - C_{R} - C_{Z} + C_{J} + y F_{1} + y β L_{1})$ (1-3)

(2) 政府方复制动态方程

政府方监管的期望收益为：

$E_{2Y} = x (- C_{2}) + (1 - x) (- C_{2} - G_{2}) = - C_{2} - G_{2} + x G_{2}$ (1-4)

政府方非监管的期望收益为：

$E_{2N} = (1 - x) (- G_{2} - P_{2}) = - G_{2} - P_{2} + x G_{2} + x P_{2}$ (1-5)

根据式(1-4)和(1-5)，可得政府方演化博弈的复制动态方程为：

$F (y) = \frac{d y}{d t} = y (1 - y) (E_{2Y} - E_{2N}) = y (1 - y) (P_{2} - C_{2} - x P_{2})$ (1-6)

综合式(1-3)和(1-6)，运维方-政府方间演化博弈复制动态方程组为：

${\begin{cases} F (x) = \frac{d x}{d t} = x (1 - x) (E_{1 Y} - E_{1 N}) = x (1 - x) (y α R_{1} + y π_{1} - C_{R} - C_{Z} + C_{J} + y F_{1} + y β L_{1}) \\ F (y) = \frac{d y}{d t} = y (1 - y) (E_{2Y} - E_{2N}) = y (1 - y) (P_{2} - C_{2} - x P_{2}) \end{cases}$ (1-7)

3. 隧道大修分解系统动力学模型构建

3.1. 仿真模型描述

基于式(1-7)运维方–政府方复制动态方程组，采用Vensim PLE Version6.2构建隧道大修分解监管系统动力学模型，如图1所示。

Figure 1. Overhaul decomposition evolutionary game system dynamics modeling

图1. 大修分解演化博弈系统动力学模型

3.2. 仿真模型参数设定

(1) 仿真模型基本设定

本研究设定仿真时间为20年，故取INITIAL TIME = 0，FINAL TIME = 20，单位为年。假设政府方以每月2次的频率对运维方执行大修分解情况进行监管，即运维方与政府方每年博弈24次。故近似地，取仿真步长TIME STEP = 0.04。

(2) 仿真模型参数设定

因此本研究通过对参数逻辑关系分析，对模型参数赋值，以最大限度地提高精确度，具体赋值情况如表5所示。

Table 5. Parameter assignment in system dynamics models

表5. 系统动力学模型参数赋值

参数	参数含义	值
$C_{R}$	大修分解日常养护增量成本	2
$C_{Z}$	大修分解专项养护增量成本	2
$C_{J}$	大修分解中大修节约成本	1
$R_{1}$	大修分解未来收益	2
$α$	大修分解未来收益转化系数	0.5
$π_{1}$	大修分解的经济奖励	1
$F_{1}$	非大修分解经济惩罚	2
$L_{1}$	非大修分解未来损失	4
$β$	非大修分解未来损失转化系数	0.5
$C_{2}$	政府方监管成本	1
$P_{2}$	政府方失职追责	5
$G_{2}$	维护方非大修分解造成的社会福利损失	3

3.3. 初步仿真

取x = 0.7，y = 0.7作为博弈初始状态，对监管系统演化过程进行初步仿真，结果如图2所示。

仿真结果表明，监管在初期呈现了良好效果：运维方大修分解概率逐步上升，政府方监管概率逐步下降。但是一段时间后(此处约为2年)，若政府方不调整监管政策，大修分解概率会逐步降低，从而陷入“监管–大修分解–非监管–非大修分解–建管–大修分解”的循环，以上仿真结果直观地反映了大修分解执行效果反复的状况，政府方应当对监管政策与监管策略进行优化。

Figure 2. Step-by-step simulation results

图2. 1步仿真结果

4. 隧道大修分解监管政策仿真

本节通过系统动力学仿真，研究政府方政策变动在短期内对大修分解概率的影响。因此，在本节中将仿真模型中的FINAL TIME调整为2。

4.1. 初始策略仿真

定性地，可以将运维方的初始策略划分为高概率大修分解(x = 0.7)和低概率大修分解(x = 0.3)，将政府方的初始策略划分为高概率监管(y = 0.7)和低概率监管(y = 0.3)。将局中人的初始策略进行组合，共有4种情况：高分解–高监管、高分解–低监管，低分解–低监管，低分解–高监管，对4中初始策略组合进行仿真，结果如图3所示。

仿真结果显示，当初始策略为“低分解–高监管”时，运维方的大修分解概率将最快向1收敛；初始策略为“高分解–高监管”时，运维方的大修分解概率向1收敛的速度其次，仿真结果表明，府方采取“高监管”的初始策略，有益于运维方快速提高大修分解概率。

当初始策略为“低分解–低监管”和“高分解–低监管”时，运维方大修分解概率都经历了一段时间的下降后再重新上升。这表明在初始阶段，运维方学习到了政府方监管概率较低，从而降低了自己大修分解的概率；政府方在察觉到了运维方大修分解概率降低后，随机调整了自己的策略，提高监管概率，从而导致运维方大修分解概率的再次上升，仿真结果与大修分解监管系统的现实情况相符，反映了运维方和政府方策略不断动态调整的过程，验证了模型的有效性。

Figure 3. Initial strategy combination simulation

图3. 初始策略组合仿真

4.2. 参数敏感性分析仿真

此处利用系统动力学提供的仿真手段，选取“低分解–高监管”的初始状态，探究参数变化对演化过程的影响。保持其他参数不变，考虑以下六种情形：运维方大修分解产生的总增量成本；运维方大修分解未来收益；运维方非大修分解所受到的总惩罚；政府方监管成本；政府方失职追责；运维方大修分解受到的经济奖励分别变化20%，进行系统演化分析。得出如表6所示的分析结果，对应的政策建议参见“隧道大修分解监管策略研究形成的相应政策部分”。

5. 静态策略下系统稳定性分析与仿真

本研究表明，提高运维方非大修分解总惩罚、降低大修分解增量成本，可以在短期内提高运维方的

Table 6. Parameter sensitivity calculations

表6. 参数敏感性计算

变量符号	初始值	变化值	变化幅度	初始x	变化后x	变化幅度	敏感度
$C_{R} + C_{Z} - C_{J}$	3	2.4	20%	0.279	0.351	26%	1.30
		3.6			0.216	23%	1.15
$R_{1}$	2	1.6	20%	0.279	0.268	4%	0.20
		2.4			0.290	4%	0.20
$F_{1} + β L_{1}$	4	3.2	20%	0.279	0.238	15%	0.75
		4.8			0.324	16%	0.80
$C_{2}$	1	0.8	20%	0.279	0.289	4%	0.20
		1.2			0.270	3%	0.15
$P_{2}$	5	4	20%	0.279	0.246	12%	0.60
		6			0.314	13%	0.65
$π_{1}$	1	1.6	20%	0.279	0.268	4%	0.20
		2.4			0.290	4%	0.20

大修分解概率；但长期来看，大修分解概率是否稳定，如何提高大修分解概率稳定性，是政府方关心的重点，也是本章研究的主要内容。

为了便于计算，本节将运维方大修分解总增量成本记为 $C_{1}$ ，则 $C_{1} = C_{R} + C_{Z} - C_{J}$ ；将运维方非大修分解总惩罚记为 $P_{1}$ ，则 $P_{1} = F_{1} + β L_{1}$ 。

5.1. 稳定性分析

在式(1-7)中，令 $(F (x), F (y)) = (0, 0)$ ，得到5个解： $E_{1} (0, 0)$ ， $E_{2} (0, 1)$ ， $E_{3} (1, 0)$ ， $E_{4} (1, 1)$ ， $E_{5} (\frac{P_{2} - C_{2}}{P_{2}}, \frac{C_{1}}{α R_{1} + π_{1} + P_{1}})$ ，根据模型变量逻辑关系分析可知，上述5个解均为系统的均衡解，所对应的点为系统均衡点。

Friedman提出，对系统均衡点的稳定性分析，可以通过系统Jacobin矩阵局部稳定性分析得到。计算系统Jacobin矩阵行列式的值和迹的值如表7所示。可知在静态的激励策略下，系统的5个均衡点均不是演化稳定均衡点，即不存在演化稳定策略。

Table 7. Equilibrium point stability analysis

表7. 均衡点稳定性分析

均衡点	$\det (J)$	$tr (J)$
$E_{1} (0, 0)$	$- C_{1} (P_{2} - C_{2})$	$- C_{1} + P_{2} - C_{2}$
$E_{2} (0, 1)$	$(π_{1} + α R_{1} - C_{1} + P_{1}) (C_{2} - P_{2})$	$π_{1} + α R_{1} - C_{1} + P_{1} + C_{2} - P_{2}$
$E_{3} (1, 0)$	$- C_{1} C_{2}$	$C_{1} - C_{2}$
$E_{4} (1, 1)$	$- (π_{1} + α R_{1} - C_{1} + P_{1}) C_{2}$	$- π_{1} - α R_{1} + C_{1} - P_{1} + C_{2}$
$E_{5} (\frac{P_{2} - C_{2}}{P_{2}}, \frac{C_{1}}{α R_{1} + π_{1} + P_{1}})$	$\frac{C_{1} C_{2} (π_{1} + α R_{1} - C_{1} + P_{1}) (P_{2} - C_{2})}{P_{2} (α R_{1} + π_{1} + P_{1})}$	0

5.2. 稳定性分析仿真

运维方大修分解监管系统有4个纯策略均衡解E1~E4和1个混合策略均衡解E5。上文运用微分方程稳定性分析方法，证明了5个均衡解都不是演化稳定均衡。当系统在E1~E5任何一个均衡点处发生突变时，系统该如何演化？传统的分析方法不能直观地展现演化过程，本文通过Vensim系统动力学仿真平台进行研究。

分析Vensim仿真获得的突变演化图，可以发现对于纯策略均衡解E1~E4，一方局中人的行为突变，并不会影响另一局中人的策略。这是因为为双方的初始策略均为纯策略，一方策略突变后，会通过对新策略的学习，向收益高的策略演化，而另一方因为没有突变，只能学习原有策略，所以保持策略不变。而对于混合策略均衡解E5，一方局中人的行为突变，会导致运维方和政府方的策略改变。这是因为双方的初始策略为混合策略，都存在两种策略可供学习，此时突变发生，双方各自学习收益高的策略，并向该策略演化。

在现实的大修分解监管系统中，绝大多数情况下是采取混合策略作为初始策略。通过上文理论分析和仿真发现，模型中唯一的混合策略均衡解并不是演化稳定均衡，一旦受到外界微小的扰动，均衡状态就会被打破，意味着运维方大修分解概率的不可控性变高。如何优化监管机制，提高均衡点的均衡点，是值得研究的问题。

6. 结论

通过对隧道大修分解方案与监管现状的分析，将政府方和运维方视作博弈中的局中人，构建了大修分解背景下的局中人策略矩阵，设定了包括大修分解增量成本、未来收益等在内的10个外部变量，并对各局中人对于各个局势的支付函数进行了赋值。

基于演化博弈理论，构建了隧道大修分解复制动态方程，基于系统动力学理论构建了大修分解系统动力学模型，对大修分解监管策略的敏感性进行了分析，对静态策略下隧道大修分解系统稳定性进行了分析和仿真，揭示了局中人策略动态演化的内在机理。

在构建运维方和政府方演化博弈模型时，本研究虽然对支付矩阵中各参数之间的逻辑关系进行了较为细致地分析，但各参数的赋值仍有一定的主观性。

参考文献

[1]	李伟. 高速公路桥梁与隧道养护管理的现状与对策探索[J]. 产业与科技论坛, 2015, 14(13): 238-239.
[2]	王婷婷. 城市内环隧道养护管理分析[J]. 现代城市研究, 2018(12): 125-126.
[3]	靳航, 高速公路桥梁与隧道养护管理现状与解决措施[J]. 山西建筑, 2018, 44(11): 259-260.
[4]	王文轲, 蔡洁, 陈曾洁, 等. 民航安全监管中的多方演化博弈研究[J]. 中国安全科学学报, 2016, 26(1): 136-141.
[5]	程敏, 朱前程, 董大旻. 基于系统动力学的建筑安全监管博弈研究[J]. 中国安全科学学报, 2011, 21(12): 73-81.
[6]	蔡玲如, 王红卫, 曾伟. 基于系统动力学的环境污染演化博弈问题研究[J]. 计算机科学, 2009, 36(8): 234-238.
[7]	张伟, 张金锁, 刘杰. 基于演化博弈的煤炭资源绿色开采监管策略研究[J]. 西安科技大学学报, 2016, 36(3): 349-355.
[8]	周辉, 陈淑凌, 崔亚梅. 基于演化博弈的旅游市场监管机制研究[J]. 系统工程学报, 2016, 31(5): 618-624.
[9]	任建超. 中央与地方政府食品安全监管演化博弈及仿真研究[J]. 哈尔滨工业大学学报(社会科学版), 2017, 19(4): 127-133.
[10]	李小莉. 考虑声誉的公私合作项目监管演化博弈分析[J]. 系统工程学报, 2017, 32(2): 199-206.
[11]	顾鹏, 杜建国, 金帅. 基于演化博弈的环境监管与排污企业治理行为研究[J]. 环境科学与技术, 2013, 36(11): 186-192.
[12]	黄廷, 陈丽娟, 史培新. 基于BIM的公路隧道运维管理系统设计与开发[J]. 隧道建设, 2017, 37(1): 53-60.

为你推荐

友情链接