建筑垃圾资源化利用三方博弈与稳定策略优化研究

doi:10.12677/mse.2025.141030

期刊菜单

建筑垃圾资源化利用三方博弈与稳定策略优化研究
Research on the Evolutionary Game and Stability Strategy Optimization of Construction Waste Resource Utilization

DOI: 10.12677/mse.2025.141030, PDF, HTML, XML, 科研立项经费支持
作者: 周莹：沈阳建筑大学管理学院，辽宁沈阳；东北大学工商管理学院，辽宁沈阳；罗泽松^*, 于淼, 杨卓璠：沈阳建筑大学管理学院，辽宁沈阳
关键词: 演化博弈；建筑垃圾；仿真分析；NSGA-II算法；Evolutionary Game； Construction Waste； Simulation Analysis； NSGA-II Algorithm

摘要: 随着城市建筑垃圾总量不断扩大，为实现建筑垃圾资源化利用，需要厘清施工单位、社会资本及政府三者在其过程中的利益关系。首先通过三方演化博弈模型，分析不同策略组合下的均衡条件。进而引入动态奖惩制度，与静态制度对比分析系统的演化稳定策略。研究结果表明，施工单位、社会资本、政府分别稳定于“合法处理”“投资资源化项目”“实行激励约束政策”。当三方都选择积极处理建筑垃圾时，动态机制下的奖惩成本与三方策略选择无关，且动态机制下政府的激励约束政策效果更优。随后构建建筑垃圾资源化利用稳定策略优化模型，通过NSGA-II算法求得Pareto前沿面，得出内外部因素下的最佳组合方式，从而选择最为合适的方案。

Abstract: With the continuous expansion of the total amount of urban construction waste, in order to realize the resource utilization of construction waste, it is necessary to clarify the relationship among the interests of the construction unit, social capital, and the government in its process. Firstly, the tripartite evolutionary game model is used to analyze the equilibrium conditions under different strategy combinations. Then, the dynamic reward and punishment system is introduced, and the evolutionary stability strategy of the system is compared with the static system. The results show that the construction unit, social capital, and government are stable in “legal treatment”, “investment in resource projects”, and “implementation of incentive and restraint policies”, respectively. When all three parties choose to actively deal with construction waste, the reward and punishment cost under the dynamic mechanism has nothing to do with the tripartite strategy choice, and the government’s incentive and restraint policies under the dynamic mechanism have a better effect. Then, the optimization model of the stable strategy of construction waste resource utilization was constructed, and the Pareto front was obtained through the NSGA-II algorithm, and the optimal combination of internal and external factors was obtained, so as to select the most suitable scheme.

文章引用：周莹, 罗泽松, 于淼, 杨卓璠. 建筑垃圾资源化利用三方博弈与稳定策略优化研究[J]. 管理科学与工程, 2025, 14(1): 294-307. https://doi.org/10.12677/mse.2025.141030

1. 引言

快速发展的城镇化正成为中国经济社会增长的强大引擎，然而城市建筑垃圾总体规模也在随之不断增大。我国建筑垃圾的三大主要来源为旧建筑拆除、新建筑施工以及建筑装修，其中旧建筑拆除与新建筑施工产生的建筑垃圾之和占总量的80%以上。但现有建筑垃圾处理方式粗放，主要以填埋或者露天堆放为主，这不仅侵占和浪费了大量的土地，还造成了环境的二次污染，与此同时政府部门需要花费大量的资金、时间对建筑垃圾造成的污染进行处理。虽然建筑垃圾的组成成分较为复杂，但具备一定的回收利用价值，目前我国的建筑垃圾回收利用率为5%左右，而国外发达国家建筑垃圾资源化率可达85%以上。

着力解决突出环境问题，建设美丽中国已成为全面建设社会主义现代化国家的重大目标。现阶段，政府部门高度重视建筑垃圾资源化利用工作，对于资源化利用相关项目采取了相对应的改进措施。2022年3月11日，住房和城乡建设部印发的《“十四五”建筑节能与绿色建筑发展规划》(建标〔2022〕24号)提出，到2025年装配式建筑占当年城镇新建建筑的比例达到30%。但我国建筑垃圾研究工作起步较晚，目前还存在部分亟待解决的问题，如目前我国还未有针对建筑垃圾资源化处理方面相关的法律，只有一些对建筑垃圾减量化的规定，但国外一些发达国家对于建筑垃圾资源化的法律体系则相对完善。例如，美国颁布《建筑废弃物填埋场设计规范》等法规，成立专门机构负责对建筑垃圾废弃物的填埋、回收、排放等进行专业化管理[1]。由于缺乏建筑垃圾科学管理办法以及经济可行的资源化技术，我国建筑垃圾资源化总体水平仍处于较低水平，而建筑垃圾对社会产生的影响日益严重，因此，有效提高建筑垃圾资源化水平刻不容缓。

目前，由于社会环境与节约资源意识不断增强，建筑垃圾的处理以及资源化方面的相关研究方兴未艾，例如，Song [2]使用混合模型法，预测了中国建筑垃圾产生量；Yuan [3]系统归纳了影响建筑垃圾治理的关键因素；蓝华生[4]通过对福州市建筑垃圾资源化利用现状的描述，分析了福州市一些财税政策对提升建筑垃圾资源化利用的影响，明晰政府和企业的职责与作用；王一新[5]运用DEMATEL-ISM-MICMAC法，分析了施工现场建筑垃圾资源化关键的障碍因素；Chen等[6]研究了承包商和政府选择的策略，提出公众参与可有效提高政府的监管率等。

随后，学者们开始对建筑垃圾处理模式进行了完善，认为应转向以政府为主导，提高建筑垃圾处理的过程管理，实现多样化、多元化的管理，促进利益相关者之间的合作[7]。李浩等[8]通过研究发现，中央政府很多部门从不同角度出台了再生建材促进政策，但彼此之间不配套、不衔接及难操作等问题，难以形成培育产业发展的产业政策，需要国家相关部门成立相关委员会，协调各部门形成一个闭合的建筑垃圾再生利用政策链，促进建筑垃圾资源化的产业发展。

因此，本文基于已有研究成果，运用演化博弈理论，建立施工单位，社会资本，政府三方博弈模型，同时引入奖惩制度，分析奖惩制度对建筑垃圾资源化利用的影响以及静态与动态机制下的差异变化。同时构建建筑垃圾资源化利用稳定策略优化模型，通过NSGA-II算法得出内外部因素下的最佳组合方式，从中选择最为合适的方案。

2. 静态补贴机制下模型的构建与求解

2.1. 模型假设

为了提高建筑垃圾的资源化率，建筑垃圾的处理应该落实协同处理体系，作为建筑垃圾资源化的主要参与者，施工单位处理建筑垃圾的方式影响着中国生态环境，因此政府应该对其进行监管，引导以及监督施工单位合法处理建筑垃圾。我国建筑垃圾资源化项目的参与者主要是政府与社会资本，而在资源化项目中，社会资本的主要目标是获取经济利润，而政府的关注焦点则是实现更大的社会和环境效益。为方便研究，做出以下的假设，模型的参数及表达含义，如表1所示。

假设1 施工单位在处理建筑垃圾时采取两种不同的策略。一种为“合法处理”，包括施工单位依法填埋建筑垃圾以及与社会资本合作。在此情况下，施工单位将建筑垃圾运送至社会资本投资的建筑垃圾资源化工厂，由建筑垃圾资源化工厂进行二次利用，生产出再生建材。该策略被采用的概率为 $x (0 \leq x \leq 1)$ 。另一种策略为非法处理，即施工单位将建筑垃圾运输到郊外进行随意填埋或焚烧。此策略被采用的概率为 $1 - x$ 。

假设2 社会资本有两种选择策略，其一是投资建筑垃圾资源化项目(简称“投资资源化项目”)，指投资兴建建筑垃圾资源化工厂，把建筑垃圾作为原材料进行资源化利用，生产再生建材后进行销售，选择生产再生建材的概率为y；其二为投资普通建筑产品项目(简称“投资普通项目”)，指投资普通建筑材料工厂，运用自然资源生产建筑材料，选择生产原生建材的概率为 $1 - y$ 。

Table 1. Model parameters and expression meanings

表1. 模型参数及表达含义

行为主体	参数	表达含义
施工单位	$x$	施工单位合法处理建筑垃圾的概率
	$S_{1}$	施工单位合法处理建筑垃圾给予的补贴
	$E_{1}$	施工单位合法处理建筑垃圾的成本
	$E_{3}$	施工单位非法倾倒建筑垃圾成本
	$R$	施工单位与社会资本合作生产再生建材施工单位获得的社会认可
	$B_{1}$	施工单位的基本收益
	$Δ C$	施工单位与建材企业合作后对建筑垃圾进行分拣所需的成本

续表

建材企业	$y$	社会资本投资建筑垃圾资源化项目的概率
	$B_{2}$	社会资本投资普通建筑产品项目的收益
	$S_{2}$	激励约束政策下政府给予社会资本的研发技术补贴
	$Δ B$	社会资本投资建筑垃圾资源化项目的额外收益
	$C_{2}$	社会资本投资建筑垃圾资源化项目的额外成本
政府	$z$	政府实行建筑垃圾资源化激励约束政策的概率
	$m$	政府对施工单位进行监管，发现非法倾倒建筑垃圾的概率
	$C_{1}$	政府监管施工单位非法倾倒建筑垃圾的监管成本
	$H$	政府从施工单位罚款中作为收益的收益系数
	$E_{2}$	施工单位非法倾倒被发现二次处理成本(罚款以及处理成本)
	$k$	政府对社会资本的惩处力度
	$C_{3}$	施工单位非法倾倒建筑垃圾政府的环境治理成本
	$T$	政府激励政策下政府获得的声望收益
	$a$	社会资本建筑垃圾再生材料利用率
	$a_{0}$	政府规定的资源化利用产品的建筑垃圾再生材料利用率
	$h$	政府获得环境收益系数

假设3 政府有两种选择策略，其一是实行建筑垃圾资源化激励约束政策(简称“实行激励约束政策”)，选择实行的概率为z，其二是不实行建筑垃圾资源化激励约束政策(简称“不实行激励约束政策”)，选择不实行的概率为 $1 - z$ 。

假设4 当施工单位合法处理建筑垃圾，施工单位会获得政府给予的补贴 $(S_{1})$ ，同时施工单位会与社会资本进行联系，询问社会资本是否投资建筑垃圾资源化项目，从而生产再生建材，若回答是，施工单位将建筑垃圾运往社会资本投资的建筑垃圾资源化工厂生产再生建材，再生建材的利用率为 $a (a \in [0, 1])$ ，此时需要对建筑垃圾进行分拣，施工单位需要支付分拣成本 $(Δ C)$ ，而施工单位会获得相关的社会认可 $(R)$ 。

假设5 当施工单位合法处理建筑垃圾，而社会资本投资普通建筑产品项目时，施工单位需要合法处理建筑垃圾，需要支出合法处理建筑垃圾成本 $(E_{1})$ 。

假设6 当施工单位非法处理建筑垃圾，存在一定的概率 $(k)$ 被政府监管部门发现。若被发现，施工单位需要交出相应的罚款，并对建筑垃圾进行二次合法处理 $(E_{2})$ ，同时，政府还需要对施工单位非法倾倒建筑垃圾的环境进行相对应的治理，需要支出环境治理成本 $(C_{3})$ 。

假设7 当社会资本投资建筑垃圾资源化项目时，需要对再生建材生产技术进行研发，这需要其承担相应的技术成本 $(C_{2})$ 。如果施工单位选择非法倾倒建筑垃圾策略，那么资源化项目将失去建筑垃圾这一原材料的来源，无法进行再生建材的生产，因此无法获得再生建材额外收益 $(Δ B)$ 。

假设8 当政府实行激励再生建材政策时，不管施工单位和建材企业选择何种方案，政府都会获得社会认可收益 $(T)$ 。

假设9 设政府的惩处力度为 $k (k > 0)$ ，政府规定的资源化利用产品的再生建材利用率为 $a_{0} (a_{0} > 0)$ ；社会资本投资资源化项目时，未达到政府规定的最低再生建材利用率将受到惩罚 $k (a_{0} - a) (a < a_{0})$ ，当超过规定的最低再生建材利用率时，政府将给予一定奖励 $k (a - a_{0}) (a > a_{0})$ 。政府获得的额外环境收益与再生建材利用率成正比，收益系数为h，环境收益为 $a h$ 。

Table 2. Evolutionary game profit matrix among construction units, social capital, and government

表2. 施工单位、社会资本和政府之间演化博弈收益矩阵

博弈主体		社会资本	政府
博弈主体		实行激励约束政策 $z$	不实行激励约束政策 $1 - z$
施工单位	合法处理 $x$	投资资源化项目 $y$	$\begin{array}{l} B_{1} + R + S_{1} - Δ C, \\ B_{2} + Δ B + S_{2} + k (a - a_{0}) - C_{2}, \\ T + a h - S_{1} - S_{2} - C_{1} - k (a - a_{0}) \end{array}$	$\begin{array}{l} B_{1} + R + S_{1} - Δ C, \\ B_{2} + Δ B - C_{2}, \\ a h - C_{1} - S_{1} \end{array}$
	合法处理 $x$	投资普通项目 $1 - y$	$\begin{array}{l} B_{1} - E_{1} + S_{1}, \\ B_{2}, \\ T - C_{1} - S_{1} \end{array}$	$\begin{array}{l} B_{1} - E_{1} + S_{1}, \\ B_{2}, \\ - C_{1} - S_{1} \end{array}$
	非法处理 $1 - x$	投资资源化项目 $y$	$\begin{array}{l} B_{1} - E_{3} m - E_{2} m, \\ B_{2} + S_{2} - C_{2}, \\ T + H E_{2} m - S_{2} - C_{1} - C_{3} \end{array}$	$\begin{array}{l} B_{1} - E_{3} m - E_{2} m, \\ B_{2} - C_{2}, \\ H E_{2} m - C_{1} - C_{3} \end{array}$
	非法处理 $1 - x$	投资普通项目 $1 - y$	$\begin{array}{l} B_{1} - E_{3} m - E_{2} m, \\ B_{2}, \\ T + H E_{2} m - C_{1} - C_{3} \end{array}$	$\begin{array}{l} B_{1} - E_{3} m - E_{2} m, \\ B_{2}, \\ H m E_{2} - C_{1} - C_{3} \end{array}$

2.2. 模型构建与求解

根据假设，得出施工单位在{合法处理，非法处理}、社会资本在{投资资源化项目，投资普通项目}和政府在{实行激励约束政策，不实行激励约束政策}策略集合下，三方的博弈收益矩阵，如表2所示。

根据演化博弈收益矩阵，计算施工单位、社会资本和政府三方主体的期望收益和平均收益，进而构建各方主体的复制动态方程。

施工单位“合法处理”行为的动态复制方程

施工单位选择“合法处理”的期望收益为 $E_{x 1}$ ：

$\begin{matrix} E_{X 1} = y \times z \times (B_{1} + R + S_{1} - Δ C) + z \times (1 - y) \times (B_{1} - E_{1} + S_{1}) \\ + (1 - y) \times (1 - z) \times (B_{1} - E_{1} + S_{1}) + y \times (1 - z) \times (B_{1} + R + S_{1} - Δ C) \end{matrix}$ (1)

施工单位选择“非法处理”的期望收益为 $E_{x 2}$ ：

$\begin{matrix} E_{x 2} = y \times z \times (B_{1} - E_{3} \times m - E_{2} \times m) + y \times (1 - z) \times (B_{1} - E_{3} \times m - E_{2} \times m) \\ + (1 - y) \times z \times (B_{1} - E_{3} \times m - E_{2} \times m) + (1 - y) \times (1 - z) \times (B_{1} - E_{3} \times m - E_{2} \times m) \end{matrix}$ (2)

施工单位决策的平均期望收益为 $E_{x}$ ：

$E_{x} = x E_{x 1} + (1 - x) E_{x 2}$ (3)

施工单位选择“合法处理”策略的复制动态方程为：

$\begin{matrix} F (x) = \frac{d x}{d t} = x (E_{x 1} - E_{x}) \\ = x \times (1 - x) \times (S_{1} - E_{1} + E_{2} \times m + E_{3} \times m + E_{1} \times y + R \times y - Δ C \times y) \end{matrix}$ (4)

根据演化博弈理论[9]，若x满足 $F (x) = \frac{d x}{d t} = 0$ 和 $\frac{d F (x)}{d x} < 0$ ，则该点为施工单位演化博弈稳定策略点。

同理，可得

社会资本选择“投资资源化项目”策略的复制动态方程为：

$\begin{matrix} F (y) = \frac{d y}{d t} = y (E_{y 1} - E_{y}) \\ = y \times (1 - y) \times (S_{2} \times z - C_{2} + Δ B \times x + a \times k \times x \times z - a_{0} \times k \times x \times z) \end{matrix}$ (5)

若y满足 $F (y) = \frac{d y}{d t} = 0$ 和 $\frac{d F (y)}{d y} < 0$ ，则该点为社会资本演化博弈稳定策略点。

$F (z) = \frac{d z}{d t} = z \times (1 - z) \times [T - S_{2} \times y - k \times (a - a_{0}) \times x \times y]$ (6)

若z满足 $F (z) = \frac{d z}{d t} = 0$ 和 $\frac{d F (z)}{d z} < 0$ ，则该点为政府演化博弈稳定策略点。

2.3. 均衡点的稳定性分析

根据以上分析，可以得到关于施工单位、建材企业和政府的三维复制动态方程系统：

${\begin{cases} F_{x} (x, y, z) = x \times (1 - x) \times (S_{1} - E_{1} + E_{2} m + E_{3} m + E_{1} y + R y - Δ C y) \\ F_{y} (x, y, z) = y \times (1 - y) \times [S_{2} z - C_{2} + Δ B x + (a - a_{0}) k x z] \\ F_{z} (x, y, z) = z \times (1 - z) \times [T - S_{2} y - k (a - a_{0}) x y] \end{cases}$ (7)

由 $F_{x} (x, y, z) = 0$ ， $F_{y} (x, y, z) = 0$ ， $F_{z} (x, y, z) = 0$ 可得系统的8个纯策略均衡点： $E_{1} (0, 0, 0)$ ， $E_{2} (1, 0, 0)$ ， $E_{3} (0, 1, 0)$ ， $E_{4} (0, 0, 1)$ ， $E_{5} (1, 1, 0)$ ， $E_{6} (1, 0, 1)$ ， $E_{7} (0, 1, 1)$ ， $E_{8} (1, 1, 1)$ 。

微分方程系统均衡点的稳定性可由该系统雅可比矩阵的特征值分析得到[10]。该系统的雅可比矩阵为：

$\begin{matrix} J = (\begin{matrix} \frac{\partial F_{x} (x, y, z)}{\partial x} & \frac{\partial F_{x} (x, y, z)}{\partial y} & \frac{\partial F_{x} (x, y, z)}{\partial z} \\ \frac{\partial F_{y} (x, y, z)}{\partial x} & \frac{\partial F_{y} (x, y, z)}{\partial y} & \frac{\partial F_{y} (x, y, z)}{\partial z} \\ \frac{\partial F_{z} (x, y, z)}{\partial x} & \frac{\partial F_{z} (x, y, z)}{\partial y} & \frac{\partial F_{z} (x, y, z)}{\partial z} \end{matrix}) \\ = (\begin{matrix} (1 - 2 x) [E_{3} m - E_{1} + S_{1} + E_{2} m + E_{1} y + R y - Δ C y] & x (1 - x) (E_{1} + R - Δ C) & 0 \\ y (1 - y) [Δ B + (a - a_{0}) k z] & (1 - 2 y) [S_{2} z - C_{2} + Δ B x + (a - a_{0}) k x z] & y (1 - y) [S_{2} + (a - a_{0}) k x] \\ z (1 - z) k (a - a_{0}) y & z (1 - z) [- S_{2} - k (a - a_{0}) x] & (1 - 2 z) [T - S_{2} y - k (a - a_{0}) x y] \end{matrix}) \end{matrix}$ (8)

根据雅可比矩阵的特征值分析法，对演化系统存在的8个纯策略均衡点进行稳定性分析。若所有特征值都少于0，则该均衡点为系统演化稳定策略(ESS) [11] [12]；若至少有一个特征值大于0，则为不稳定点，8个纯策略均衡点的稳定性分析，如表3所示。

Table 3. Stability analysis of pure strategy equilibrium point

表3. 纯策略均衡点的稳定性分析

均衡点	$λ_{1}$	$λ_{2}$	$λ_{3}$	稳定性条件
$E_{1} (0, 0, 0)$	$m E_{3} - E_{1} + S_{1} + E_{2} m$	$- C_{2}$	$T$	不稳定点
$E_{2} (1, 0, 0)$	$E_{1} - m E_{3} - S_{1} - E_{2} m$	$Δ B - C_{2}$	$T$	不稳定点

续表

$E_{3} (0, 1, 0)$	$m E_{3} + R + S_{1} - Δ C + E_{2} m$	$C_{2}$	$T - S_{2}$	不稳定点
$E_{4} (0, 0, 1)$	$m E_{3} - E_{1} + S_{1} + E_{2} m$	$S_{2} - C_{2}$	$- T$	$\begin{array}{l} m E_{3} + E_{2} m < E_{1} - S_{1}, \\ S_{2} < C_{2} \end{array}$
$E_{5} (1, 1, 0)$	$Δ C - R - S_{1} - m E_{3} - E_{2} m$	$C_{2} - Δ B$	$T - S_{2} - k (a - a_{0})$	$\begin{array}{l} Δ C - R - S_{1} < m E_{3} + E_{2} m, \\ C_{2} < Δ B, \\ T < S_{2} + k (a - a_{0}) \end{array}$
$E_{6} (1, 0, 1)$	$E_{1} - m E_{3} - S_{1} - E_{2} m$	$S_{2} - C_{2} + Δ B + k (a - a_{0})$	$- T$	$\begin{array}{l} E_{1} - S_{1} < m E_{3} + E_{2} m, \\ S_{2} + Δ B + k (a - a_{0}) < C_{2} \end{array}$
$E_{7} (0, 1, 1)$	$m E_{3} + R + S_{1} - Δ C + E_{2} m$	$C_{2} - S_{2}$	$S_{2} - T$	$\begin{array}{l} m E_{3} + E_{2} m < Δ C - S_{1} - R, \\ C_{2} < S_{2} \\ S_{2} < T \end{array}$
$E_{8} (1, 1, 1)$	$Δ C - R - S_{1} - m E_{3} - E_{2} m$	$C_{2} - S_{2} - Δ B - k (a - a_{0})$	$S_{2} - T + k (a - a_{0})$	$\begin{array}{l} Δ C - R - S_{1} < m E_{3} + E_{2} m, \\ C_{2} < S_{2} + k (a - a_{0}) + Δ B, \\ S_{2} < T - k (a - a_{0}) \end{array}$

由上述8个均衡点的稳定性可知，利润决定了3个主体的策略选择。根据均衡点的稳定性条件，将建筑垃圾资源化处理分为以下5种情形：

情形1 大多数施工单位往往以利益为主，会根据合法处理建筑垃圾的成本与非法处理建筑垃圾的成本的比较结果，选择成本较低的方式来处理建筑垃圾。当 $m E_{3} + E_{2} m < E_{1} - S_{1}$ ，非法倾倒建筑垃圾与违法倾倒被发现二次处理成本之和少于施工单位合法倾倒建筑垃圾成本，施工单位倾向于“非法处理”。而对于社会资本，当 $S_{2} < C_{2}$ 时，即政府给予建材企业的补贴少于生产再生建材的技术成本时，社会资本更倾向于“投资普通项目”。政府为解决建筑垃圾的问题，将建筑垃圾“变废为宝”，政府开始实行建筑垃圾资源化激励约束政策，此时对应的均衡点是 $(0, 0, 1)$ 。

情形2 当 $E_{1} - S_{1} < m E_{3} + E_{2} m$ 时，施工单位合法倾倒建筑垃圾成本少于非法倾倒建筑垃圾与违法倾倒被发现二次处理成本之和，施工单位倾向于“合法处理”。当 $S_{2} + Δ B + k (a - a_{0}) < C_{2}$ 时，若 $a > a_{0}$ ，资源化项目达到国家规定的建筑垃圾再生材料利用率，政府给予社会资本奖励。若 $a > a_{0}$ ，资源化项目达不到国家规定的再生材料利用率，社会资本会受到政府激励约束政策的惩罚。在政府实行建筑垃圾资源化激励政策的背景下，给予社会资本的补贴、奖惩成本与投资资源化项目的额外收益之和少于生产再生建材的技术成本时，基于利润最大化原则，建材企业偏向于选择“投资普通项目”，此时对应的均衡点是 $(1, 0, 1)$ 。

情形3 政府在实行建筑垃圾资源化激励约束政策的情况下，当 $T < S_{2} + k (a - a_{0})$ 时，给予社会资本的补贴和奖惩成本之和大于政府实行激励约束政策下政府获得的声望收益，此时政府选择的策略是倾向于“不实行激励约束政策”。当施工单位与建材企业选择合作生产再生建材，即 $Δ C - R - S_{1} < m E_{3} + E_{2} m$ ，此时违法倾倒无利可图，施工单位倾向于与社会资本合作，选择“合法处理”。当研发生产再生建材的技术成本小于投资资源化项目的额外收益，即 $C_{2} < Δ B$ ，此时对应的稳定点为(1, 1, 0)。

情形4 若政府出台激励约束政策下获得的声望收益大于给予社会资本的补贴，即： $T > S_{2}$ ，此时政府选择的策略是倾向于“实行激励约束政策”。当生产再生建材的技术成本少于政府给予社会资本的补贴，即 $C_{2} < S_{2}$ ，此时社会资本倾向于“投资资源化项目”。当施工单位违法倾倒建筑垃圾的费用支出少于施工单位与建材企业合作生产再生建材的费用支出，即 $m E_{3} + E_{2} m < Δ C - S_{1} - R$ ，尽管此时资源化项目需要建筑垃圾用于生产再生建材，但施工单位倾向于“非法处理”。此时稳定点为 $(0, 1, 1)$ 。

情形5 如果施工单位与社会资本合作的总利润少于施工单位违法倾倒建筑垃圾的费用支出，即 $Δ C - R - S_{1} < m E_{3} + E_{2} m$ ，施工单位倾向于“合法处理”。给予社会资本的补贴、奖励或惩罚与投资资源化项目的额外收益之和大于生产再生建材的技术成本，即 $C_{2} < S_{2} + Δ B + k (a - a_{0})$ ，社会资本会选择“投资资源化项目”，当政府实行激励约束政策下获得的声望收益大于政府给予社会资本的补贴与奖励，即 $S_{2} + k (a - a_{0}) < T$ ，政府倾向于“实行激励约束政策”，此时对应的稳定点为 $(1, 1, 1)$ 。

3. 动态补贴机制下模型的构建与求解

在前面模型的构建中，政府设置的奖惩制度均设置为常量，称为静态奖惩机制。根据陈婉婷等人[13]研究，引入奖惩机制作为决策变量，对社会资本实施动态奖惩机制，将含有y的函数 $k (y)$ 替换原来的常数k，即：

$k (y) = k (1 - y)$ (9)

根据王一新[14]等人的研究，为保持动态与静态下的奖惩力度保持一致，在函数前乘以未知系数 $e_{1}, e_{2}$ ，即：

$\int_{0}^{1} e k (1 - y) d y = k$ (10)

由式可得： $e = 2$ ，将 $2 k (1 - y)$ 替换静态下政府的惩处力度常量k。政府的惩处力度和社会资本选择“投资资源化项目”的概率y相关，最大值为2k，可以得到动态惩处机制下三者的复制动态方程与纯策略点的稳定性分析，如表4。

$\begin{array}{l} F_{x} (x, y, z) = x \times (1 - x) \times (S_{1} - E_{1} + E_{2} m + E_{3} m + E_{1} y + R y - Δ C y) \\ F_{y} (x, y, z) = y \times (1 - y) \times [S_{2} z - C_{2} + Δ B x + 2 k (1 - y) (a - a_{0}) x z] \\ F_{z} (x, y, z) = z \times (1 - z) \times [T - S_{2} y - 2 k (1 - y) (a - a_{0}) x y] \end{array}$ (11)

Table 4. Stability analysis of pure strategy equilibrium point under dynamic conditions

表4. 动态条件下纯策略均衡点的稳定性分析

均衡点	$λ_{1}$	$λ_{2}$	$λ_{3}$	稳定性条件
$E_{1} (0, 0, 0)$	$m E_{3} - E_{1} + S_{1} + E_{2} m$	$- C_{2}$	$T$	不稳定点
$E_{2} (1, 0, 0)$	$- m E_{3} + E_{1} - E_{2} m - S_{1}$	$- (C_{2} - Δ B)$	$T$	不稳定点
$E_{3} (0, 1, 0)$	$m E_{3} + S_{1} + E_{2} m + R - Δ C$	$C_{2}$	$T - S_{2}$	不稳定点
$E_{4} (0, 0, 1)$	$m E_{3} - E_{1} + S_{1} + E_{2} m$	$- (C_{2} - S_{2})$	$- T$	$\begin{array}{l} m E_{3} + E_{2} m < E_{1} - S_{1}, \\ S_{2} < C_{2} \end{array}$
$E_{5} (1, 1, 0)$	$- m E_{3} - E_{2} m - S_{1} - R + Δ C$	$C_{2} - Δ B$	$T - S_{2}$	$\begin{array}{l} Δ C - R - S_{1} < m E_{3} + m E_{2}, \\ C_{2} < Δ B, \\ T < S_{2} \end{array}$
$E_{6} (1, 0, 1)$	$- m E_{3} - S_{1} + E_{1} - E_{2} m$	$S_{2} - C_{2} + Δ B + 2 k (a - a_{0})$	$- T$	$\begin{array}{l} E_{1} - S_{1} < m E_{3} + E_{2} m, \\ S_{2} + Δ B + 2 k (a - a_{0}) < C_{2} \end{array}$
$E_{7} (0, 1, 1)$	$m E_{3} + S_{1} + E_{2} m + R - Δ C$	$C_{2} - S_{2}$	$S_{2} - T$	$\begin{array}{l} m E_{3} + E_{2} m < Δ C - R - S_{1}, \\ C_{2} < S_{2}, \\ S_{2} < T \end{array}$
$E_{8} (1, 1, 1)$	$- S_{1} - m E_{3} - E_{2} m - R + Δ C$	$- S_{2} + C_{2} - Δ B$	$S_{2} - T$	$\begin{array}{l} Δ C - R - S_{1} < m E_{3} + E_{2} m, \\ C_{2} < Δ B + S_{2}, \\ S_{2} < T \end{array}$

引入动态奖惩机制后，通过对动态与静态下稳定点分析对比，动态奖惩制度对于政府与社会资本的影响较大，对施工单位丝毫没有影响。

进一步地，如果社会资本和政府中只有一方积极参与建筑垃圾的资源化利用，而另一方持消极态度，那么消极一方的稳定条件相较于静态情境将发生变化。这表明动态的奖惩制度能够对消极处理方的稳定性产生积极影响，进而优化整个系统的稳定条件。当三方都积极投身于建筑垃圾资源化处理时，社会资本和政府的稳定条件都会发生积极的改变，使得奖惩成本对系统的影响不再存在，从而进一步提升了系统的稳定性。

4. 演化博弈模型的仿真分析

4.1. 仿真模型构建

本研究采用文献研究的方式，确定各参数的取值。根据有关文献[8] [14] [15]，设定参数的初始值，如表5所示。

Table 5. Parameter initial value

表5. 参数初始值

$S_{1}$	$S_{2}$	$m$	$E_{1}$	$R$	$Δ B$	$C_{2}$	$E_{2}$	$E_{3}$	$T$	$Δ C$	$k$	$a$	$a_{0}$
90	20	0.5	75.4	135	80	50	106.8	16.8	180	135	100	0.7	0.5

根据初始参数始值，探究静态与动态下各初始策略占比对系统演化结果的影响。假设三者策略同比发生变化，运用MATLAB进行仿真分析，得到仿真结果。根据图1可知，无论静态还是动态补贴机制下，系统最终会趋向于均衡点 $(1, 1, 1)$ ，也就是施工单位稳定于“合法处理”策略，社会资本稳定于“投资资源化项目”策略，政府稳定于“实行激励约束政策”策略。随着选择策略的初始比例占比越来越大，该系统收敛速度也越快，证明了初始比例对{合法处理建筑垃圾，投资建筑垃圾资源化利用项目，实行建筑垃圾资源化激励约束政策}策略有较大的影响。

Figure 1. Simulation results of initial strategies under static and dynamic reward and punishment mechanisms

图1. 静态奖惩机制与动态奖惩机制下初始策略仿真结果图

通过对动态与静态下仿真结果的对比，发现在策略组合 $(x, y, z)$ 在动态奖惩机制下，随着初始概率的增加，收敛速度不断提高，且初始概率越高，仿真过程越趋近于静态。图2为策略组合 $(x, y, z)$ 在动态奖惩机制下，初始概率均为0.3的仿真结果二维图。从图2可知，三者选择积极策略的优先顺序为政府、施工单位、社会资本。说明对于建筑垃圾资源化利用，社会资本需要考察相关的政府文件，确定补贴以及奖惩力度，以及与施工单位的合作，保证再生建材的原材料来源的前提下，综合考虑各方面因素，才选择投资资源化项目。

而在小概率的情况下，社会资本出现了极值情况，说明在初始概率小的情况下，建筑垃圾资源化项目虽对社会资本有一定的吸引力，但是资源化项目运营周期长，投资回收较慢等风险使得社会资本对项目还存在一定的顾虑。

Figure 2. Two-dimensional simulation results under dynamic reward and punishment mechanism

图2. 动态奖惩机制下仿真结果二维图

4.2. 外部变量仿真分析

为分析外部变量对系统在动态奖惩机制下演化结果的影响程度，现设置初始策略实施比例均为0.5。将a分别赋值0.9、0.7、0.5、0.3，将动态奖惩机制下复制动态系统仿真演化100次。由图3可知，当资源化项目建筑垃圾再生材料的利用率为0.3，低于政府规定的建筑垃圾再生材料利用率 $(a_{0} = 0.5)$ 时，社会资本因政府的激励约束政策而受到惩罚，但最终系统仍倾向于选择投资资源化项目。这表明，尽管资源化项目的利用率未达到政府对建筑垃圾再生材料利用率的规定，但是建筑垃圾再生建材的额外收益相当可观，使得资源化项目仍然具有盈利空间。因此，即使当前技术尚未达到政府的要求，社会资本仍然选择投资于资源化项目。

将分拣成本 $Δ C$ 分别赋值50、135、200、250。将复制动态系统演化仿真100次。由图4可知，系统整体变化较大， $Δ C$ 对系统的影响程度较大，但系统最终还是收敛于稳定点(1, 1, 1)。由此可看出，随着分拣成本的增加，建筑垃圾的分拣工作将更为精细。为提高分拣速度和效率，可引入先进的精密分拣机器。此举将降低社会资本在资源化项目二次分拣方面的投入，从而推动建筑垃圾再生材料的生产发展，并增强社会资本的合作意愿。

Figure 3. The impact of the utilization rate a of recycled materials from social capital construction waste on the system

图3. 社会资本建筑垃圾再生材料利用率a对系统的影响

Figure 4. The impact of sorting costs $Δ C$ on the system

图4. 分拣成本 $Δ C$ 对系统的影响

5. 稳定策略优化分析

为了在上述演化博弈的稳定策略中获得最优的方案，以社会效益的最大化与资源化项目总成本最小化作为前提条件，现利用多目标优化[16]方法来寻找最佳策略组合。通过这种方式，我们可以确保建筑垃圾资源化利用的合理性和有效性。

基于上文提出的相关参数，建立目标函数。首先将社会效益划分为社会经济效益与社会环境认可效益。社会经济效益为实现建筑垃圾资源化利用后，社会所获得的额外经济效益，社会环境认可效益为进行建筑垃圾资源化利用过后，人们所获得的环境收益以及对资源化项目的认可收益。运用加权法，以社会效益最大化为目标构建目标函数：

$\begin{array}{l} 经济效益 : P_{1} = Δ B \times x \times y \\ 环境认可效益 : P_{2} = R \times x \times y + T \times z + a \times h \times x \times y \end{array}$

$\begin{matrix} P M = P_{1} + P_{2} = Δ B \times x \times y + R \times x \times y + T \times z + a \times h \times x \times y \\ = 80 x y + 135 x y + 180 z + 180 a x y \end{matrix}$ (12)

然后根据施工单位的合法处理成本，社会资本的投资成本以及政府的治理与激励奖惩成本等，运用加权法，以构建实现建筑垃圾资源化项目总成本最小化为目标构建目标函数：

$\begin{array}{l} 施工单位 : G_{1} = E_{1} \times x + x \times Δ C \\ 社会资本 : G_{2} = C_{2} \times y \times x \\ 政府 : G_{3} = S_{1} \times x + S_{2} \times y + C_{1} + k \times (a - a_{0}) \times y \times z \end{array}$

$\begin{matrix} G M = G_{1} + G_{2} + G_{3} \\ = E_{1} \times x + x \times Δ C + C_{2} \times y \times x + S_{1} \times x + S_{2} \times y + C_{1} + k \times (a - a_{0}) \times y \times z \\ = 75.4 x + x Δ C + 50 x y + 90 x z + 20 y z + 10 + k (a - 0.5) y z \end{matrix}$ (13)

结合上述演化博弈模型，模型考虑的约束条件包括施工单位、社会资本和政府的初始策略选择，资源化项目建筑垃圾再生建筑材料利用率a，政府的惩处力度k和施工单位分拣成本 $Δ C$ 。结合实际情况，约束表达式如下：

${\begin{cases} x, x = 0 或 x = 1 \\ y, y = 0 或 y = 1 \\ z, z = 0 或 z = 1 \\ k, 50 \leq k \leq 150 \\ a, 0 \leq a \leq 1 \\ Δ C, 50 \leq Δ C \leq 250 \end{cases}$ (14)

本文构建建筑垃圾资源化利用稳定策略优化模型，运用NSGA-II遗传算法对双目标函数进行求解，该算法同时具有快速非支配排序和精英策略的特性，从而得到Pareto [17]最优解集，再基于Pareto前沿进一步决策。本文使用MATLAB R2022b软件的进化多目标优化平台platEMO进行模型算法的实现。设置基础种群为30，种群迭代次数为2000次。算法所得Pareto前沿面如图5。

要想实现建筑垃圾资源化利用，从这30个种群里面来看，施工单位、社会资本与政府都选择积极处理建筑垃圾的种群数量较多。

如果施工单位选择非法处理系统以实现Pareto最优，那么建筑垃圾再生材料的利用率将为零，这意味着社会资本投资资源化项目将无法实现预期的效益。此外，总项目成本将呈现负数，这表明即使社会资本选择投资资源化项目，他们仍将面临政府的惩罚。因此，这种情况下，社会资本会选择投资普通项目。

如果政府选择不实行激励约束政策，要想达到Pareto最优，需要建筑垃圾再生材料利用率a达到100%，然而，这是系统的理想状态，实际上是无法实现的。因此，政府需要采取激励约束政策来引导社会资本投资资源化项目，以实现建筑垃圾的资源化利用和环境的可持续发展。

通过观察图5，我们发现社会效益与项目总成本之间存在正相关关系。当项目总成本增加时，社会效益也会随之提高。从Pareto最优解集中可以发现，为了获得政府激励约束政策的奖励，社会资本需要确保建筑垃圾再生材料利用率至少达到57%。此时，Pareto最优解集为施工单位、社会资本与政府都选择积极处理组合。相对演化博弈模型，惩处力度k为50.4，建筑垃圾再生材料利用率a为57%，此时社会效益达到497.1，而资源化项目总成本为298.79。

Figure 5. Pareto frontier

图5. Pareto前沿

综上所述，要实现建筑垃圾资源化利用的最大化经济效益和社会效益，需要施工单位、社会资本和政府三方之间的积极合作。通过优化策略选择，可以推动系统向理想状态逼近，并实现Pareto最优解集。

6. 结论与建议

本文针对建筑垃圾资源化利用过程中各主体利益的视角，通过构建三方演化博弈模型、静态与动态奖惩机制下的对比分析，研究结果表明：(1) 相对于静态，动态奖惩机制会对社会资本或政府选择消极处理一方进行优化，而当三方都选择积极处理时，动态机制下的奖惩成本与三方策略选择无关，动态机制下政府的激励约束政策效果更好。(2) 动态与静态机制下，施工单位稳定于“合法处理”策略，社会资本稳定于“投资资源化项目”策略，政府稳定于“实行激励约束政策”策略。然后通过构建建筑垃圾资源化利用稳定策略优化模型，分析得出：(1) 为获得政府奖励，社会资本需要增加研发成本，以提高资源利用效率。(2) 要实现建筑垃圾资源化利用的最大化经济与社会效益，需要施工单位、社会资本和政府三方之间的合作，从Pareto最优解集中策略为 $(1, 1, 1)$ 中选择最符合条件与实际的方案为惩处力度k为50.4，建筑垃圾再生材料利用率a为57%，此时社会效益达到497.1，而资源化项目总成本为298.79。

基金项目

国家自然科学基金资助项目(72001151)，辽宁省社会科学规划基金项目青年(L21CGL023)，辽宁省教育厅高等学校基本科研项目(LJKR0213)，2022年辽宁省哲学社会科学青年人才培养对象委托课题(20221s1qnrcwtkt-48)。

NOTES

^*通讯作者。

参考文献

[1]	赖晓梅, 陈怡, 熊瑶. 奖惩机制下政府与建筑垃圾资源化企业的博弈研究[J]. 湖北理工学院学报(人文社会科学版), 2020, 37(2): 31-35, 71.
[2]	Song, Y., Wang, Y., Liu, F. and Zhang, Y. (2017) Development of a Hybrid Model to Predict Construction and Demolition Waste: China as a Case Study. Waste Management, 59, 350-361. [Google Scholar] [CrossRef] [PubMed]
[3]	Yuan, H. (2017) Barriers and Countermeasures for Managing Construction and Demolition Waste: A Case of Shenzhen in China. Journal of Cleaner Production, 157, 84-93. [Google Scholar] [CrossRef]
[4]	蓝华生. 财税政策对福建省建筑废弃物资源化利用的激励效应研究[J]. 福州大学学报: 哲学社会科学版, 2019, 33(4): 61-65.
[5]	王一新, 薛兰兰, 缑文娟. 施工现场建筑垃圾资源化利用关键障碍因素研究[J]. 干旱区资源与环境, 2023, 37(1): 113-119.
[6]	Chen, J., Hua, C. and Liu, C. (2019) Considerations for Better Construction and Demolition Waste Management: Identifying the Decision Behaviors of Contractors and Government Departments through a Game Theory Decision-Making Model. Journal of Cleaner Production, 212, 190-199. [Google Scholar] [CrossRef]
[7]	邵志国, 李梦笛, 韩传峰, 等. 基于演化博弈的建筑垃圾处理协同机制及仿真[J]. 中国管理科学, 2024, 32(7): 324-334.
[8]	李浩, 翟宝辉. 中国建筑垃圾资源化产业发展研究[J]. 城市发展研究, 2015, 22(3): 119-124.
[9]	Long, H., Liu, H., Li, X. and Chen, L. (2020) An Evolutionary Game Theory Study for Construction and Demolition Waste Recycling Considering Green Development Performance under the Chinese Government’s Reward-Penalty Mechanism. International Journal of Environmental Research and Public Health, 17, Article 6303. [Google Scholar] [CrossRef] [PubMed]
[10]	Friedman, D. (1991) Evolutionary Games in Economics. Econometrica, 59, 637-666. [Google Scholar] [CrossRef]
[11]	Melchor-Aguilar, D. (2004) On the Lyapunov’s Indirect Method for Scalar Differential-Difference Equations. IFAC Proceedings Volumes, 37, 175-180. [Google Scholar] [CrossRef]
[12]	谢识予. 经济博弈论[M]. 上海: 复旦大学出版社, 2002.
[13]	陈婉婷, 胡志华. 奖惩机制下政府监管与制造商回收的演化博弈分析[J]. 软科学, 2019, 33(10): 106-112, 125.
[14]	王一新, 薛兰兰, 缑文娟. 社会资本参与建筑垃圾资源化项目演化博弈分析——基于政府奖惩机制视角[J]. 干旱区资源与环境, 2022, 36(7): 30-37.
[15]	鲁圣鹏, 翟凯. 社会共治下建筑垃圾违法倾倒监管演化博弈研究[J]. 东华理工大学学报(社会科学版), 2022, 41(3): 219-225.
[16]	Gunantara, N. (2018) A Review of Multi-Objective Optimization: Methods and Its Applications. Cogent Engineering, 5, Article 1502242. [Google Scholar] [CrossRef]
[17]	Deb, K. and Gupta, H. (2005) Searching for Robust Pareto-Optimal Solutions in Multi-Objective Optimization. Evolutionary Multi-Criterion Optimization, Guanajuato, 9-11 March 2005, 150-164. [Google Scholar] [CrossRef]

为你推荐

友情链接