情绪状态对政府与科创主体策略选择的影响研究
Studies on the Impact of Emotional States on Government Strategic Choices and the Subjects of Scientific and Technological Innovation
摘要: 本文以科创领域中联合攻关决策为研究对象,探索情绪对策略选择的影响。基于等级依赖效用(RDEU)理论,构建了政府与科创主体之间的演化博弈模型。模型中政府和科创主体的监管与合作策略受到情绪的影响,并通过RDEU函数进行量化。随后,本文分析了不同情绪组合情形下的演化稳定策略,并设计算例进行仿真模拟。仿真结果表明:情绪波动不仅影响决策稳定性,还会导致策略选择的动态变化。当科创主体情绪乐观时,可能出现“过度合作”现象,导致资源过度投入,而悲观情绪则会抑制合作意愿。进一步分析发现,政府监管力度与创新激励之间存在阈值效应,即适度监管能够促进创新,但超过阈值后的过度监管反而会抑制合作。
Abstract: This study investigates the joint research decision-making in the science and technology innovation (STI) field as the research object and explores the impact of emotions on strategy selection. Based on the Rank-Dependent Expected Utility (RDEU) theory, an evolutionary game model between the government and STI subject is constructed. In the model, the regulatory and cooperative strategies of the government and STI subject are affected by emotions and are quantified through the RDEU function. Subsequently, the paper analyzes the evolutionary stable strategies under different emotional combinations and designs numerical examples for simulation. The simulation results show that emotional fluctuations not only affect the stability of decision-making but also lead to dynamic changes in strategy selection. When STI subjects are optimistic, there may be an “over-cooperation” phenomenon, resulting in excessive resource input, while pessimistic emotions will suppress the willingness to cooperate. Further analysis reveals that there is a threshold effect between government regulatory intensity and innovation incentives, that is, moderate regulation can promote innovation, but excessive regulation beyond the threshold will instead inhibit cooperation.
文章引用:黄梓颖, 张广, 唐靖宜, 李科学, 艾克拍尔·阿布力米提, 付建亭. 情绪状态对政府与科创主体策略选择的影响研究[J]. 运筹与模糊学, 2025, 15(2): 95-110. https://doi.org/10.12677/orf.2025.152067

1. 引言

在全球竞争日趋激烈的背景下,如何通过政府与科创主体的联合攻关实现技术突破成为各国近年来推动经济发展的重要动力,尤其是科技创新已经成为各国政策关注的重要问题。中国政府在《国家创新驱动发展战略纲要》[1]中强调了政府与创新主体合作的重要性,明确提出通过政策引导和资金支持,推动科创共同体发挥创新引擎作用,以应对全球科技竞争的压力。

目前,国内不少地方在结合当地自身优势,以科创共同体为载体,因地制宜地发展特色科创产业和研究平台的同时,也在响应国家政策的号召,大力提升企业与创新的竞争力,打造属于自己特色的新型生产力产业链。如杭州市掀起新一轮“大兴科技、大抓创新”热潮、长三角民间国际科技创新共同体[2]、上海农业科创谷将科创共同体的范围引向全球,为提升国家竞争力、发展新质生产力贡献“上海经验”[3]

然而,在政策支持与实际合作中,如何确保双方的合作效果与利益平衡仍面临诸多挑战,尤其在复杂的博弈关系和情绪波动的影响下,合作决策的优化亟需深入探讨。

对此,王腾等人构建了政府与科研机构行为互动的演化博弈模型,并模拟了影响演化稳定策略的主要因素,综合考虑了我国经费分配机制的变化和经费总量提升对科研机构基础研究行为的影响[4]。研究人员认为,我国目前存在的经费分配机制主要有以下几个方面:张娜从产业集群成员关系的角度探讨了战略性新兴产业集群协同创新战略,构建了战略性新兴产业集群中企业与科研院所创新进化的博弈模型,并以进化博弈理论(Evolution Game Theory)对创新博弈的进化过程进行了分析产业集群成员关系的角度出发[5]。Duan等人基于演化博弈论,构建了政府、产学研绿色创新合作的博弈模型,分析了博弈过程中政府、企业和高校科研方的策略选择,研究了政府、产学研绿色创新合作的稳定性。分析结果表明,违约罚款、超额收入、政府补贴等对绿色创新效益有影响,并在此基础上提出了信息化条件下政府–产学研绿色创新合作的相关政策建议[6]。Nan利用进化博弈理论建立了一个三方博弈模型,包括政府、科技型中小企业、大学和研究机构。在分析三方不同策略组合下各方成本和收益的基础上,导出了演化博弈的稳定策略[7]。Yin等人提出了建筑企业–学术科研院所协同创新(BACI)系统中绿色建筑技术从学术科研院所向建筑企业转移的随机微分对策。考虑一些随机的干扰因素,如外部环境的不确定性和决策者的情绪,将模型分为NASH非合作博弈模型、主从对策主从博弈模型和合作博弈模型,并利用反馈性控制(Difference control)对建筑企业和学术研究机构的平衡策略进行研究和讨论[8]。综合来看,上述文献的研究视角,仅就政府与科创主体在合作中的博弈关系作了性状描述,尽管阐述了科技创新合作事件从政策扶持逐步向监管力度、市场反馈等方面演变的相关影响因素,但对主体决策背后的情绪状态及其对战略选择的动态影响的探讨还不够深入。

近年来,国际学术界对情绪与决策关系的探讨逐渐从个体行为拓展至组织与政策层面。在行为经济学领域,Loewenstein等(2001)提出“风险即情感”理论,强调情绪在风险决策中的核心作用,指出乐观或悲观情绪会显著改变决策者对收益与损失的评估方式,这一结论为情绪影响策略选择提供了心理学基础[9]。Camerer等(2004)通过实验验证了情绪波动对合作博弈的动态影响,发现参与者的情绪状态会通过调整风险偏好间接改变合作均衡点,尤其在非对称信息条件下,情绪对策略稳定性的干扰更为显著[10]

在众多的博弈演化模式中,仅仅将参与者定义为“理性”,在政府与科研企业的博弈中不够严谨,特别是在利益权衡中不能忽视情绪影响。在经济领域相关博弈理论中不够严谨的策略选择中,情绪波动发挥着不容忽视的作用,这一点在政府与科研企业的博弈中不够严谨。因此,需要引入更复杂的博弈模型来分析这种动态、多方参与的合作博弈过程。Quiggin最初提出了等级依赖期望效用(RDEU)理论[11],对EU理论模型的概率线性关系进行非线性扩展,通过构建出非线性决策权重,理论和实证表面这些非线性决策权重可以描绘出决策者在不确定条件下的乐观或悲观情绪及其程度[12]。与传统的游戏模型相比,RDEU既包含了EU理论又克服了EU理论的限制[13]。除此之外,RDEU理论可以灵活应用于静态和动态环境下的博弈分析,尤其适用于探索创新主体在多阶段合作中的行为变化[14],Starmer通过实验证明,RDEU模型可以有效解释乐观与悲观情绪交替时的合作波动[12]。RDEU理论将博弈局中人的情绪因素引入博弈过程中,克服了这种传统期望效用理论无法完全描述经济人对不确定性风险的态度和程度的局限性[15]

因此,基于演化博弈理论对科创共同体中的主体行为研究的适用性和RDEU理论对决策者情绪因素的关注,过去的文献对情绪因素的考虑有所欠缺。结合二者,通过寻求随机情绪状态组合下博弈双方平衡的解决方法,探索主体情绪对其策略选择的具体影响、明确演化机制,进而针对性地提出此类事件的参考建议,构建出科创共同体联合攻关的RDEU进化博弈模型。

针对情绪量化方法,国际研究多依托行为实验与神经经济学工具。Fudenberg等(2015)利用神经影像技术分析决策者情绪状态与策略选择的关联,发现乐观情绪与多巴胺分泌水平呈正相关,进而影响风险承担意愿[16]。此类研究为情绪函数的设计提供了生物学依据,但尚未与博弈理论深度融合。在理论建模方面,Schmidt等(2016)将前景理论(Prospect Theory)引入公共政策博弈,提出“情绪权重函数”以描述政策制定者的损失规避行为,但其模型局限于单方决策分析,未能解决多方动态博弈中的情绪交互问题[17]

相对于以往的研究,本文的创新之处在于:第一,将RDEU理论与演化博弈模型结合,构建了政府与科创主体的非对称情绪博弈框架。通过引入情绪函数,量化乐观与悲观情绪对决策权重的非线性影响,突破了传统模型仅依赖理性假设的局限;第二,揭示了情绪波动与监管力度的阈值效应,仿真结果表明,当政府监管强度超过临界值( C SG )时,乐观情绪下的科创主体可能陷入“过度合作陷阱”,而悲观情绪将加剧策略响应的延迟性;第三,提出“情绪指数”监控与调控机制,将情绪管理纳入创新治理框架,通过仿真模拟,验证了双向情绪干预对策略同步性的提升作用,为政策设计提供了可操作的工具参考。

2. 科创共同体联合攻关的RDEU演化博弈模型构建

2.1. 问题描述

在科创共同体联合攻关中,科创主体作为主要的利益相关者,旨在通过创新和科研成果提升市场竞争力和社会发展。政府作为另一个重要的利益相关者,旨在通过政策引导和支持促进科技创新,推动经济发展和社会稳定。双方主体之间存在着利益依存关系,科创主体需要政府的政策支持和资金投入来实现其研发目标,而政府则依赖科创主体的科研成果来实现经济增长和社会进步的目标。然而,在这种复杂的合作关系中,双方在实现各自利益最大化的过程中往往面临博弈问题。这种博弈不仅涉及合作的深度与广度,还关乎资源分配、政策支持、监管力度等多重因素的协调与平衡。

近年来,情绪状态作为影响决策过程的重要心理因素,逐渐成为影响双方博弈行为的关键变量。对于科创主体来说,乐观的情绪往往使参与方对项目的风险和回报持更为积极的预期,激励其采取更为冒险的合作策略;然而,过度的乐观也可能导致资源分配失衡,甚至引发过度投资,带来不必要的浪费。相反,悲观情绪下,科创主体可能会低估项目的市场前景,从而采取保守的合作方式,减少风险暴露。政府的情绪状态对博弈过程的影响同样不可忽视。在乐观情绪的主导下,政府可能会在政策支持、财政补贴等方面选择更多地放松监管、加大力度,对科创主体的创新项目表现出更大的信心,以鼓励科技创新向纵深发展。然而,在悲观情绪下,政府可能会出于对项目潜在风险的担忧,采取更加严格的监管措施,甚至缩减对相关项目的支持力度。政府和科创主体的合作策略在不同情绪状态下可能出现显著差异,进而对联合攻关的整体效果产生深远影响。

综上,科创共同体联合攻关是一个动态的博弈过程,双方主体需要通过不断的合作和协调来实现利益的最大化。同时还需考虑到情绪状态对决策的潜在影响,这种情绪驱动的策略调整不仅影响合作进程,还可能直接削弱技术创新的效率和效果。因此,情绪状态不仅直接影响政府与科创主体在合作中的决策行为,还通过博弈动态推动合作策略的调整。鉴于此,本文可构建考虑情绪状态下政府与科创主体双方演化博弈主体间的逻辑关系,如图1所示。

Figure 1. Logical relationship diagram of evolutionary game model

1. 演化博弈模型逻辑关系图

2.2. 基本假设与模型

在建立演化博弈模型时,首先需要对博弈各方的决策行为进行建模,即确定各方的效用函数,其体现了各方在博弈过程中的利益目标和价值取向。在科创共同体联合攻关的演进过程中,借助演化博弈中的非对称博弈,以科创主体和政府双方为博弈主体,构建这一事件的基本模型。本模型考虑了科创主体的利润最大化目标,以及政府的科技创新和产业发展目标。作为监督执行和激励提供方,政府通过对科创主体创新研发新产品所获销售收入进行征税获取收益,这种回报在国家税收体系中是可以明确计量的。基于此,需要设定如下假设,以给出各主体的效用函数:

假设1 科创主体由于意见分散,沟通成本过大、缺乏信息资源等主客观因素制约,处于博弈中的相对弱势地位,记为弱势群体A;而政府由于掌握更多的社会资源而被视为优势方,记为强势群体B

假设2 弱势群体在科创共同体联合攻关过程中,可根据自身需求选择全力合作,也可以选择有限合作,其选择策略集合为{全力合作,有限合作},并以p的概率选择全力合作,以 ( 1p ) 的概率选择有限合作, p[ 0,1 ] ;强势群体可选择严格监管和宽松监管,其选择策略集合为{严格监管,宽松监管},并以q的概率选择严格监管,以 ( 1q ) 的概率选择宽松监管, q[ 0,1 ]

假设3 双方博弈过程中,科创主体在采取“全力合作”策略时,通过自己的研发和创新活动所获得的基本经济利益 E C ,在采取“有限合作”策略时获得基本经济收益 E LC 。而科创主体在正常的运营研发过程中会产生基础成本 C C ,当科创主体在采取“全力合作”策略时,会产生额外的合作成本 Δ C C ,但在科创主体采取“全力合作”策略的情况下,政府会提供一定的补贴S来激励科创主体全力合作,且 Δ C C >S 。若政府采取“严格监管”策略时,科创主体因监管要求导致的淹没成本 C LC (包括但不限于不可回收的投入或沉没成本)。

假设4 E G 表示政府的财政收入,当政府采取“严格监管”的策略时,会获得一定的社会效益 E LG ,这种效益包括提升科技创新质量、控制风险、确保研发活动符合国家标准和政策要求等。政府通过严格监管可以实现对市场行为和科创活动的更有效控制,从而推动更高水平的科技成果和社会效益。但同时,政府在严格监管下会产生监管成本 C G ,包括执行政策和监督科创主体的成本。而若科创主体全力合作,政府实施严格监管时,严格的监管成本(例如时间延迟、合规成本)可能抵消合作的收益,从而给双方带来的“反作用力成本” C SG 。当政府采取“宽松监管”策略时,由于监管不严或政策执行不力而产生的放松成本 C LG ,如潜在的失控风险或政策执行的偏差,且 C LG > C G 。符号及设定见表1

Table 1. Symbol settings and instructions

1. 符号设定与说明

符号

含义

E C

科创主体采取“全力合作”策略时,通过自身研发和创新活动获得的基本经济收益

E LC

科创主体采取“有限合作”策略时获得基本经济收益

E G

政府的财政收入

E LG

政府采取“严格监管”策略时,会获得一定的社会效益(包括提升科技创新质量、控制风险、确保研发活动符合国家标准和政策要求等)

C C

科创主体正常运营和研发过程中产生的基础成本

Δ C C

科创主体采取“全力合作”策略时,为实现合作会产生额外的合作成本

C G

政府采取“严格监管”策略时,产生的监管成本

C LG

政府在采取“宽松监管”策略时,由于监管不严或政策执行不力而产生的放松成本

C LC

若政府采取“严格监管”策略时,科创主体因监管要求导致的淹没成本

C SG

若科创主体采取“全力合作”策略时,政府采取了“严格监管”策略,其成本(例如时间延迟、合规成本)可能抵消合作的收益,从而给双方带来的“反作用力成本”

S

政府为激励科创主体全力合作,会提供一定额度的补贴

根据以上假设,可构建非对称博弈基础模型,其收益矩阵如表2所示。

Table 2. The profit matrix of the game subject

2. 博弈主体的收益矩阵

科创主体

政府

严格监管 q

宽松监管 1q

全力合作 p

E C +S C C C LC Δ C C C SG

E C +S C C Δ C C

E G + E LG C G S C SG

E G C LG S

有限合作 1p

E LC C C C LC

E LC C C

E G + E LG C G

E G C LG

2.3. 考虑情绪状态的演化博弈模型

表2可以看出,每个博弈方都有四种可能的收益。如表3所示,科创主体获取相应收益时的概率分布、对应收益的先后顺序以及决策权的轻重,都可以根据RDEU博弈模型得到。如表4所示,政府对应收益时的概率分布、对应收益的先后、决策权的轻重都可以通过同理获得。

Table 3. Probability distribution, rank and decision weight corresponding to the return value of science and technology innovation entities

3. 科创主体收益值对应的概率分布、秩及决策权重

弱势群体 A 收益 x i

概率 p i

τ i

决策权重 W A ( x i )

E C +S C C Δ C C

p( 1q )

1

ω A ( ppq )

E LC C C

( 1p )( 1q )

1p+pq

ω A ( 1q ) ω A ( ppq )

E LC C C C LC

( 1p )q

q

ω A ( 1pq ) ω A ( 1q )

E C +S C C C LC Δ C C C SG

pq

pq

1 ω A ( 1pq )

Table 4. Probability distribution, rank and decision weight corresponding to government income value

4. 政府收益值对应的概率分布、秩及决策权重

强势群体 B 收益 y i

概率 p i

τ i

决策权重 W B ( y i )

E G + E LG C G

( 1p )q

1

ω B ( qpq )

E G C LG

( 1p )( 1q )

1q+pq

ω B ( 1p ) ω B ( qpq )

E G C LG S

( 1q )p

p

ω B ( 1pq ) ω B ( 1p )

E G + E LG C G S C SG

pq

pq

1 ω B ( 1pq )

于是,由表3表4中可得,科创主体对应的RDEU期望效用函数为:

U A ( p,q;ω )=( E C +SΔ C C E LC ) ω A ( ppq )+ C LC ω A ( 1q ) +( E LC +Δ C C + C SG E C S) ω A ( 1pq )+ E C +S C C C LC Δ C C =( E C +SΔ C C E LC ) ( ppq ) r 1 + C LC ( 1q ) r 1 +( E LC +Δ C C + C SG E C S ) ( 1pq ) r 1 + E C +S C C C LC Δ C C (1)

政府对应的RDEU期望效用函数为:

U B ( p,q;ω )=( E LG + C LG C G ) ω B ( qpq )+S ω B ( 1p )+( C G + C SG C LG E LG ) ω B ( 1pq ) + E G + E LG C G S C SG =( E LG + C LG C G ) ( qpq ) r 2 +S ( 1p ) r 2 +( C G + C SG C LG E LG ) ( 1pq ) r 2 + E G + E LG C G S C SG (2)

3. 考虑情绪状态的演化博弈稳定策略分析

根据纳什均衡求解的基本方法,当科创主体和政府双方采用混合策略,即 p,q( 0,1 ) 时,在各方对应的RDEU期望效用函数(1)和(2),分别对pq求偏导的情况下,立即得到:

U A ( p,q;ω ) p = r 1 ( E C +SΔ C C E LC )( 1q ) ( ppq ) r 1 1 r 1 q( E LC +Δ C C + C SG E C S ) ( 1pq ) r 1 1 (3)

U B ( p,q;ω ) q = r 2 ( E LG + C LG C G )( 1p ) ( qpq ) r 2 1 r 2 p( C G + C SG C LG E LG ) ( 1pq ) r 2 1 (4)

令偏导(3)、(4)同时为0,得到科创共同体联合攻关RDEU博弈模型纳什均衡解满足的条件:

( E C +SΔ C C E LC )( 1q ) ( ppq ) r 1 1 q( E LC +Δ C C + C SG E C S ) ( 1pq ) r 1 1 =0 (5)

( E LG + C LG C G )( 1p ) ( qpq ) r 2 1 p( C G + C SG C LG E LG ) ( 1pq ) r 2 1 =0 (6)

由此不难看出,方程组(5)和(6)是一个超越方程组,因而难以求得其解析解。故而本文从以下几种典型情形进行讨论。

情形1:博弈双方均为理性状态

在该情况下,无论是科创主体还是政府都是完全理性的,即 r 1 =1, r 2 =1 。将此代入(5)和(6)式,计算得到科创主体采取全力合作和有限合作的混合策略分别是:

( p,1p )=( E LG + C LG C G C SG ,1 E LG + C LG C G C SG )=( E LG + C LG C G C SG , C SG + C G E LG C LG C SG )

政府采取严格监管和宽松监管的混合策略是:

( q,1q )=( E C +SΔ C C E LC C SG ,1 E C +SΔ C C E LC C SG ) =( E C +SΔ C C E LC C SG , C SG +Δ C C + E LC E C S C SG )

r 1 =1, r 2 =1 的情形下,科创主体A和政府B相应的反应函数分别为:

p={ 1       if q< E C +SΔ C C E LC C SG ( 0,1 ) if q= E C +SΔ C C E LC C SG 0       if q> E C +SΔ C C E LC C SG

q={ 1       if p< E LG + C LG C G C SG ( 0,1 ) if p= E LG + C LG C G C SG 0      if p> E LG + C LG C G C SG

此时,混合策略的纳什均衡为:

( p * , q * )=( E LG + C LG C G C SG , E C +SΔ C C E LC C SG )

这种符合传统博弈理论基本假设的特殊情况下,博弈各方均不带感情色彩。显然,受诸多主客观因素影响,在理性状态下进行的群体矛盾博弈,在现实生活中并不常见。

情形2:一方理性但另一方具有情绪

在现实情境中,政府由于掌握充足的信息、知识和资源调配能力,通常能够在决策中表现出较强的理性。相反,科创主体因受到资源、信息等方面的限制,往往在信息不对称的情况下表现出较为感性的决策特征。因此,可以假设政府是理性的,而科创主体是带有情绪的。

依据科创共同体联合攻关的RDEU博弈模型中情绪函数的特征,可以将科创主体具有的情绪分为“乐观”和“悲观”两种情况进行讨论。

(1) 当科创主体A对后续市场预期持乐观态度,而政府B的行为符合理性假设时。科创主体的情绪指数 r 1 >1 ,即情绪函数 ω A ( p ) 为凸函数,而政府情绪指数 r 1 =1 ,不存在情绪。在现实中,科创主体可以通过提升技术实力、创新能力,加强与市场和资本的联系,以及合理进行预期管理,从而对博弈结果持积极态度。

r 1 趋向于 + ,即科创主体的乐观情绪由有限理性转向非理性状态。在式(5)和(6)中,有 r 1 1+ ,又因为 ppq<1pq ,所以 0<( ppq 1pq )<1 ,则有, ( ppq 1pq ) r 1 1 0 ,即 q0 。于是得到科创主体采取全力合作和有限合作的混合策略为:

( p,1p )=( E LG + C LG C G C SG ,1 E LG + C LG C G C SG )=( E LG + C LG C G C SG , C SG + C G E LG C LG C SG )

而政府采取严格监管和宽松监管策略的概率是:

( q,1q )=( 0,1 )

因此,混合策略纳什均衡为:

( p * , q * )=( E LG + C LG C G C SG ,0 )

(2) 当科创主体A对后续市场预期持悲观态度,政府B的行为符合理性假设时。科创主体的情绪指数 0< r 1 <1 ,即情绪函数 ω A ( p ) 为凹函数,而政府情绪指数 r 1 =1 ,不存在情绪。

r 1 趋向于0,即科创主体的情绪慢慢趋向极度悲观,这也是一种非理性情绪的状态。根据式(11)和(12), r 1 11 ,得到

( ppq 1pq ) 1 =( E LC +Δ C C + C SG E C S E C +SΔ C C E LC )( q 1q )

求解方程,得到科创主体采取全力合作和有限合作的混合策略是:

( p,1p )=( E LG + C LG C G C SG ,1 E LG + C LG C G C SG )=( E LG + C LG C G C SG , C SG + C G E LG C LG C SG )

政府采取严格监管和宽松监管的混合策略是:

( q,1q )=( E C +SΔ C C E LC E LG + C LG C G ,1 E C +SΔ C C E LC E LG + C LG C G )

情形3:双方都具有情绪

在博弈中,博弈各方的决策多多少少都会受到情绪的影响。在 r 1 1, r 2 1 情形之下,科创主体A和政府B相应的反应函数分别为:

p = { 1                                                                                          if q=0 ( ( ( E C +SΔ C C E LC E LC +Δ C C + C SG E C S )( 1 q 1 ) ) 1 r 1 1 ( 1q )+q ) 1  if q( 0,1 ) 0                                                                                         if q=1 (7)

q = { 1                                                                                    if p=0 ( ( ( E LG + C LG C G C G + C SG C LG E LG )( 1 p 1 ) ) 1 r 1 1 ( 1p )+p ) 1 if p( 0,1 ) 0                                                                                   if p=1 (8)

为了研究情绪指数 r 1 r 2 的变化对博弈双方决策影响,在(7)和(8)两式中,我们将 p,q 分别看作为 r 1 , r 2 的函数,可见, p r 1 的影响,记为 p( r 1 ) q r 1 的影响,记为 p( r 2 )

p( r 1 ) p( r 2 ) 求一阶导数,观察函数 p( r 1 ) p( r 2 ) 曲线的变化,从而可了解情绪指数 r 1 , r 2 的不用状态对 p,q 的影响。 p( r 1 ) p( r 2 ) 的一阶导数为式(9)和式(10):

dp( r 1 ) d r 1 = ( 1q )ln[ ( E C +SΔ C C E LC E LC +Δ C C + C SG E C S )( 1 q 1 ) ] [ ( E C +SΔ C C E LC E LC +Δ C C + C SG E C S )( 1 q 1 ) ] 1 r 1 1 ( r 1 1 ) 2 { q+( 1q ) [ ( E C +SΔ C C E LC E LC +Δ C C + C SG E C S )( 1 q 1 ) ] 1 r 1 1 } 2 (9)

dq( r 2 ) d r 2 = ( 1p )ln[ ( E LG + C LG C G C G + C SG C LG E LG )( 1 p 1 ) ] [ ( E LG + C LG C G C G + C SG C LG E LG )( 1 p 1 ) ] 1 r 2 1 ( r 2 1 ) 2 { p+( 1p ) [ ( E LG + C LG C G C G + C SG C LG E LG )( 1 p 1 ) ] 1 r 2 1 } 2 (10)

对于式(9),分母显然是大于0,此外结合博弈收益矩阵中各要素的大小关系可知 E C +SΔ C C E LC E LC +Δ C C + C SG E C S >0 ,所以 dp( r 1 ) d r 1 的正负取决于 ln[ ( E C +SΔ C C E LC E LC +Δ C C + C SG E C S )( 1 q 1 ) ] 的正负,而该对数的正负又取决于 ( E C +SΔ C C E LC E LC +Δ C C + C SG E C S )( 1 q 1 ) 是否大于1。因此,问题转化为判断 q 和参数 E C +SΔ C C E LC C SG 的大小关系,主要有三种情况:

(1) 当 q< E C +SΔ C C E LC C SG 时,在区间 ( 0,1 ) ( 1,+ ) 上有 dp( r 1 ) d r 1 >0 ,此时函数 p( r 1 ) r 1 的增函数。即在政府采取“严格监管”策略的概率小于临界值 E C +SΔ C C E LC C SG ,且越来越小的情况下,即政府采取“宽松监管”策略的可能性逐渐增大之下,随着科创主体越来越乐观,愈发相信科创主体会“宽松监管”,为了获得更多的收益,其选择策略“全力合作”的概率 p( r 1 ) 随之增大。

(2) 当 q> E C +SΔ C C E LC C SG 时,在区间 ( 0,1 ) ( 1,+ ) 上有 dp( r 1 ) d r 1 <0 ,此时函数 p( r 1 ) r 1 的减函数,随着情绪指数 r 1 的增大,其选择策略“全力合作”的概率会减小。

(3) 当 q= E C +SΔ C C E LC C SG 时,在区间 ( 0,1 ) ( 1,+ ) 上有 dp( r 1 ) d r 1 =0 p( r 1 ) 不随着情绪指数 r 1 的变化而变化。此时, q= E C +SΔ C C E LC C SG 是政府B的决策对科创主体A形成影响的分界点,科创主体A根据这个值确定自己的策略。当其认为政府采取某个“策略”的概率为 q= E C +SΔ C C E LC C SG 时,以此概率为参照选择自己对应的策略。

同理,对式(10)可做类似的分析,得到三种结果:

(1) 当 p< C SG E LG + C LG C G 时,在区间 ( 0,1 ) ( 1,+ ) 上有 dq( r 2 ) d r 2 >0 ,此时函数 q( r 2 ) r 2 的增函数。即在科创主体采取“全力合作”策略的概率小于临界值 C SG E LG + C LG C G ,且越来越小的情况下,随着政府越来越乐观,越来越相信科创主体会“全力合作”,为了获得更多的收益、减少支出,其选择策略“严格监管”的概率 q( r 2 ) 随之增大。

(2) 当 p> C SG E LG + C LG C G 时,在区间 ( 0,1 ) ( 1,+ ) 上有 dq( r 2 ) d r 2 <0 ,此时函数 q( r 2 ) r 2 的减函数,即当政府越来越乐观之下,随着情绪指数 r 2 的增大,其选择策略严格监管”的概率会减小。

(3) 当 p= C SG E LG + C LG C G 时,在区间 ( 0,1 ) ( 1,+ ) 上有 dq( r 2 ) d r 2 =0 ,此时函数 q( r 2 ) 不随着情绪指数 r 2 的变化而变化。 p= C SG E LG + C LG C G 是科创主体A的决策对政府B形成影响的分界点,政府B根据这个值确定自己的策略。当其认为科创主体采取某个“策略”的概率为 p= C SG E LG + C LG C G 时,以此概率为参照选择自己对应的策略。

一般而言,在这种情况下,科创主体和政府会根据类似的已经送出的博弈结果而产生乐观或悲观的情绪,并由此影响到作为参考的博弈方的决策。

4. 仿真分析

为了进一步考察模型的性质和实用性,体现情绪在不同情况下对博弈方决策行为的影响,下面通过MATLAB数值模拟不同情况下的影响状况。首先需对科创共同体联合攻关的RDEU博弈模型中各要素的虚拟变量赋予实值。由于科创共同体联合攻关中各主体的具体收益和成本难以精确估量,且缺乏参考数据,因此本文在满足设定条件的基础上,不妨假设 E LG = C LG =4 C G =2 C SG =7 S=3 E C =8 Δ C C =5 E LC =5 ,根据前文博弈收益矩阵中各要素的关系,可得出: p= 6 7 ,q= 1 7

在前面的讨论中,我们已经明确,双方均处于理性状态的情况在现实中并不存在。而对于政府保持理性、科创主体受到悲观或乐观情绪影响的场景,由于相关参数是基于赋值的固定数值,本文不再进行数值分析,仅作为参考。因此,本文接下来将基于假设双方均有情绪的前提,直观展示情绪对博弈双方行为决策的影响,并在MATLAB R2022B环境下进行模拟。

4.1. 科创主体方受自身情绪和对方策略影响的情况

图2可知,当 r 1 ( 0,1 ) ,即科创主体处于悲观情绪中,认为政府选择“严格监管”策略的概率 q 小于 1 7 时,随着 r 1 的不断增加,其选择“全力合作”的概率 p 会不断上升。当“严格监管”策略q的概率越来越小时,p的增长幅度巨大,形成陡峭纵剖面。

Figure 2. Three-dimensional diagram of the decision-making of science and technology innovation subject p is influenced by government decision-making q in pessimistic mood

2. 科创主体决策p在悲观情绪中受政府决策q影响的三维示意图

相反地,从图3可得,当科创主体一旦认为政府选择“严格监管”策略的概率 q 大于 1 7 时, r 1 极小, q 极大,随着情绪指数的提升,科创主体选择“全力合作”的概率 p 会逐渐下降。并且 q 越大, p 下降的幅度也就越大。

而当 r 1 ( 1,+ ) ,即科创主体处于乐观情绪中,这里为了方便读者观察图形,选择区间 ( 1,5 ) 来代替区间 ( 1,+ ) ,两者的变化趋势,完全相同。如图4所示,当 q 小于 1 7 时, p r 1 的提升而增大,且增速较快;当 q 大于 1 7 时, p r 1 的提升而减小。即科创主体获知政府选择“严格监管”的概率不大时,科创主体随着乐观指数增大更倾向于选择“全力合作”策略以争取更大的利益,而当认为政府会大概率选择“严格监管”策略时,乐观状态下的群众会考虑“有限合作”策略来避免由于严格监管带来的不确定性的损失。

Figure 3. Three-dimensional diagram of science and technology innovation subject decision p in pessimistic emotions when the government tends to “strict supervision” strategy

3. 当政府倾向“严格监管”策略时科创主体决策p在悲观情绪中的三维示意图

Figure 4. Three-dimensional diagram of the decision-making of science and technology innovation subject p is influenced by government decision-making q in optimism

4. 科创主体决策p在乐观情绪中受政府决策q影响的三维示意图

4.2. 政府方受自身情绪和对方策略影响的情况

Figure 5. A three-dimensional diagram of government decision q in pessimistic mood, influenced by the decision p of science and technology innovation subject

5. 政府决策q在悲观情绪中,受科创主体决策p影响的三维示意图

Figure 6. Three-dimensional diagram of government decision-making q in pessimistic emotions when science and technology innovation entities tend to “full cooperation” strategy

6. 当科创主体倾向“全力合作”策略时政府决策q在悲观情绪中的三维示意图

图5可知,当 r 2 ( 0,1 ) ,即政府处于悲观情绪中,政府方认为科创主体选择“全力合作”策略的概率 p 小于 6 7 时,随着 r 2 的不断增加,其选择“严格监管”的概率 q 会不断上升;而当“全力合作”策略 p 的概率越来越小时, q 的增长幅度巨大,形成陡峭纵剖面。

图6可知,当科创主体选择“全力合作”策略 p 大于 6 7 ,政府情绪指数 r 2 极小时,即处于极度悲观情绪中,此时选择“严格监管”的概率 q 是极大的。

而当 r 2 ( 1,5 ) 时,即政府处于乐观情绪中,如图7所示,当 p 小于 6 7 时, q r 2 的提升而增大,且增速较快;当 p 大于 6 7 时, q r 2 的提升而明显减小。

Figure 7. A three-dimensional diagram of government decision q in optimism, influenced by the decision p of science and technology innovation subject

7. 政府决策q在乐观情绪中,受科创主体决策p影响的三维示意图

5. 研究结论与政策建议

本研究基于等级依赖期望效用(RDEU)理论,构建了政府与科创主体在情绪影响下的演化博弈模型,通过理论推导与数值仿真揭示了情绪波动对策略选择的动态作用机制。主要结论如下:

(1) 情绪波动对策略稳定性的动态影响:当科创主体或政府的情绪频繁波动时,双方的策略选择更不稳定,导致合作时断时续,影响长期的全力合作。当情绪波动幅度大时,即使在一段时间内保持乐观情绪,最终也可能因突如其来的情绪变化而回归保守或有限合作策略。

(2) 乐观情绪下的过度合作陷阱:在某些情况下,当科创主体处于高度乐观的情绪状态时,易忽略合作的潜在风险,导致研发成本急剧上升,造成资源浪费。

(3) 监管力度与创新激励存在阈值效应:政府的监管力度( C SG )与科创主体的创新合作并非简单的线性关系。适度的监管可以起到正向激励作用,但若监管力度超过阈值( C SG >7 )时,反而会产生“反作用力成本”,即监管过度会抑制创新活力,甚至使科创主体选择有限合作。这种阈值效应在悲观情绪下尤为明显,科创主体的风险规避行为会更加突出。

(4) 合作与监管的延迟响应效应:仿真结果表明,即便一方的情绪状态迅速从悲观转为乐观,另一方的策略调整往往滞后于情绪变化,即双方难以同步调整,合作策略与监管策略的错配常导致博弈过程中的资源浪费和效率低下,需尽量缩短策略响应时间,以避免效率损失。

(5) 情绪调控作为政策工具的潜在价值:具体来说,政府可以通过公开政策声明、提供信息透明度、举办行业会议等方式,正向引导科创主体的乐观情绪,进而促使其选择全力合作策略。

综合以上结论,对科创共同体联合攻关提出如下政策建议:

(1) 构建动态情绪监管联动机制:该机制的核心在于构建多维度情绪指数(Emotion Index, EI),其计算模型整合了多源数据,包括主观调查数据(Likert 5级量表)与客观行为指标(研发投入增长率、合作项目退出率等等),并采用加权算法( EI=0.5×+0.3×+0.2× )实现情绪状态的动态量化。通过机器学习技术(如LSTM神经网络)对历史数据进行训练,系统可实时预测情绪波动趋势,并基于阈值理论设定“红黄绿”三区预警(绿色区: EI70 ,红色区: EI<40 ),触发差异化监管策略。具体而言,在绿色区内,政府可通过减少合规审查频率(如延长审批周期至60天)与开放企业自主申报通道,降低监管成本对创新激励的抑制效应;而在红色区,系统自动激活紧急磋商程序,要求政府于15个工作日内提供定制化政策支持(如临时研发补贴、容错免责条款),以缓解情绪下行压力。

(2) 分级合作风险评估与资源匹配:为破解科创合作中情绪驱动下的资源错配困境,本研究提出一种多维度动态风险评估框架,其核心在于构建“技术–市场–政策”三元风险评价体系,并依托概率–影响矩阵(Probability-Impact Matrix)与蒙特卡洛随机模拟方法实现风险量化。具体而言,技术风险通过技术成熟度等级(TRL)与专利壁垒强度(如专利引用H指数)评估;市场风险基于需求预测偏差率与竞品替代概率建模;政策风险则通过监管敏感度指数(Regulatory Sensitivity Index, RSI)衡量。

(3) 实施差异化监管,缓解阈值效应为避免调控过度抑制科创主体的合作积极性,建议政府实施差别化调控政策。具体而言,政府应根据科创项目的成熟度、市场前景和创新主体的实际能力,设立灵活的监管标准。如对潜力较大的项目,通过设立创新基金、减免税费等方式予以松绑,鼓励通力合作;对存在风险隐患的项目,加大监管力度,确保创新成果安全合规。

(4) 设立情绪调控专项基金,促进策略响应匹配:建议政府设立情绪调控专项基金,用于在关键时刻快速激励科创主体的合作意愿。该基金可用于提供短期的创新补贴或快速响应的政策调整,以应对合作过程中因情绪波动带来的策略错配问题,缩短合作与监管的响应时间,以确保科创主体在情绪上升期迅速获得政策支持,从而提高策略的同步性。

(5) 通过公共宣传与沟通平台,引导科创主体的预期管理:建议政府通过建立公共宣传与沟通平台,增强科创主体的预期管理,及时向科创主体传递政策信号,提供对未来发展方向的正面引导。通过增加信息透明度,政府可以减少市场的不确定性,正向引导创新主体的情绪,避免因信息缺乏或误读而引发的悲观情绪。

(6) 设立情绪管理专项培训,提高决策情绪敏感性:基于研究发现情绪对科创主体与政府决策的深远影响,建议在科创企业的高管与政府相关部门中构建基于认知行为理论(CBT)与演化博弈框架的情绪管理培训体系,涵盖三大核心模块:理论–实践融合课程(Gross情绪调节模型与RDEU博弈案例分析)、工具化决策训练(情绪指数动态解析与蒙特卡洛风险模拟)及分层认证机制(初/中/高级“情绪管理师”考核)。通过多智能体仿真平台生成“监管–合作”动态博弈场景,参训者在模拟实验中需实时调整策略并量化情绪成本,最终通过双重差分法(DID)验证培训效果,从而提高其对自身情绪状态及其影响的敏感度。

本文试图从RDEU进化博弈模型入手,探讨情绪对博弈各方决策行为在科创共同体联合攻关中的影响,并提出了相关建议,提供了一个全新的研究视角,使此类事件的进化机制得以明晰。但在本研究中也存在需进一步深化的地方,如本研究主要探讨了情绪对短期决策的影响,但对情绪在长期合作中的演化机制探讨较少。未来可以构建长期动态模型,探讨情绪在多阶段博弈中的累积效应,以及情绪波动对科创主体长期合作的持续影响。

NOTES

*通讯作者。

参考文献

[1] 国家创新驱动发展战略纲要[M]. 北京: 人民出版社, 2016.
[2] 叶伟. 杭州因地制宜发展新质生产力[N]. 中国高新技术产业导报, 2024-03-25(010).
[3] 鲍筱兰. 上海农业科创谷: 打造世界级农业领域新质生产力[N]. 中国经济导报, 2024-07-25(004).
[4] 王腾, 关忠诚, 郑海军. 国家科研机构基础研究行为的演化博弈分析——基于经费配置视角[J]. 科技管理研究, 2023, 43(10): 8-19.
[5] 张娜, 李波. 基于演化博弈的战略性新兴产业集群共生技术协同创新研究[J]. 科技管理研究, 2019, 39(10): 146-154.
[6] Duan, Z., Zhu, W. and Bai, D. (2021) Analysis on Green Innovation Cooperation of Government, Industry, University and Research Institute from the Perspective of Evolutionary Game under the Conditions of Informationization. E3S Web of Conferences, 253, Article No. 03016.
https://doi.org/10.1051/e3sconf/202125303016
[7] Nan, G., Wei, J. and Hu, H. (2019) Analysis of the Multi-Agent’s Relationship in Collaborative Innovation Network for Science and Technology SEMs Based on Evolutionary Game Theory. International Journal of Information Technology and Management, 18, 1-15.
https://doi.org/10.1504/ijitm.2019.097881
[8] Yin, S. and Li, B. (2018) Transferring Green Building Technologies from Academic Research Institutes to Building Enterprises in the Development of Urban Green Building: A Stochastic Differential Game Approach. Sustainable Cities and Society, 39, 631-638.
https://doi.org/10.1016/j.scs.2018.03.025
[9] Loewenstein, G.F., Weber, E.U., Hsee, C.K. and Welch, N. (2001) Risk as Feelings. Psychological Bulletin, 127, 267-286.
https://doi.org/10.1037/0033-2909.127.2.267
[10] Camerer, C.F., Loewenstein, G. and Prelec, D. (2004) Neuroeconomics: Why Economics Needs Brains. The Scandinavian Journal of Economics, 106, 555-579.
https://doi.org/10.1111/j.0347-0520.2004.00377.x
[11] Quiggin, J. (1982) A Theory of Anticipated Utility. Journal of Economic Behavior & Organization, 3, 323-343.
https://doi.org/10.1016/0167-2681(82)90008-7
[12] Starmer, C. (2000) Developments in Non-Expected Utility Theory: The Hunt for a Descriptive Theory of Choice under Risk. Journal of Economic Literature, 38, 332-382.
https://doi.org/10.1257/jel.38.2.332
[13] 熊国强, 张婷, 王海涛. 情绪影响下群体性冲突的RDEU博弈模型分析[J]. 中国管理科学, 2015, 23(9): 162-170.
[14] Wakker, P.P. (2010) Prospect Theory: For Risk and Ambiguity. Cambridge University Press.
https://doi.org/10.1017/cbo9780511779329
[15] 龙希, 江海潮. 非期望效用理论下的监督博弈模型分析[J]. 中国集体经济, 2011(7): 100-101.
[16] Fudenberg, D. and Levine, D.K. (2015) Learning and Equilibrium. Annual Review of Economics, 7, 385-420.
https://doi.org/10.1146/annurev.economics.050708.142930
[17] Schmidt, U., Starmer, C. and Sugden, R. (2016) Third-Generation Prospect Theory. Journal of Risk and Uncertainty, 52, 129-145.