1. 引言
教育部提出的新文科建设提倡学科交叉融合,培养复合交叉型人才。在此背景下,政法类本科生的培养创新改革已经进入了攻坚战。随着人工智能时代的到来,先进技术层出不穷,在社会治理中引发矛盾冲突。然而,法学与政治学在定量分析工具上的缺失以及系统性策略思维的不足,使得学生们在面对这些问题时束手无策。《博弈论》作为研究理性主体之间相互行为的科学方法,包含着大量的策略决策思维和定量分析建模方法,它为解决和分析复杂的政治与法律问题提供了强大的定量分析工具,成为新文科建设和提升政法类学生学术素养的关键课程之一。
本课程自从四年前开设以来,经过多轮教学实践,积累了较为完善的教学内容,形成了丰富的实践实训案例库。但教师在教学中发现,其教学内容和方式仍滞后于新文科的内在培养要求,主要体现在以下几点:课程的案例教学过程中,现有博弈案例较为零散,不成体系。教材上主要的博弈案例多以经济类、金融类的背景为主,与政法类学生的专业背景关联度较弱,难以引发学生的学习共鸣。课堂实践环节还主要停留在课堂讨论层面,没有形成一个让学生从问题分析到建模仿真推演,再到实证验证的完整认知闭环。学生们学完后只了解一些博弈理论,却不知道在自己所学专业的问题中如何具体应用。
为了解决这个困境,本研究提出了贯通式的实训教学模式改革。本次教学改革的核心是精心挑选一个来自我国基层治理实践当中的真实案例——公共安全视频监控引发的隐私权和安全保障权之间的博弈。以此作为基础,将其化为一条贯穿博弈课程始终的教学案例主线。在具体的课程教学过程当中,将每章的博弈论核心知识点逐层地嵌入到该案例的分析过程当中。引导学生亲自从社会现象抽象出博弈模型,通过校准模型、策略仿真、模型推演得出结论。最后将真实的新闻后续报道和司法判决书与学生推导出的结论进行印证,形成一套认知闭环。这个创新探索不仅仅能使学生们结合专业背景对博弈论理解更加深刻,还能培养其面向未来法治社会所需要的数字治理思维和实践创新能力,最终为新文科背景下政法类实践实训课程的改革开辟了一条可以借鉴的新路径。
2. 背景与现状分析
2.1. 政法教育中的能力结构性短板
政法类本科生在规范分析、法理阐述、制度解构等方面有良好的学习基础。但是随着人工智能时代的到来,社会治理场景越来越向数字化、智能化转变。公共治理的法律问题在实践中越来越显示出高度的复杂性和系统性。政策效果和司法裁判对多元主体所采取的策略依赖性也越来越强。
在此背景之下,学生们在讨论相关的法治问题时,虽然擅长法理推理和定性分析,但在系统性决策思维和仿真建模等定量分析方面存在明显不足。以公共安全视频监控治理为例,学生们虽然能引用《民法典》和《个人信息保护法》中关于隐私的条款进行论述,但无法对居民、物业、基层政府等多元主体的策略空间、收益函数等进行建模和定量分析。这就导致学生们提出的解决方案往往只停留在法理或理论倡导层面,缺乏对各方行为的预测。因此,在真实的治理场景中,可操作性往往较弱。
2.2. 博弈论教学改革现状
从国内外的博弈论课程教学改革的发展情况来看,博弈论在不同的学科领域的教学改革现状有明显不同。
博弈论课程在经济学与管理学领域已经成为较为成熟的核心课程。例如,学者张燕曾针对经济学专业本科阶段的博弈论课程,剖析其教学过程中存在的问题,倡导构建理论讲授、实验模拟与实践应用有机融合的教学体系[1]。学者赵敬华等则基于“管理博弈”课程,设计涵盖课前、课中与课后三个环节的全过程参与式教学模式,从而在知识传递、能力提升与价值引导方面达成协同育人目标[2]。这些教学改革的成果为经济学和管理学的教学提供了动力,但其改革成果适用范围主要还是经济管理相关专业。
《博弈论》课程在政治学与法学领域的教学改革仍比较滞后。道格拉斯·拜尔等学者在《法律的博弈分析》一书中建立了以博弈论解读法律规则的理论体系,在其中将法律视作一种博弈规则进行了研究[3]。但在国内的具体教学层面,相关的改革案例非常少。主要问题体现在两个方面:第一方面是在实际的教学过程当中所使用的案例仍是经济学中的“囚徒困境、公地悲剧”等传统模型案例,没有和政法类专业学生的知识背景结合;第二方面是在教学过程当中,教材上的案例往往偏重于使用数学工具进行相关的方程求解,没有结合具体的法律实务或公共政策分析,因此无法通过博弈论教学,使得政法类学生在学习中获取相关的解决实务问题的能力。
2.3. 课程改革的基础与转型诉求
本校《博弈论》课程历经四轮教学周期的建设,已在教学资源库、核心内容体系与混合式教学方法上完成了初步积累,为本次深化改革提供了必要的实践基础。课程形成了覆盖完全信息静态博弈、动态博弈、不完全信息博弈及合作博弈等核心概念的理论框架,并配备了相应的案例库与习题系统。
现有的教学模式有两个弊端。一个是教学案例比较零散。每节博弈课程虽然引入了“斯塔克尔伯格模型”等经济管理方面的案例[4],但这些案例与政法类学生的专业背景存在一定的偏差,很难激发起他们利用相关知识进行思考的欲望。另外一个就是,教学内容与国内的基层法治治理实践融合度不高。博弈论作为社会学[5]、经济学、管理学[6]等多学科的交叉领域,在国内法律政策的执行、公共政策的具体落实等方面具有很好的理论基础和应用价值。现有的教学没有高效地引导学生将抽象的博弈模型与中国本土的法治实践相结合。
因此,课程引入了如“公共安全视频治理”的本土综合性法治案例。这不仅是课堂内容更新的要求,也是响应新文科建设的新路径。这对培养现在的法治人才提供了相应的实训和实践机会。这种贯穿课程始终的综合性案例形成的教学经验,可以推广到整个博弈课程的各个环节。
3. 新思路:构建贯通式实训教学框架
通过对本校课程现状的深入研究,《博弈论》课程构建了以贯通式实训为中心线索的改革框架。此框架引入了系统化的教学设计,把分散的博弈论知识点串联成一个有机整体,培养政法类学生运用博弈论的方法来解决法治社会基层治理的难题。
3.1. 理论嵌入贯通始终的实训案例
课程改革的核心是选取“公共安全视频监控治理”案例作为教学载体,将各章节博弈理论嵌入其中。此案例的典型性特征是完整覆盖了博弈论的核心理论:从居民就是否安装监控的初始投票决策(完全信息静态博弈/纳什均衡),到物业巡逻与居民违规的动态策略互动(混合策略纳什均衡),再到基于模糊监控影像的行为推断(不完全信息静态博弈)和政府通过差异化布设监控传递政策信号(信号博弈),最终延伸至社区安全规范的长期演化(演化博弈)以及跨部门数据共享的协调博弈(竞争合作博弈)。此外,案例还通过重复博弈分析长期维护中的“搭便车”问题,并在法律场景中模拟监控取证的策略应用。通过这个主线,将原本孤立的博弈理论和模型整合到统一的分析场景中,这样政法类本科生可以对熟悉背景的问题在不同博弈中的内在联系进行分析,形成从理论到实践的闭环。具体安排可以参考整个学期的实训安排(见表1)。
Table 1. Case schedule of integrated practical training for game theory
表1. 博弈论贯通式实训案例安排表
周次 |
理论
知识点 |
实训案例 |
案例描述 |
治理环节映射 |
第1周 |
博弈论导论与策略式表示 |
1) 社区监控安装的初步决策 |
居民就是否集体出资安装公共监控进行投票。参与者包括业主、物业、居委会;策略包括支持、反对、弃权;收益涉及安全提升、成本、隐私顾虑。 |
案例起点:引入案例核心困境,认识博弈基本要素。 |
第2周 |
完全信息静态博弈/纳什均衡 |
2) 高空抛物责任博弈与监控证据价值 |
构建住户在有监控与无监控场景下的举证责任博弈矩阵,求解纳什均衡,分析监控如何改变策略选择。 |
证据支撑:量化监控在责任认定中的收益(降低举证成本、提高追责概率)。 |
第3周 |
混合策略纳什均衡 |
3) 物业巡逻与居民违规的监控博弈 |
分析物业(巡逻/不巡逻)与居民(合规停车/违规停车)在监控覆盖不全区域的混合策略互动,计算均衡概率。 |
策略互补:分析监控如何影响行为概率。 |
第6周 |
不完全信息静态博弈 |
4) 基于模糊监控影像的行为推断 |
根据公共监控录像,结合先验信念(社区治安状况)和不同证据强度,使用贝叶斯公式更新对嫌疑人行为的后验概率。 |
信息处理:体验在不完全信息下,如何利用监控线索进行理性推断与决策。 |
第7~8周 |
信号博弈 |
5) 公共区域监控布设的信号发送 |
探讨政府部门通过在不同区域差异化布设监控密度,向公众传递治安投入或社会公平信号的博弈过程,分析分离均衡与混同均衡。 |
政策信号:将监控布设本身视为一种政府与公众间的信号博弈,分析其社会效应。 |
第9周 |
重复博弈 |
6) 长期维护中的搭便车博弈 |
模拟社区监控系统长期维护中的资金筹措问题,居民在出资维护与搭便车之间进行重复博弈,设计机制以维持合作。 |
长效机制:分析在长期互动中,如何通过机制设计克服公共品供给的公地悲剧。 |
第10周 |
演化博弈 |
7) 公共安全规范的形成与演化 |
以鹰鸽博弈为框架,模拟在有无监控的不同环境下,居民遵守公序良俗与违规利己两种策略的演化路径,分析监控对行为规范的塑造作用。 |
行为演化:核心贯通环节。动态展示监控环境如何影响群体策略的长期稳定状态。 |
第12周 |
竞争合作综合应用 |
8) 数据共享中的协调博弈 |
模拟不同政府部门在公共监控数据共享与隐私保护之间的协调博弈,设计数据互通协议,平衡安全与权利。 |
协同治理:将问题提升至跨部门协作层面,探讨在更高层次上实现合作均衡的机制。 |
第13~14周 |
法律场景专题 |
9) 监控取证在侵权诉讼中的策略应用 |
分组模拟一起宠物伤人案的诉讼过程,原告与被告围绕一段公共监控录像的证据效力、举证成本、以及和解/诉讼的收益进行动态博弈推演。 |
司法验证:将前期分析的各类收益应用于模拟司法程序,完成从理论到实践的闭环。 |
第15周 |
前沿拓展/行为博弈 |
10) 公众对监控的公平感知与行为反馈 |
引入行为博弈论中的公平偏好,分析居民对监控布设公平性的主观感受如何影响其配合度与遵守规则的行为,修正传统模型。 |
现实复杂化:引入心理与行为因素,使博弈分析更贴近真实社会治理场景的复杂性。 |
3.2. 质性建模的能力培养
在教学实施过程中,本课程特别强调学生建构博弈模型的能力训练。引导学生从复杂的治理情境中准确识别参与主体,包含直接利益相关者与规则制定者等。接着引导学生进行策略空间的界定,帮助他们对各主体可行的行动方案进行系统梳理。最终对收益来源进行探查,让学生识别各方关注的核心价值和相关的权重系数。通过这个训练,可以培养学生的抽象思维能力。让学生在质性建模的过程当中,把社会问题转化为相应的博弈模型。本研究建立了模型中的案例节点与治理节点的知识图谱,直观呈现了质性建模过程中各要素的复杂交互关系(见图1)。
以公共安全视频监控为例,学生需要准确了解居民、物业公司、基层政府等多元主体的利益诉求,并在此基础上准确界定各方的策略选择空间,如居民的配合程度、物业的投入力度、政府的监管强度等,进而构建完整的博弈分析框架。
Figure 1. Integrated practical training modeling map for game theory
图1. 博弈论贯通式实训建模图谱
3.3. 量化分析的工具引入
传统博弈分析中,收益矩阵的参数通常是由理论假设产生。为了更接近社会治理中博弈的真实现象,本课程创新性地引入了“三重收益量化”的方法。这种复合形式的多源数据的印证,为收益矩阵的参数确定提供了可靠的参考。
在具体的案例要素构建过程中,教师会指导学生检索政府采购平台中同类设备的中标价格。例如,通过对2024年上海市政府采购平台相关招标数据的分析,综合评估“人脸识别摄像头及配套云台系统”的采购均价约为每套3.2万元,这为公共安全价值参数的确定提供了较为准确的参考。进一步对全班50名学生采用行为意愿调查的方法,模拟“居民”对隐私偏好的真实评价。调查发现,对个人隐私较为关注的“住户”平均愿意每年支付1200元,用于换取摄像头的角度调整。这为隐私价值的量化分析提供了合理合法的数据参考。课堂上,教师引导学生采集分析中国裁判文书网中的相关判例,结合时间成本对冲突成本进行参数估值。司法案例折价中使用的1.5倍时间成本系数,主要用于演示如何将诉讼时长、机会成本等非货币因素纳入分析框架的教学假设。为直观展示该方法的教学流程,课程设计了标准化的数据采集与映射表,作为学生实训的参考模板(见表2)。在具体教学过程中,教师会指导学生根据表2,分组检索相关数据并完成各自的收益矩阵参数校准。最终,在实训案例中可形成如下图的收益矩阵,用于后续的仿真和模拟验证(见图2)。
Table 2. Teaching example and data mapping table for the “triple benefit quantification method”
表2. “三重收益量化法”教学示例与数据映射表
数据类型 |
数据来源示例 |
教学目的 |
教学应用示例 |
数据类型 |
替代性市场数据 |
政府采购平台(如2024年上海市相关招标信息) |
将中标价作为设备成本的市场参考下限 |
人脸识别摄像头及配套采购均价约3.2万元/套 |
替代性市场数据 |
行为意愿调查 |
课堂模拟问卷 |
通过模拟支付意愿,揭示主观偏好的相对强度 |
对隐私敏感的学生平均愿支付1200元/年换取摄像头角度调整 |
行为意愿调查 |
司法案例折价 |
中国裁判文书网 |
将判决赔偿额与时间成本结合,估算“冲突僵局”的潜在损失 |
参考相关判例赔偿金乘以的时间成本系数为1.5 |
司法案例折价 |
通过量化过程可以提升博弈分析的科学性,训练学生运用实证数据支撑理论研究。“三重收益量化”方法的综合运用,使得实训案例中博弈收益矩阵得到具体校准,而不是随意的对参数值进行假设。这种创新性的方法为质性建模的均衡分析和策略评估提供了更符合社会治理实际的参数。
Figure 2. Visualization of the payoff matrix for the Hawk-Dove game
图2. 鹰鸽博弈收益矩阵可视化
3.4. 仿真与验证的闭环构建
在教学过程中,师生特别注重理论推演和现实世界的信息对接。教师利用讨论课组织了多轮次的分组情境模拟和角色扮演,让学生在高度仿真的环境中体验策略互动。在各小组做出各自的推演结论后,教师在验证阶段会整理出相关真实案例的治理方案以及司法判决作为对比。教师对各组做出的理论预测与现实结果进行一一对照(见图3),针对模型构建能力和批判思维等薄弱环节,引导学生进行反思。通过建构、推演、验证、反思这条路径,深化了学生对理论模型的实际适用范围的理解,也进一步培养了政法类学生的博弈思维和理论创新能力。
Figure 3. Simulation verification capability assessment radar chart
图3. 仿真验证能力评估雷达图
通过“理论嵌入–质性建模–仿真推演–现实验证”的四阶教学框架的设计实施,《博弈论》课程成功实现了从单向知识传授向应用能力培养的转变,使得政法类学生能够更好地应对复杂的治理场景。整个教学框架使学生们既能掌握博弈论核心理论,也能获得将理论应用于实际问题分析的综合能力。
4. 课程实施与评估体系
4.1. 教学中的实训实践
在本课程的具体教学实施过程中,主讲教师让学生利用角色扮演与谈判进行策略仿真。具体来说,先随机将班级同学分为若干小组,每组5~6人分别代表坚持安装的业主、担忧隐私的业主、物业公司经理、社区调解主任、基层司法所工作人员等角色。博弈前,教师将公共信息如《公共安全视频图像信息系统管理条例》、小区平面图等下发给每个同学。课堂上可以组织两轮谈判:第一轮让学生根据已有的公共信息,利用直觉进行博弈推演,体验策略互动的复杂性场面;第二轮则允许各方运用“三重收益量化法”,收集模拟数据作为支撑,进行有理有据的博弈。课后各小组需要合作完成博弈分析报告,具体要求包括:明确模型设定中的三要素;运用“三重收益量化法”对收益矩阵的参数进行赋值,并说明相关的计算过程;将博弈论中的方法引入进行纳什均衡求解,分析其现实背景含义。教师收集并批改报告后,展示上海长宁区等地的身边真实案例报道与法律判决书。引导学生重点反思:现实解决方案与模型预测的均衡是否存在一致性?外部干预如何改变博弈的收益结构?模型在预测现实方案时是否存在不足,是否忽略了重要参与者或低估了非货币收益?
4.2. 实验体系的梯度设计
实验体系的设计是有梯度的。每周的实验既可以个人单独开展,也可以跨周进行分组联合开展。
学期初的实验是作为基础建模与量化分析的个体项目,要求学生独立完成关于“公共安全视频监控初始冲突”的博弈分析报告。具体任务包括通过质性建模分析建立标准的鹰鸽博弈模型,运用三重收益量化法对收益矩阵参数进行评估,最后求解纯策略纳什均衡。此初级梯度的实验可以训练学生掌握博弈建模的基本过程和收益量化的核心方法。
学期中的实验提升至综合推演以及动态分析的分组项目。这个阶段要在基础模型上引入第三方调解力量,将模型扩展为完全信息动态博弈。政法类的学生需要绘制博弈树,进行角色扮演模拟,记录各轮谈判的策略选择和最终协议,并运用逆向归纳法求解子博弈精炼均衡。通过对比理论预测与模拟结果,分析差异产生的原因。此中级梯度的实验可以培养学生处理动态博弈模型的能力。
学期末的实验升华为课程论文形式的综合考核,要求学生综合分析前期实验的内容,并对案例进行从静态到动态的完整博弈建模。最终要将模型推演结果与上海地区的真实治理案例进行详细对比,分析现实方案成功的经验,评估学生所建立模型的预测力与解释力,并根据博弈论视角提出具有更加完善的机制设计或政策优化建议。此高级梯度的实验全面考核学生综合运用博弈论工具的能力及批判性思维水平。
4.3. 过程性评估与综合性评估相结合的多元评价体系
《博弈论》课程建立了过程性评估与综合性评估相结合的多元评价体系。过程性评估占比50%,其中实验报告占30%,主要考察博弈模型构建的严谨性、量化过程的合理性等;课堂模拟表现占20%,重点评估政法类学生在角色扮演过程中显现的策略思维、谈判技巧以及团队协作能力。综合性评估占50%,以课程期末论文形式进行。要求学生根据指定实训案例开展全流程的博弈分析,并特别注重对理论与现实差异的深度反思。这种评估设计既关注学生对理论工具的掌握程度,又强调其解决与专业背景相关的实际问题能力,从而实现对学生的全流程综合评价。
5. 反馈与反思
本课程通过实施贯通式实训教学改革,在提升政法类学生的博弈分析能力方面取得了显著成效。通过校内外专家听课,专家对这种以“公共安全视频监控治理”案例为主线贯穿教学的做法给予了肯定,避免了案例的碎片化。特别是在质性建模、策略推演等闭环的构建上,令人眼前一亮,将政法类的专业特长融入到博弈论的课堂中。通过引入“三重收益量化法”,学生成功地将抽象的矩阵转化为可操作的动手过程,此创新方法为传统文科教学增加了计算思维的元素[7]。
为系统评估教学效果,我们在课程开始时(第2周)和课程结束后(第16周),采用学生自评与提交作业相结合的方式,对学生在“策略思维”“质性建模”“量化分析”“仿真推演”“实证验证”五个维度的能力进行了测评。测评的结果显示,经过一学期的贯通式实训教学,学生在本课程所有维度的能力均有显著提升(见图4)。
另外,教学过程中也暴露出一些值得反思的问题。比如,现有的博弈案例库的广度和深度需要拓展,单一案例虽有利于深度教学,但可能限制学生的比较视野。有些学生在量化分析环节对数据处理方法掌握不扎实,对处理流程采用死记硬背的方法,这反映出跨学科知识掌握薄弱。这些教学实践中的经验与教训,为本课程的后续升级指明了方向。
6. 总结与展望
本研究构建了《博弈论》课程的贯通式实训教学框架。以“公共安全视频监控治理”这个社会治理困境为线索,通过“理论嵌入–质性建模–仿真推演–现实验证”四个教学阶段,培养了政法类本科生
Figure 4. Comparative radar chart of course competency enhancement
图4. 课程能力提升对比雷达图
的博弈策略思维、质性建模能力、量化分析素质。本课程创新性地提出“三重收益量化法”,将替代性市场数据、行为意愿调查以及司法案例折价相结合,为案例中的收益矩阵提供了更贴近现实的参数,这使推演结果具有现实解释力。
本模式在实施中也面临了一些挑战,尤其对教师的跨学科素养与案例掌控的能力要求较高。学生文理背景差异也可能影响量化环节的效果。同时,贯穿性的案例素材需要准备且工作量较大。为了应对这些挑战,我们采取了相应的协作策略。其一,组建了包含法学、数学、计算机背景的教师协同教学团队,并每周定期共同备课。其二,在实验设计中针对同学设置差异化任务选项,并提供第二课堂分类辅导以及每周定时答疑。其三,提前建设标准化的“教学案例资源包”和实验指导书,将优质素材和数据提前固定,大大提升了教学准备的效率。
另外,本研究在教学实践过程中亦发现了一些需要反思的问题。比如单一案例在一定程度上会限制学生对不同领域博弈问题的视野。因此,在后续的课程改革中,将继续引入一些典型公共治理案例(如“高铁霸座维权案”“未成年人打赏案”“政府违约案”等)。同时,引入一些贴近大学生日常校园生活和社会生活的案例。比如在完全信息静态博弈的章节中,增加一个“自习室占座博弈”作为课堂实训案例。在合作博弈的章节,则增加一个“合租公寓押金返还的公平分配”实训案例。通过以上这些微观感知与宏观洞察相结合的贯通式案例建设,将彻底打破原有的博弈案例碎片化和政法学生对案例背景不熟悉的桎梏。另外,在量化分析环节,部分学生对于数据处理方法的掌握不足,对数据分析过程死记硬背。后续的改革之中,我们将升级专业化博弈分析软件为载体的量化分析实训体系。在课程前期的完全信息静态博弈、动态博弈等章节,将重点结合Gambit软件的使用[8],对“自习室占座博弈”等案例利用Gambit软件绘制博弈树与收益矩阵,利用软件进行计算分析和推演,将逆向归纳法等对政法类学生比较抽象的求解过程转化为可视化操作。在课程后期的重复博弈、演化博弈等章节,使用NetLogo仿真软件让学生模拟“共享单车违规停放”群体行为演化[9],发现动态策略的长期趋势,避免了大量的微分方程求解计算。
展望未来,本研究将继续扩展案例库的广度与深度,构建包含多元治理场景的贯通式教学案例体系。进一步利用专业软件强化量化分析技能的系统训练,让政法类本科生较为轻松地进行数据计算,提升学生的实证研究能力[10]。打通与公检法司等实务部门的常态化合作,请来具有职业经历的专家现场指导,以自己的亲身经历现身说法,为学生的职业生涯提供一个桥梁。这些探索将进一步完善新文科背景下博弈论课程的教学体系,提升学生的系统性策略思维与量化分析能力,为培养具备数字法治素养的新时代政法人才提供一种可行的教学改革路径。
基金项目
本项目受上海市哲学社会科学规划课题(项目编号:2021BFX005)资助、2025年华东政法大学校级重点课程《信息博弈论(实践实训)》资助。