1. 引言
社交平台智能推荐技术的应用有效解决了信息超载危机下用户与内容的精准适配问题,但同时也引发推荐内容质量低下、用户隐私泄露、信息窄化、算法歧视等诸多问题 [1] 。近年来,有大量学者和相关部门也关注到此类问题并参与到社交平台推荐内容治理的探讨之中,除了对算法技术、法律制度、算法素养等层面的优化 [2] [3] [4] [5] ,相关学者提出构建社交平台、用户、政府、行业组织等多元主体协同治理体系是治理社交平台推荐内容的一种有效手段 [6] 。
现有研究主要从理论探析、案例剖析以及数学模型的角度来探讨如何对社交平台推荐内容进行协同治理 [7] [8] [9] [10] [11] 。而数理角度方面的研究大多集中在探讨政府监管部门、平台企业与平台用户之间的互动关系 [12] [13] ,但由于“算法黑箱”赋予了平台根据推荐算法服务的优先级而改变算法推荐内容的权力,政府和用户受制于商业机密、代码复杂性、算法素养等影响处于劣势地位,仅靠平台自治、政府监管和用户配合难以实现对推荐内容的全方位监管,因此有学者就指出外部社会力量等第三方主体参与推荐内容治理的必要性与可行性 [14] 。第三方主体指政府认可的具有资质的审核评估机构,可依托自身的人才资源、技术支撑来对平台推荐内容的价值、算法透明度、可选择权等进行评估而获取相关收益,是平衡政府与平台双方利益及治理行动差异的专业性中介力量,并且可以成为法律、算法及用户之间的沟通桥梁,降低各主体之间沟通的信息成本。此外,用户作为推荐内容的直接使用者在协同治理中也有着不可或缺的辅助力量,可通过向政府监管部门投诉举报反馈对社交平台和第三方主体是否履行职责进行监督 [15] 。
社交平台推荐内容生态的治理需要多方主体的共同努力,需要厘清他们在治理过程中的职责和权限,明确他们之间的博弈互动关系及动态演化过程,以便形成合理有效的治理措施。以往研究在理论和政策建议方面可为社交平台推荐内容的协同治理提供参考,但较少考虑到社交平台、政府监管部门、第三方机构和用户四方联动下的动态治理机制,且未融入现实中第三方机构对平台监管职能所具有的作用及其与其他三方之间的互动关系,也缺乏考虑用户群体的辅助作用。鉴于此,本文通过三方演化博弈论,探究基于用户参与治理的“社交平台企业–政府监管部门–第三方机构”三方在治理过程中的行为选择和策略互动,并运用MATLAB软件进行数值模拟探究三者之间的互动机制及主要参数变化对演化博弈系统稳定性的影响效应,以厘清社交平台推荐内容生态环境治理的关键环节,为我国平台推荐内容监管提供理论基础及有益借鉴。
2. 社交平台推荐内容治理的演化博弈模型的构建
2.1. 多方主体在社交平台推荐内容治理中的互动作用
社交平台推荐内容治理过程的主要参与者主要包括了社交平台企业、政府监管部门、第三方机构和用户群体,他们之间的诉求目标各有差异且相互影响,对各个利益相关主体之间的逻辑关系进行深入分析有助于明晰他们之间互相作用的内在机理。
社交平台作为具有舆论属性或者社会动员能力的信息推荐服务与内容的提供者,需在监督下设立具体规则来提高算法的透明度、可解释性与价值平衡 [16] ,并且在国家信息平台上向社会公开涵盖算法应用是否与目的相符及其可能引致的公共利益、公民权利风险的评估信息,但可将涉及商业秘密及专利权的内容排除在外,若是在后续审查过程中发现备案人使用的算法与备案事项不符,相关监管机构有权要求其改正并追责 [4] 。而政府监管部门由于信息的不对称以及评估能力、人才队伍等监管资源的有限,难以全面了解平台推荐服务与内容状态的真实性,可由第三方机构平衡社交平台和政府二者的利益,通过建立相应的推荐内容审核评估准则规范,一方面参与平台不良推荐内容的审查与过滤,另一方面参与评估社交平台推荐服务与内容的价值平衡与透明度水平并与企业备案结果进行对比,第三方机构可为一个由伦理专家、技术专家、法律专家、公众代表组成的算法伦理委员会 [17] 。用户则能通过切身体验到推荐服务与内容赋予的选择权、解释权等以及推送内容的质量,来及时发现社交平台是否与第三方机构有存在合谋篡改评估结果的情况,并向政府监管部门检举反馈。最后政府监管部门根据用户的反馈,向社会公开第三方机构的评估结果,并决定是否对社交平台和第三方机构采取相应的奖励或惩罚措施。由此,在推荐服务与内容价值平衡及透明度管控过程中各方主体之间的互动关系形成。
基于用户参与反馈治理的社交平台、第三方评估机构及政府监管部门三方参与的博弈关系框架如图1所示。
2.2. 模型假设
假设1:假设社交平台、第三方机构与政府监管部门均为限理性的个体,并且不考虑其本身之间的差异性。各参与主体有不同的目标,社交平台和第三方机构以自身的收益最大化为目标,而政府监管部门则以社会整体的利益最大化为目标,并且通过建立用户反馈机制来对社交平台和第三方机构的行为进行有效规制。社交平台的策略选择集合为
(提供高质量推荐服务与内容,提供低质量推荐服务与内容),第三方机构的策略选择集合为
(积极评估,消极评估);政府监管部门的策略选择集合为
(严格监管,宽松监管)。

Figure 1. Relationship diagram of game subjects
图1. 博弈主体关系图
假设2:社交平台选择“提供高质量推荐服务与内容”的概率
,则“提供低质量推荐服务与内容”的概率为
;第三方机构选择“积极评估”的概率为
,选择“消极评估”的概率则为
;政府监管部门选择“严格监管”的概率为
,选择“宽松监管”的概率则为
。
假设3:社交平台的基本收益为
,提供高于备案的推荐服务与内容时,其成本为
,可获得政府财政部门的补贴为
,并且作为具有舆论属性与社会动员能力的平台,提供高质量的服务与内容给政府监管部门带来了社会效益为
;提供低于备案的推荐服务与内容时,其成本为
,此时社交平台会向第三方机构寻求合谋篡改评估数据来通过政府监管部门的审查,以获取流量或政府补贴等其他利益,设寻求合谋的成本为
,此时会产生一系列负面反馈,影响到社交平台的品牌形象和声誉,导致社交平台现有及潜在用户流失损失为
,并且当推荐算法失去了价值平衡且导致用户感知到其被侵犯了权益时,将会影响舆论等信息的流动性与丰富性,最终影响社会稳定和谐发展,给政府监管部门带来了社会效益损失
。
假设4:第三方机构评估的基本报酬为
。若第三方机构采纳“积极评估”策略,积极评估的评估成本为
,此时会拒绝与提供低质量推荐服务与内容的社交平台合谋,并向政府监管部门上交社交平台的寻租成本,社交平台的补贴
因此就会被没收,并会被罚款
;“消极评估”时,对社交平台的推荐算法服务与内容质量相关数据进行随意编造或更改,评估成本为
,此时用户感知到对其信任度会降低,造成的损失为
,接受提供低质量推荐服务与内容的社交平台的寻租,并且政府若处于严格监管状态,会对其进行罚款
且吊销评估资格,并对提供低质量服务与内容的社交平台罚款
。
假设5:政府监管部门采取“严格监管”策略时的监管收益为
,成本为
;采取“宽松监管”策略时监管收益为0,成本为0,但此时上级政府部门会对其进行一定惩罚
,同时若用户感知到被平台侵犯了权益而向政府监管部门举报时,而得到了监管部门的消极反馈,用户会丧失对其信任,即给政府监管部门带来了额外的损失
。
2.3. 模型构建
根据社交平台、第三方机构和政府监管部门的行为策略,可以得出三者之间的博弈组合有八种,即(1提供高质量推荐服务与内容,1积极评估,1严格监管)、(1提供高质量推荐服务与内容,1积极评估,0宽松监管)、(1提供高质量推荐服务与内容,0消极评估,1严格监管)、(1提供高质量推荐服务与内容,0消极评估,0宽松监管)、(0提供低质量推荐服务与内容,1积极评估,1严格监管)、(0提供低质量推荐服务与内容,1积极评估,0宽松监管)、(0提供低质量推荐服务与内容,0消极评估,1严格监管)、(0提供低质量推荐服务与内容,0消极评估,0宽松监管)。基于以上变量和假设,可以得出博弈三方的行为策略组合及各策略组合下的收益矩阵,如表1所示。

Table 1. Behavioral strategy portfolio and its benefit matrix
表1. 行为策略组合及其收益矩阵
3. 社交平台推荐内容治理的演化博弈模型稳定性分析
3.1. 博弈三方的行为策略稳定性分析
3.1.1. 社交平台的行为策略稳定性分析
依据表1的收益矩阵,设社交平台选择采取“提供高质量推荐服务与内容”策略的期望收益为
,选择采取“提供低质量推荐服务与内容”策略的期望收益为
,平均期望收益为
,则有:
(1)
(2)
(3)
社交平台行为策略的复制动态方程为:
(4)
对
一阶求导和设定的
分别为:
(5)
(6)
由微分方程稳定性定理可得知,社交平台选择“提供高质量推荐服务与内容”策略要处于稳定状态必须同时满足两个条件:
与
。又因为
,因此
关于y为增函数。故:当满足
时,
,此时
,社交平台不能确定稳定策略;当
时,
,此时
,
为演化稳定策略,即社交平台会选择“提供低质量推荐服务与内容”策略;当
时,
为演化稳定策略,即社交平台会选择“提供高质量推荐服务与内容”策略。
3.1.2. 第三方机构的行为策略稳定性分析
同理,设第三方机构选择采取“积极评估”策略的期望收益为
,选择采取“消极评估”策略的期望收益为
,并且平均期望收益为
,可得:
(7)
(8)
(9)
第三方机构的行为策略的复制动态方程为:
(10)
对
一阶求导和设定的
分别为:
(11)
(12)
同理根据微分方程稳定性定理,第三方机构选择“积极评估”策略处于稳定状态必须同时满足:
与
。因为
,所以
关于z为增函数。故:当
时,
,此时
,第三方机构不能确定稳定策略;当
时,
,此时
,
为演化稳定策略,即第三方机构会选择采取“消极评估”策略;当
时,
为博弈演化稳定策略,即第三方机构会选择采取“积极评估”策略。
3.1.3. 政府监管部门的行为策略稳定性分析
同理,设政府监管部门选择采取“严格监管”策略的期望收益为
,选择采取“宽松监管”策略的期望收益为
,并且平均期望收益为
,可得:
(13)
(14)
(15)
政府监管部门的行为策略的复制动态方程为:
(16)
对
一阶求导和设定的
分别为:
(17)
(18)
同理由微分方程稳定性定理得,政府监管部门选择采取“严格监管”策略处于稳定状态必须同时满足:
与
。由于
,故
关于y为减函数。因此当
时,
,此时
,政府监管部门不能确定稳定策略;当
时,
,此时
,
为演化稳定策略,政府监管部门会选择采取“严格监管”策略;当
时,
为演化稳定策略,政府监管部门会选择采取“宽松监管”策略。
3.2. 博弈三方演化均衡点的稳定性分析
当复制动态方程满足
,
,
时,整个动态系统趋于稳定,社交平台企业、第三方机构与政府监管部门的策略选择将达到平衡。通过求解可得到8个纯策略纳什均衡点:
、
、
、
、
、
、
和
。另外还可得到6个混合策略纳什均衡点,但由于只有当动力系统的均衡点既为严格纳什均衡又为纯策略纳什均衡策略时,其才是渐近稳定平衡点,故只需讨论8个纯策略纳什均衡点的稳定性 [18] 。并且根据李雅普诺夫稳定性理论可得知,当动力系统的Jacobian矩阵各特征值都为负实数时平衡点趋于稳定 [19] 。因此,此动力系统的Jacobian矩阵如下:
(19)
其中,
,
,
,
,
,
,
,
,
。
将8个纯策略纳什均衡点代入动力系统的式(19)的Jacobian矩阵可得到相应的均衡点特征值,如表2所示。

Table 2. Eigenvalues of eight pure strategy Nash equilibrium points
表2. 8个纯策略纳什均衡点的特征值
本文主要关注社交平台推荐服务与内容的治理策略问题,考虑到结论的普适性,假定
,即政府监管部门的收益一般情况下是大于监管的成本,由此可以得出
、
、
、
这四个均衡点不会是演化稳定策略点,而当参数满足一定条件时,均衡点
、
、
、
可能为系统的稳定点(ESS)。因此,此动力系统4个均衡点及其趋于稳定所需满足的条件如表3所示。

Table 3. Stability conditions of the four equilibrium points
表3. 4个均衡点的稳定性条件
根据表3可以看出,当
时,即当社交平台提供高于备案的推荐服务与内容的成本小于其提供低于备案的推荐服务与内容、寻求合谋的成本以及罚款直接损失与用户流失间接损失之和,第三方机构采纳积极评估的成本小于采纳消极评估的成本以及罚款直接损失与用户感知信任损失之和时,均衡点
所对应的雅可比矩阵的特征值都非正,此时博弈系统只有1个稳定点,该三方博弈系统演化结果最终会处于稳定状态,其他三种情形不再赘述。
4. 仿真分析
为了更加清晰直观地反映社交平台、第三方机构和政府监管部门策略选择的动态演化过程,解析社交平台推荐服务与内容治理机制的影响因素,接下来利用MATLAB软件对博弈三方的策略选择进行数值仿真模拟,并结合中国社交平台推荐信息领域的实际发展状况和等式平衡原则来对涉及参数赋值。为使演化博弈系统稳定在各方积极参与以实现理想中的推荐服务与内容共治格局,即系统收敛在均衡点
处,相关参数设置需满足条件:
和
,最终对各参数赋值为:
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
。
4.1. 不同初始概率对演化博弈系统稳定性的影响
从不同初始策略组合出发随时间演化50次,结果如图2所示。
图2表明在不同演化初始状态下,即使一开始社交平台选择采取“提供高质量推荐服务与内容”策略、第三方机构选择采取“积极评估”策略、政府监管部门选择采取“严格监管”策略的概率均比较低,只要收益、成本、补贴、罚款等其他因素在合适范围内,随着时间的变化,博弈系统唯一演化策略稳定点最终达到(1, 1, 1),即三方主体通过不断调整行为策略会形成(提供高质量推荐服务与内容,积极评估,严格监管)的稳定策略,与上述模型稳定性分析结论相同。因此,以下将设定初始概率为(0.2, 0.2, 0.2),并调整用户、社交平台、第三方机构与政府部门的相关参数,观察较低初始概率下参数变化对演化博弈系统稳定性的影响。
4.2. 相关参数变化对演化博弈系统稳定性的影响
4.2.1. 用户相关参数变化对演化博弈系统稳定性的影响
本部分检验用户对社交平台
、第三方机构
的负面反馈对演化博弈系统稳定性的影响。在其他参数值不变的基础上,分别变更
和
的取值。假设
不同取值为
,
的不同取值为
。假定初始概率为
,通过MATLAB程序分别仿真
、
变化对演化博弈过程和结果的影响,仿真结果如图3所示。图3表明,在演化过程中,随着
增大,社交平台选择采取“提供高质量推荐服务与内容”策略的概率上升,同时第三方机构选择采取“积极评估”策略的概率也在上升;随着
增大,社交平台选择采取“提供高质量推荐服务与内容”策略的概率在下降,而第三方机构选择采取“积极评估”策略的概率上升。这说明,用户对社交平台推荐服务与内容质量作出的负面反馈至关重要,社交平台收到的负面反馈越多,对其声誉损失影响越大,用户的流失与不满将导致平台在市场中失去竞争力,从而能够督促平台提高推荐服务与内容的质量;以及用户对第三方机构的负面反馈越多,第三方机构就越可能迫于压力履行应有的职责。因此,政府可通过丰富激励用户参与反馈的措施、培养用户参与共治的意识、为用户开通各种反馈渠道等方式来监督社交平台及第三方机构以减少其可能存在责任缺失的情况,从而提升社交平台推荐高质量推荐服务与内容。

Figure 3. The influence of user feedback on the stability of the evolutionary game system
图3. 用户反馈对演化博弈系统稳定性的影响
4.2.2. 企业参数变化对演化博弈系统稳定性的影响
本部分重点讨论提供高于备案的推荐服务与内容时的成本
与寻求合谋的成本
如何影响演化博弈系统的稳定性。在其他参数值不变的基础上,分别变更
和
的取值。假设
不同取值为
,
的不同取值为
。为便于比较,同样假定初始概率为
,通过MATLAB程序分别仿真
、
变化对演化博弈结果的影响,其演化结果仿真如图4所示。图4表明,随着
的增大,社交平台选择采取“提供高质量推荐服务与内容”策略的概率在下降,同时第三方机构选择采取“积极评估”策略的概率也在下降;随着
的增大,社交平台选择采取“提供高质量推荐服务与内容”策略的概率在上升,而第三方机构选择采取“积极评估”策略的概率在下降。因此,一方面社交平台可通过借鉴国内外治理平台推荐内容的优秀案例来减少改善平台推荐服务及内容质量的试错成本;另一方面政府可通过提升媒体披露能力、扩大社交平台的声誉影响力,赋予用户更多的权力等方式来增加社交平台寻求合谋的成本,同时可通过建立用户评价体系、制订第三方监督机构及其成员的准入条件或标准等方式避免其积极评估概率下降的可能性。

Figure 4. The impact of enterprise parameter changes on system stability
图4. 企业参数变化对系统稳定性的影响
4.2.3. 第三方机构参数变化对演化博弈系统稳定性的影响
本部分着重探讨第三方机构积极评估的成本
变化如何对演化博弈系统稳定性产生影响。在其他相关参数值不变的基础上,改变
的取值。假设
不同取值为
。同样假定初始概率为
,通过MATLAB程序分别仿真
变化对演化博弈过程和结果的影响,仿真结果如图5所示。图5表明,在演化过程中随着
的增大,第三方机构选择积极评估的概率在下降,社交平台选择提供高质量推荐服务与内容的概率则也在下降。说明在第三方机构采取积极评估方式的成本较高时会降低其采取积极评估方式的积极性和主动性,与此同时社交平台由于缺乏第三方机构的监督选择提供高质量推荐服务与内容的可能性也在降低。因此,可通过帮助第三方机构实施分类监管,一方面鼓励提供高质量推荐服务与内容的平台,处理提供低质量推荐服务与内容的平台,促使中间大部分平台自觉合法经营,另一方面可对不同类别的、不同舆论影响力的内容分类监管等措施,提高人员监管效率,从而降低监管成本。

Figure 5. The impact of parameter changes of third-party institutions on system stability
图5. 第三方机构参数变化对系统稳定性的影响
4.2.4. 政府参数变化对演化博弈系统稳定性的影响
本部分将着重探讨政府部门的补贴
,对社交平台与第三方机构的惩罚
、
以及上级政府对政府监管部门的惩罚
变化情况演化博弈系统稳定性的影响。为便于比较,假定初始概率为
。在其他参数值不变的基础上,分别变更
、
、
、
的取值。假设
不同取值为
,
的不同取值为
,
的不同取值为
,
的不同取值为
。为便于比较,同样假定初始概率为
,通过MATLAB程序分别仿真
、
、
、
变化对演化博弈过程和结果的影响,仿真结果如图6所示。图6表明,在演化过程中随着
的增大,社交平台选择提供高质量推荐服务与内容的概率在上升,第三方机构选择积极评估的概率也在上升;随着
、
的增大,社交平台选择采取“提供高质量推荐服务与内容”策略的概率在下降,同时第三方机构选择采取“积极评估”策略的概率也在下降;随着
的增大,政府监管部门选择采取“严格监管”策略的概率在上升。这些说明,相较于提高对社交平台提供低质量服务与内容及第三方机构接受寻租时的惩罚力度,扩大对于提供高质量推荐服务与内容的社交平台的补贴扶持力度对于提升推荐内容生态的作用更有效,与此同时上级部门适当加大对政府监管部门失职的惩罚力度有助于促进其严格监管。


Figure 6. The impact of parameter changes of government regulatory authorities on system stability
图6. 政府监管部门参数变化对系统稳定性的影响
5. 结论与建议
5.1. 研究结论
社交平台推荐内容治理是多主体参与、多要素协同和多机制并行的一个整体智治过程,需要在政府外部规制和平台自我规制基础上引入第三方评估机构参与监督,并加以用户群体监管的辅助作用。因此,本文针对我国目前社交平台推荐内容的治理问题,创建了用户参与反馈治理基础上的“社交平台企业–政府监管部门–第三方评估机构”的三方博弈模型,得出了以下的结论:1) 鼓励用户参与推荐内容的共治有助于弥补由于第三方评估机构责任缺失带来的损失,从而维持内容推荐生态体系的平衡;2) 加强对于提供高质量推荐服务与内容的社交平台的补贴扶持力度相较于惩罚措施对于提升推荐内容生态的作用更有效。3) 帮助第三方机构实施分类监管有助于降低第三方机构的监管成本从而促进社交平台提供高质量的推荐服务与内容。
5.2. 管理启示
基于上文的讨论及研究结论,可提出如下的建议供社交平台及政府相关部门参考:
首先,政府部门可通过统筹搭建一体化共治信息平台,依托人工智能、大数据等技术,形成一个社交平台推荐内容监管系统。设定政府监管部门、社交平台企业、第三方机构与社交平台用户等不同的用户端口,数据可通过不同的端口来实现多点汇入,并且可以邀请不同主体广泛参与社交平台推荐算法规则的制订。系统可以自动分配不同内容板块的用户反馈信息给各区域部门,再智能匹配给各类领域专家组成的第三方评估机构,而用户不仅可以查阅社交平台企业的备案信息和第三方评估机构的评估信息,还可以通过用户反馈功能提交个人意见及投诉举报。
其次,鼓励用户参与共治有助于弥补由于第三方评估机构责任缺失带来的损失,从而维持内容推荐生态体系的平衡。因此,一方面,社交平台可以优化自身的推荐系统反馈功能来提高用户直接参与平台推荐内容治理的意愿,例如细分满意度反馈的选项及形式,给予用户积分、等级等奖励,在平台内对参与推荐服务与内容质量的评价与反馈这一行为的价值进行宣传;另一方面,政府也可以通过共治信息平台激励用户参与共治,如给予用户线上积分奖励或线下免费服务、实物奖励等,实现线上线下的一体化治理。
最后,政府监管部门应该加强与第三方评估机构之间的合作。一方面,政府监管部门应定期审核第三方评估机构的资质并给予对应的奖励和惩罚,并且用户可通过一体化平台对第三方评估机构的评估结果进行评分;另一方面,鼓励第三方评估机构提升评估技术以及评估人员的综合素质,从而促进第三方评估机构之间的竞争以不断提升评估的制度与质量。
社交平台推荐内容治理是一个动态演化的过程,要统筹整合各方资源,调动社会各界力量,推动形成政府、社交平台企业、第三方评估机构和用户协同共治格局。本文基于用户参与反馈治理的构建了“社交平台企业–政府监管部门–第三方评估机构”的三方演化博弈模型,但还未充分考虑多阶段演化过程以及博弈的顺序,后续将把构建多阶段的动态博弈模型作为下一步的研究方向。