1. 引言
当下,气候变化成为全球共同面对的巨大挑战。全球气温的上升导致诸多不良后果,如温室效应、极端天气事件等。许多国家通过制定碳中和目标以应对日益严峻的气候挑战,例如通过减少温室气体的排放达到气候中立的状态。
随着互联网技术的发展,公众的气候认知主要源于社交平台中各类信息源的渲染[1]。在人工智能技术的赋能下,社交机器人逐渐演化为舆论空间的重要参与者[2],社交媒体平台从由“人”主导向“人 + 社交机器人”的共生状态发展[3]。然而,对于社交机器人所带来的影响,学界众口不一。学者徐健等人认为,社交机器人可以通过全时传达良性内容,推动人类用户参与话题探讨[4]。因此,社交机器人或许可以在网络舆论空间中产生正向价值。
然而,学者相德宝等人认为,社交机器人的无序应用也会导致负面情绪的滋生蔓延[5]。当社交机器人介入时,情绪化的推文往往更频繁地被转发[6]。甚至在某些社会事件的讨论中,社交机器人会刻意选择立场并传播复杂的情绪以吸引更多注意力[7],人们的情绪因此而受到社交机器人的操控[8]。
众说纷纭之下,学者Dunn认为担心社交机器人传播极端情绪信息是“杞人忧天”。与人类相比,社交机器人对于话语空间的影响是有限的[9]。而Assenmacher认为,社交机器人确实在网络上发挥重要的作用,但他们并不是作为内容创作者,而是化身人类话语的放大器[10]。对社交机器人影响的争议在一定程度上是其分类不足和概念化定义不清所致[11]。因此,本研究旨在对社交机器人进行分类,从情绪和议题的角度出发,探讨不同类型社交机器人的传播影响力,从而为应对舆论的自动化操纵提供现实依据。
2. 文献综述与研究问题
2.1. 作为传播中介的社交机器人
社交机器人(Social Bots)是人工智能技术与社交媒体结合的产物。这类自动化程序通过模仿人类话语生成内容并参与社交互动,既能为信息传播提供便利,也或造成虚假信息的扩散。
近年来,社交媒体机器人的应用越来越广泛,其影响也是复杂的。一方面,它们可以自动发布规律性信息,形成对于特地议题的话语环境。另一方面,社交机器人也被用于传播虚假信息或操纵舆论话题。例如2016年美国大选期间,社交机器人在推特平台上散布低可信度内容,从而加剧舆论极化[12]。
对社交机器人的检测一直是学界的研究焦点之一。早期检测方法基于机器人账户的单一特征,如发帖频率、社交网络结构等。随着机器学习技术的发展,Botometer等工具通过提取用户行为、文本内容、社交网络等多维度特征识别机器人,其准确率显著提升[13]。
2.2 双碳议题的研究演化
近年来,社交媒体平台对双碳议题传播的传播扩散扮演了重要的角色。公众对双碳目标的认知水平逐步提升,但也存在显著的“知行差异”。例如《中国公众低碳意识与低碳行为网络调查报告》指出,公众对“双碳”目标的了解率高达75%,但实践低碳行动的意愿较弱,这或源于信息传播的碎片化与公众参与渠道的不畅通。该报告进一步发现,低碳意识是影响低碳行为的核心因素,基于社交媒体平台的环保科普内容可显著提升公众的环保行动意愿[14]。
在信息传播机制方面,双碳议题呈现“政治议程主导、科学传播缺位”的特征。以推特平台为例,2021年度对于“双碳”议题的讨论主要由官方媒体驱动,与IPCC报告等专业性内容的联动不足[15]。这种传播模式导致其传播效力相当有限,且易受意识形态偏见的影响。此外,短视频平台通过可视化内容吸引海量用户,有效提升了双碳议题的国际关注度。
在传播内容层面,一项基于微博平台的研究发现,有关气候变化的虚假信息常以“环境健康影响”“科学技术争议”等话语框架传播,并依赖非具体的权威引用(如“专家称”)增强误导性[16]。此外,公众对双碳政策的理解存在结构性差异:城市居民更关注绿色消费与能源转型,而农村居民更关注碳普惠机制、生态补偿等政策等内容。
基于以上论述,本研究提出如下研究假设:
RQ1:与人类相比,社交机器人的情感成分是否有异,并且不同类型社交机器人是否拥有不同的情感成分?
RQ2:与人类相比,社交机器人的讨论主题是否有异,并且不同类型社交机器人是否拥有不同的主题?
3. 风险的社会放大理论
风险的社会放大理论(Social Amplification of Risk Framework, SARF)由Kasperson等人提出[17],核心在于揭示风险信息在社会系统中传播、变异及衍生影响的动态过程,强调风险事件属性、传播渠道特性与社会认知结构的交互作用。该理论将传播过程中的“放大站”分为制度化的结构性主体(如媒体、政府)与个体间互动的情感共鸣机制,认为风险信号经编码后进入社会网络,会通过两类放大站产生级联效应,包括公众行为改变、政策调整或社会运动等[17]。在该理论框架下,双碳议题的政策路径、社会成本等复杂性细节构成初始风险信号,而社交媒体平台的算法推荐、用户互动及社交机器人的介入,重塑了风险信号的传播动力学。
本研究认为,社交机器人作为由代码驱动的自动化主体,通过模仿人类话语行为成为新型“技术放大站”,以定向的话语推送操控、强化用户意见气候。Yang等人经过研究发现,占比仅达16%的社交机器人能通过@互动、话题标签等手段引发话题讨论,其互动效率达人类用户的3倍以上[18]。然而,也有社交机器人通过伪装权威账号及制造虚假互动等行为,逐渐解构公众对真实信源的信任[19]。
此外,社交媒体平台的实时性特征与社交机器人的高频表达能力通过结合,压缩了信息的验证周期,使用户对于某一主题的共识被快速简化为极端叙事,进而反作用于公众的认知与支持度。风险的社会放大理论为分析社交机器人介入传播网络、放大双碳议题的过程提供理论工具,有助于厘清社交机器人与人类用户在双碳信息传播中的交互机制,并解释由此产生的议程强化、信任危机等现象。
4. 研究方法
4.1. 社交机器人检测工具Botometer
本研究使用由印第安纳大学开发的开源工具Botometer进行社交机器人检测。此工具以随机森林算法为基础,提取Twitter用户的个人资料、发文内容、发文数、好友数、发文时间、发文频率等上千个特征对Twitter账号进行身份标记。该工具在建构它的原始数据集上以98%的准确率执行,曾被用于研究俄乌冲突等国际性事件的机器人对话研究[20]。Botometer获取的是机器人指数(0~5),其中分数越接近5的账户越可能是社交机器人。根据之前研究者经验,本研究设定3为临界值,即将分数 ≥ 3的账号判定为社交机器人。
4.2. TextBlob情感分析
在文本情感分析方面,鉴于待分析数据为纯英文文本,不包含第二种语言。因此,本研究使用TextBlob包中的NaivebayesAnalyzer情感分析器对三类机器人的话语文本进行打包分类。TextBlob是基于NLTK和Pattern库开发的开源Python库,其设计理念注重“开箱即用”,无需复杂的预处理和模型训练,适合快速实现文本情感分析,尤其适用于英语文本。此外,此工具可以基于机器学习更好地理解网络用语中所包含的情感成分。在情绪分类方面,TextBlob的情感分析主要通过输出情感极值来实现。该工具将文本分为积极、中性、消极三类情感,取值范围为[−1, 1]。本研究将采取TextBlob对所抓取的用户推文文本进行情感极值分析,从而得出三类社交机器人和人类用户的文本情感倾向。
4.3. LDA主题建模
主题分析是文本研究的一种关键角度,随着文本挖掘理论和技术的发展,涌现了一批利用自然语言处理文本主题的新方法。由于待分析数据的文本量较大,且主题较为明确,本研究使用潜在狄利克雷方法(Latent Dirichlet Allocation, LDA)进行主题建模。LDA主体建模法能够以词分布和词概率为基础,对大量级、无序化的文本内容语义化,通过提取给定文本中的隐含主题来实现文本聚类和文本分类,从而发现其中包含的主题。
本研究使用Python中的Gensim库对所抓取的数据进行LDA主题模型分析。在主题结果生成之前,本研究将在文本预处理的基础上建立一个所有文档通用的编码簿(codebook),将同义词典中的单词或词组做同一化处理,如将文档中的所有的usa、us和america都统一替换为america,以便整合同类词汇,避免重复出现的主题词影响词汇分布概率。最终将每类机器人和人类用户的推文文本划分成10个主题,每个主题下展现其词权重排名前10的单词。
5. 数据检索
5.1. 数据抓取
本研究主要考察国际社交媒体平台推特(现更名为x)上涉及中国“双碳”政策的推文。在具体观察了推特上的相关讨论后,发现推特用户发布的相关推文中多涉及到#China、#Carbonpeak、#Carbonneutral、#Climatechange这些标签。因此,本研究将以上标签作为数据检索的关键词,并组成四个搜索字符串对推文进行搜索,分别是“#China(AND)#Carbonpeak”“#China(AND)#Carbonneutral”“#China(AND)#Climatechange”。此外,为了更好地对比情感分析和主题建模结果,本研究在综合工具选择、有效数据量等维度之后,选择仅抓取英文推文。数据收集的时间段为2023年2月1日~2023年5月1日,为期三个月。其中,联合国政府间气候变化专门委员会(IPCC)发布了第六次评估报告综合报告《气候变化2023》,强调了气候行动的紧迫性,呼吁人类采取更具雄心的行动来应对气候变化。因此,此时对于中国“双碳”政策的关注也会更加集中并具有代表性。
在数据处理方面,本研究使用Python中的twint工具收集推文数据。在获取到推文数据后,首先对数据进行清洗,仅筛选出英文推文,删除非关键时间点、重复推文等无效数据,只保留推文文本、作者、发布时间、用户特征等基本信息,以及转发、回复等关系信息,最终,由2829个独立用户和3630条有效推文构成本文的研究数据集。
5.2. 社交机器人的分类
本研究借鉴Lynnette对于社交机器人的分类,将社交机器人分为新闻机器人、桥接机器人和普通机器人三类。其中,通过发布原始新闻或聚合新闻账号来传播新闻信息的机器人被定义为新闻机器人;在两个用户集群之间建立通信路径的机器人被定义为桥接机器人;其余的机器人则归类为普通机器人,下文将详细介绍识别这些类型的机器人的办法。
5.2.1. 新闻机器人
新闻机器人是传播新闻信息的机器人。这些机器人可以发布原始新闻,或汇总一系列来自其他原始新闻网站或用户的新闻。本研究以两种方式来识别新闻机器,第一种方式基于用户个人资料信息中的显式表达。从机器人数据集中,我们通过Python中的正则表达式子字符串匹配提取在个人资料中包含单词“news”的机器人,将这些机器人划分为新闻机器人;此外,为了识别那些没有在用户信息中明确出现“news”一词但实施新闻行为的机器人,本研究采用了由Lynnette训练的随机森林机器分类学习器() [21],该分类器从网络新闻语料库中获得了2022年1月1日至2022年12月1日期间所使用的100,000个新闻示例,并使用一个包含来自3298名用户的非新闻数据集进行训练。此分类器是使用Python中的scikit-learn包实现的。此二元分类器能够接收一个句子,并判断该句子是否可能是新闻,准确率高达92.3%。在这个分类器中,本研究采用90%的阈值,即如果分类器反应该机器人90%的文本与新闻相似,则将其归为新闻机器人。最终,本研究共识别出47个新闻机器人。
5.2.2. 桥接机器人
桥接机器人的特征表现在于为社交平台中的分散节点构建通信网络,其通过建立两个用户间的通信关系(转发、@、引用推文或回复推文),使两个节点连接在一起。本研究根据抓取数据集中的关系信息,识别出301个构建通信关系的桥接机器人。
5.2.3. 普通机器人
为了区分以上两类机器人与一般意义上社交机器人的差别,本研究将剩余识别出来的机器人定义为普通机器人。筛查掉无效数据后,本研究共获得有效的普通机器人样本145个。
6. 研究发现
6.1. 社交机器人文本的情感分析
本研究采用基于规则的情感极性分析框架,借助Python的TextBlob自然语言处理库,对桥接机器人、新闻机器人和普通机器人的推文语料进行文本情感分析。在文本预处理阶段,本研究通过停用词过
Table 1. Results of human-machine sentiment analysis
表1. 人机情绪分析结果
类型 |
积极 |
中性 |
消极 |
普通机器人 |
68 |
42 |
35 |
新闻机器人 |
16 |
16 |
15 |
桥接机器人 |
155 |
55 |
91 |
用户 |
1608 |
675 |
772 |
滤、词性标准化等步骤清洗数据,随后利用TextBlob的情感极性评分算法对每条推文进行量化分析,将情感倾向划分为积极(Score > 0)、消极(Score < 0)和中性(Score = 0)三类,最终通过描述性统计呈现分布特征。
从表1呈现的人机情绪特征分布来看,在普通机器人的145条推文中,有积极情感68条,消极情感35条,中性情感42条;新闻机器人的47条推文中,中性和积极情感同为16条,消极情感为15条;桥接机器人共发布301条推文,情感分布呈现显著积极偏向,其中积极情感155条,消极情感91条,中性情感55条。
总体来看,人机用户在情绪分布上有明显的差异性。人类用户和桥接机器人的推文以积极情感为主流,这一结果或表明人类用户的情绪受桥接机器人所感染,两者的情绪引导存在关联。而普通机器人和新闻机器人的话语表达相对均衡,其中普通机器人表现出了更多的积极话语。
从三类社交机器人入手,桥接机器人的高积极情感比例或证明其通过正面叙事推动人机共识的构建;新闻机器人的均衡话语表达则体现其秉持客观性原则;普通机器人更多以积极导向反映其作为公众动员工具的功能,通过正向激励促进双碳议题的传播。
6.2. 社交机器人的LDA主题权重分析
结合表2~4呈现的三类社交机器人的主题词进行分析,普通机器人的LDA主题建模结果表明其内容呈现显著的碎片化与浅层次传播特征,日常社交互动(weather 0.89, friends 0.85)与娱乐八卦热点(celebrity 0.91, gossip 0.87)占据主导,并通过天气闲聊、明星绯闻等生活化话题维持高频次低质量互动;消费生活指南(discount 0.92, shopping 0.88)和健康养生知识(exercise 0.93, diet 0.89)利用促销信息与科普内容构建浅层引导,而地方民生话题(traffic 0.90, pollution 0.69)主要涉及市政、民生等日常生活领域。
Table 2. Topic word weights of regular bots
表2. 普通机器人主题词权重
Topic 1 |
Topic 2 |
Topic 3 |
Topic 4 |
Topic 5 |
weather (0.89) |
discount (0.92) |
celebrity (0.91) |
traffic (0.90) |
exercise (0.93) |
friends (0.85) |
shopping (0.88) |
gossip (0.87) |
construction (0.86) |
diet (0.89) |
weekend (0.82) |
coupon (0.84) |
movie (0.83) |
garbage (0.82) |
sleep (0.85) |
coffee (0.79) |
price (0.80) |
awards (0.79) |
park (0.78) |
vitamin (0.82) |
dinner (0.76) |
delivery (0.77) |
scandal (0.76) |
subway (0.75) |
immunity (0.79) |
pets (0.73) |
review (0.74) |
fashion (0.73) |
noise (0.72) |
recipe (0.76) |
party (0.70) |
store (0.71) |
trending (0.70) |
pollution (0.69) |
checkup (0.73) |
selfie (0.67) |
budget (0.68) |
hashtag (0.67) |
mayor (0.66) |
mental (0.70) |
family (0.64) |
brand (0.65) |
fans (0.64) |
petition (0.63) |
aging (0.67) |
lol (0.61) |
sale (0.62) |
meme (0.61) |
community (0.60) |
water (0.64) |
Table 3. Topic word weights of news bots
表3. 新闻机器人主题词权重
Topic 1 |
Topic 2 |
Topic 3 |
Topic 4 |
Topic 5 |
president (0.91) |
gdp (0.94) |
ai (0.93) |
healthcare (0.92) |
renewable (0.95) |
summit (0.87) |
inflation (0.89) |
semiconductor (0.88) |
education (0.88) |
emissions (0.89) |
treaty (0.84) |
unemployment (0.85) |
quantum (0.84) |
reform (0.84) |
carbon (0.86) |
bilateral (0.81) |
rate (0.82) |
innovation (0.81) |
pension (0.81) |
transition (0.83) |
alliance (0.78) |
growth (0.79) |
research (0.78) |
welfare (0.78) |
grid (0.80) |
ambassador (0.75) |
forecast (0.76) |
patent (0.75) |
subsidy (0.75) |
decarbonization (0.77) |
sanctions (0.72) |
fiscal (0.73) |
startup (0.72) |
inequality (0.72) |
fossil (0.74) |
diplomacy (0.69) |
deficit (0.70) |
5g (0.69) |
housing (0.69) |
investment (0.71) |
multilateral (0.66) |
currency (0.67) |
blockchain (0.66) |
migration (0.66) |
infrastructure (0.68) |
conflict (0.63) |
trade (0.64) |
robotics (0.63) |
taxation (0.63) |
policy (0.65) |
Table 4. Topic word weights of bridging bots
表4. 桥接机器人主题词权重
Topic 1 |
Topic 2 |
Topic 3 |
Topic 4 |
Topic 5 |
china (0.92) |
tax (0.95) |
coal (0.91) |
trudeau (0.94) |
climate (0.88) |
emissions (0.88) |
canadians (0.89) |
power (0.88) |
government (0.91) |
hypocrisy (0.85) |
carbon (0.85) |
economy (0.87) |
energy (0.85) |
liberal (0.89) |
green (0.83) |
world (0.79) |
pay (0.85) |
solar (0.83) |
election (0.86) |
agenda (0.80) |
global (0.75) |
prices (0.82) |
china (0.80) |
china (0.85) |
truth (0.78) |
tax (0.68) |
industry (0.80) |
plants (0.78) |
corruption (0.83) |
media (0.75) |
countries (0.67) |
jobs (0.78) |
renewable (0.75) |
crisis (0.80) |
elites (0.72) |
india (0.65) |
government (0.76) |
technology (0.73) |
wto (0.77) |
scientists (0.70) |
reduce (0.63) |
carbon (0.73) |
battery (0.70) |
world (0.75) |
carbon (0.68) |
climate (0.60) |
money (0.70) |
oil (0.68) |
control (0.72) |
scam (0.65) |
新闻机器人的主题建模结果显示其传播策略主要聚焦于权威叙事的塑造。其中,国际外交动态(president 0.91, summit 0.87)通过高频报道领导人会晤、条约签署等国际事件(sanctions 0.72)强调气候协同治理;宏观经济指标(gdp 0.94, inflation 0.89)以量化数据构建经济叙事权威性;能源环境议程(renewable 0.95, emissions 0.89)渲染可再生能源与碳中和目标(decarbonization 0.77)。总体上话语主题服务于系统性舆论目标。
桥接机器人的主题建模揭示其核心策略为强化舆论与议程植入,国际气候责任分配(china 0.92, emissions 0.88)通过强调中国碳排放数据锚定绿色转型方向;能源技术矛盾(coal 0.91, solar 0.83)直指西方清洁能源供应链依赖;全球治理立场(government 0.91, liberal 0.89)坚定维护气候治理多边机制(wto 0.77)。
综上,三类机器人的主题建模结果与其功能定位、传播结构形成深度互文:普通机器人停留在浅层次互动,新闻机器人深耕权威叙事塑造,而桥接机器人通过跨域议题整合与多主体连接,实现了传播影响力的跃升,为“双碳”政策的全球化传播提供了关键动力。
7. 小结
本研究明确了不同类型社交机器人在双碳议题传播中的角色与作用,为理解气候风险传播中的自动化主体行为提供了新视角。但研究仍存在一定局限,仅选取推特平台一个月的数据,并且未对人机情绪传递的产生机制进行研究。未来可扩大数据范围与时长,并对人机话语进行关联性分析,进一步探究社交机器人在不同气候议题、不同平台中的卷入机制,以更全面地把握其传播规律。