1. 引言
近些年,随着ChatGPT爆火,人工智能(Artificial Intelligence,以下简称AI)再次走入大众视野,在网络上掀起一股讨论AI将如何影响人类生产力的话题热潮。事实上,AI的应用场景远不止聊天机器人,其为农业、医疗、教育、能源、国防等诸多领域提供了大量新的发展机遇[1]。AI的范畴还在不断演变,但其核心目标始终未变,即通过研究和应用,实现(人类)智能行为的自动化或模拟[2]。我们已经在特定应用领域的专用人工智能(Narrow AI)方面取得了长足进步,包括机器翻译、自动驾驶和图像识别等;通用人工智能(Artificial General Intelligence,AGI)是指在所有认知任务上展现出与人类相当甚至更高智能水平的人工智能系统——实现通用人工智能可能还需要数十年的时间[2]。目前大多数人工智能系统都依赖于机器学习(Machine Learning),这是一种通过在大量数据集上训练人工智能模型来实现的、基于统计推理的学习技术[3]。该领域最近在生成式人工智能(generative AI)工具上取得突出进展,这些工具就包括ChatGPT,Gemini等在内的大型语言模型[3]。
《纽约时报》是一份在美国纽约出版的日报,作为高级报纸、严肃刊物的代表,长期以来拥有良好的公信力和权威性,从2009年4月起开始停止出版纸质日报,代之以网络版。The Verge是一家美国科技媒体网站,成立于2011年。本文将选取这两家媒体网站上有关AI的报道进行分析,从中管窥美国媒体对AI的态度。
2. 文献回顾
评价理论由Martin和White [4]等人提出并完善,该理论补充发展了系统功能语言学在人际意义方面的研究,推动了批评话语分析的发展。评价理论由态度、介入、级差三个子系统组成,态度子系统标注文本中带有情感评价的词汇,介入子系统则是识别文本中的声音来源,级差子系统表示程度的分级。此外,态度系统往往与其余系统有着紧密联系。介入系统可以区分态度的来源,而级差则反映了情感的深浅以及纯粹与否。可以说,只要有态度,就有级差[5]。根据应用需求,态度子系统可以做进一步分层,包括情感(Affect)、判定(Judgement)和鉴别(Appreciation) [6]。情感即人的情感的表达,判定是对人的行为的评判,鉴别则是对事物的评价。评价理论创立之初,就是为语篇分析提供理论支撑,因此在评价理论引入国内后,话语分析的相关研究最多,其中又以对英语新闻语篇中评价资源的研究论文数量较多,主要包含对国外报纸英语新闻以及电视访谈话语的评价资源的研究[7]。从时间上来看,2004年只有一篇《新闻话语的评价系统》探讨了新闻话语中的评价资源[8];此后每年均有一定数量论文产出,2013年起,该领域逐渐引起研究者兴趣,相关论文每年产出均超过20篇。研究人员选取新闻语篇主要参考了《中国日报》和《纽约时报》。
3. 研究方法
本文采用定量和定性相结合的方法,分析2020~2024年间,《纽约时报》和The Verge网站上关于AI的十篇报道中态度资源的分布,比较二者对待AI技术的态度,借以分析美媒对AI的态度倾向,希望解决如下两个研究问题:(1) 近年来(2020年以来),以《纽约时报》和The Verge为例的美国媒体有关AI技术的报道中态度资源的分布特征是什么,二者有何区别?(2) 通过定性分析,美国媒体对AI技术的态度倾向是什么?
3.1. 理论框架
本文旨在研究媒体对于AI的态度,因此基于Martin和White(2005)的态度子系统,加入态度极性(Polarity)和作者声音来源(Explicitness)构建框架进行研究,内容见图1。
Figure 1. Diagram of attitudinal system
图1. 态度系统
态度子系统中,情感描述评价者的主观感情,比如高兴、满意;判定反映评价者对被评价者(人)的看法,涉及社会尊严(social esteem)和社会规范(social norm)两方面;鉴别是评价者对被评价者(事物)的价值评价,包括对事物的反应(reaction),事物的组成(composition)和社会价值(valuation)。态度子系统中的每一层级,都存在极性区分,即正向的积极评价、负面的消极评价和中立的模糊评价。除极性外,评价系统还有“声音来源”这一维度,即评价者在评价时是否援引他人的话语。以上,构成本研究的理论框架。
3.2. 语料来源
本文分析的语篇取自《纽约时报》(https://www.nytimes.com/)和The Verge (https://www.theverge.com/),各取五篇关于AI技术的报道,总计10,612词。《纽约时报》是美国纽约出版、全世界发行的老牌日报,风格严肃端正,在美国本土以及海外影响力广泛。The Verge则是一家新近成立的美国科技媒体网站,聚焦科技领域,风格华丽多样,是科技网站的代表之一。本文选取两家媒体,新旧结合,取长补短,借以管窥美国媒体态度。语料均来自两家媒体的新闻网站,所选语篇通过限定词检索,并综合考量语篇长度和每篇报道底部评论(Comments)数目敲定,以确保语料的相关性和代表性。语料详细信息见表1。
Table 1. Source of texts
表1. 语料来源
来源 |
发布时间 |
排序 |
《纽约时报》 |
2020年 |
You can’t spell ceative without A.I. |
2021年 |
A.I. Here, There, Everywhere. |
2022年 |
An A.I.-Generated Picture Won an Art Prize. Artists Aren’t Happy. |
2023年 |
Inside the A.I. Arms Race That Changed Silicon Valley Forever. |
2024年 |
Robots Learn, Chatbots Visualize: How 2024 Will Be A.I.’s ‘Leap Forward.’ |
The Verge |
2020年 |
A.I. Artificial Intelligence shows us a future where we neglect to dream. |
2021年 |
Artificial intelligence research continues to grow as China overtakes US in AI journal citations. |
2022年 |
ChatGPT proves AI is finally mainstream — and things are only going to get weirder. |
2023年 |
I went to paradise to see the future of AI, and I’m more confused than ever. |
2024年 |
Artificial investment. |
3.3. 数据处理
本文运用UAM Corpus Tool 6辅助标注。该软件面向对象进行语料标注,界面友好,内嵌有评价系统、及物性系统等框架,使用者可以根据研究需要调整理论框架。现阶段UAM语料库工具无法自动标注评价词汇,但可以自动标注重复性字段。UAM Corpus Tool 6支持文档编码(Document Coding)和片段编码(Segment Coding),本文采用片段编码。
4. 结果与讨论
相较于试验条件下的文本,直接采集的数据往往更能反映真实情况[9]。因此,本文首先对十篇标注后的语料进行总体分析,研究两家媒体态度资源的总体分布情况,然后进行比较分析,验证比较的结果是否耦合总体特征,最后进行定性分析,并结合人工智能流派分类,归纳这两家媒体对AI技术的态度倾向。
4.1. 态度资源总体分析
总体来看,选取文本的态度资源以鉴别(Appreciation)为主(见表2)。在鉴别资源下,又以社会价值(social-valuation)最多,这表明语篇作者在评价AI技术及相关话题时,对AI的社会价值较为关注。在情感(Affect)资源下,涉及(不)高兴、(不)满意的情感表达最多,这说明比起关注AI技术的安全性(security)问题,语篇作者更在意这项技术能否让人开心、令人满意,这一点在判定(Judgement)资源的分布上也有体现。本文标注语料时,考虑到语篇作者有时会将AI拟人化,对其行为进行评价,因而本文将这类情形归为判定资源范畴。而在判定资源下,社会尊严(social esteem)占比远超社会规范(social sanction),这就表明语篇作者注重评判AI技术是否常规,是否有能力、有韧性,而对AI技术的道德属性采取回避,进一步印证了前面所述语篇作者重实用,轻风险。
Table 2. Overall distribution of attitudinal resources
表2. 态度资源总体分布
态度 |
子类别 |
数目 |
百分比(%) |
总计 |
情感 |
高兴/不高兴un/happiness |
13 |
6.6 |
34 (17.2%) |
满意/不满意dis/satisfaction |
13 |
6.6 |
安全/不安全in/security |
6 |
3 |
愿意/不愿意dis/inclination |
2 |
1 |
判定 |
社会尊严social esteem |
24 |
12.1 |
36 (18.2%) |
社会规范social sanction |
12 |
6.1 |
鉴别 |
反应reaction |
29 |
14.6 |
128 (64.6%) |
组成composition |
30 |
15.2 |
社会价值social-valuation |
69 |
34.8 |
总计 |
|
198 |
100 |
|
4.2. 态度资源比较分析
基于态度系统对文本进行标注,统计结果表明(见表3),《纽约时报》和The Verge对鉴别资源调用较多,占比均在60%及以上,这契合鉴别资源对事物进行评价的属性,也与前文所述态度资源总体分布(见表2)契合。在情感资源的调用上两家媒体显示出了较大差异,《纽约时报》的情感资源出现频次为3.6%,而The Verge达到了25.2%,这表明《纽约时报》作为老牌严肃媒体,仍然保留了纸媒的行业准则,力求客观报道AI技术的发展应用,而The Verge作为新兴科技网络媒体,在情感资源调度上较为大胆,也更能吸引用户眼球。总体来看,二者对AI技术的态度极性取向也存在不小差异:《纽约时报》展现出了强烈的正向评价,积极评价(Positive attitude)的占比达到68.7%,远超消极评价(19.2%);而The Verge则保持中立态度,正向负向评价基本持平(均为46.1%)。在态度各子系统的极性取向上,两家媒体存在共性:情感资源没有表现出明显的积极取向,鉴别资源则都大体表现为积极正面。然而,二者在判定资源的极性取向上截然相反,《纽约时报》的评价是正向积极的,而The Verge表现为消极否定。回溯标注文本后
Table 3. Distribution of attitudinal resources’ polarity
表3. 态度资源极性比较分布
来源 |
频次 |
情感 |
判定 |
鉴别 |
总计 |
《纽约时报》 |
积极 |
2 |
12 |
43 |
57 (68.7%) |
消极 |
3 |
6 |
7 |
16 (19.2%) |
模糊 |
0 |
1 |
9 |
10 (12.0%) |
总频次(%) |
5 (6%) |
19 (22.9%) |
59 (71.1%) |
83 (100%) |
The Verge |
积极 |
14 |
4 |
35 |
53 (46.1%) |
消极 |
14 |
11 |
28 |
53 (46.1%) |
模糊 |
1 |
2 |
6 |
9 (7.8%) |
总频次(%) |
29 (25.2%) |
17 (14.8%) |
69 (60.0%) |
115 (100%) |
发现,11个消极标注中有7个(63.6%)属于社会尊严范畴,剩余4个(36.4%)是对道德(Propriety)的否定,表明The Verge主要对AI技术的能力存疑,同时担心技术伦理问题。
对所选语料分别进行态度资源的声音划分(见表4)后发现,《纽约时报》和The Verge在态度系统各个下级资源中的自言频次远超他言。这一情形与前文论述的语料总体特征吻合,说明两家媒体均对AI技术怀有强烈的评价意向,进一步强化了美媒支持AI技术发展的结论。
Table 4. Distribution of attitudinal resources’ explicitness
表4. 态度资源声音比较分布
来源 |
频次 |
情感 |
判定 |
鉴别 |
总计 |
《纽约时报》 |
自言 |
5 |
15 |
44 |
64 (77.1%) |
他言 |
0 |
4 |
15 |
19 (22.9%) |
总频次(%) |
5 (6%) |
19 (22.9%) |
59 (71.1%) |
83 (100%) |
The Verge |
自言 |
28 |
13 |
60 |
101 (87.8%) |
他言 |
1 |
4 |
9 |
14 (12.2%) |
总频次(%) |
29 (25.2%) |
17 (14.8%) |
69 (60.0%) |
115 (100%) |
由此可见,自建语料库的总体特征与两家媒体的个体特征在态度资源分布、资源极性和声音来源方面基本吻合,即:所选语篇态度系统中以鉴别资源为主,聚焦社会价值,兼顾社会尊严,在评价AI过程中呈现“重实用性,轻风险性”的特征;鉴别资源大部分为积极取向,自言频次远超他言频次,同时The Verge在判定资源分布上消极为主,说明所选语篇在支持肯定AI技术的基调上,夹杂忧患意识。
4.3. 美国媒体对AI态度倾向分析
借助语料库进行研究要结合理论知识展开,否则就成了单纯的数据收集[9]。进行话语分析时,针对话语具体内容的定性分析比简单统计次数的定量研究更为重要[10]。因此,有必要结合语篇内容分析《纽约时报》和The Verge以及二者所代表的美国媒体对AI技术的态度倾向。
4.3.1. 关注人工智能的三个流派
麻省理工学院物理系教授迈克斯•泰格马克(Max∙Tegmark)在《生命3.0》中依据人们对待通用人工智能(Artificial General Intelligence)的态度总结了三个学派:数字乌托邦主义者、技术怀疑论者和人工智能有益运动支持者[11]。数字乌托邦主义者认为在本世纪很有可能出现通用人工智能,并且会给人类带来利好结果。技术怀疑论者则笃定建造远超人类能力水平的通用人工智能短期内是天方夜谭,因此不必担心它带来的影响。人工智能有益运动支持者更像是二者的中和,这一学派认为通用人工智能有可能在几十年内成为现实,但是人类无法保证结果好坏,因而需要防患于未然。
4.3.2. 《纽约时报》:数字乌托邦主义者
从选取的五篇报道题目来看,《纽约时报》不乏对AI技术能力的褒扬:
You can’t spell ceative without A.I. [token of +ve appreciation: social-valuation]
A.I. Here, There, Everywhere. [toke of +ve appreciation]
An A.I.-Generated Picture Won an Art Prize. [toke of +ve judgement: capacity]
Inside the A.I. Arms Race That Changed Silicon Valley Forever. [toke of +ve judgement: capacity]
Robots Learn, Chatbots Visualize: How 2024 Will Be A.I.’s ‘Leap Forward.’ [toke of +ve appreciation]
各语篇作者在报道题目中蕴含对AI创造性、普适性、发展前景方面的评价,指出AI无处不在,极具创造力,富有商业价值且即将迎来快速发展。通过这些隐性的积极评价,《纽约时报》为我们刻画了一个可预期的能为人类带来美好生活的AI形象。
具体来看,《纽约时报》会使用明显的带评价意味的形容词:
Researchers liken the current state of the technology to cellphones of the 1990s: useful, but crude and cumbersome. They are working on distilling the largest, most powerful machine-learning models into lightweight software that can run on “the edge,” meaning small devices such as kitchen appliances or wearables. Our lives will gradually be interwoven with brilliant threads of A.I. [+ve appreciation: valuation; -ve appreciation: balance; +ve judgement: capacity; +ve appreciation: quality]
这段话中,作者用“useful”,“powerful”和“brilliant”称赞AI的优点,用“crude and cumbersome”揭示其缺点。乍一看,作者表达的意思是AI功能强大,但缺乏便捷性。实际上,作者不否认现阶段AI的局限性,但着重强调AI的发展预期,只要硬件问题得到解决,最终AI会变得方便实用。这些形容词大多归于鉴别范畴,唯独“powerful”一词本文标注为判定,理由有二:首先,该词常见于形容某人有能力,属于判定下的能力范畴;其次,本句表达的意思是机器学习模型能力十分强大,相较于鉴别,更契合前述能力范畴,由此可见作者在行文中会不自觉将AI当作人来评价。
前文提及消极评价在《纽约时报》的占比少于20%,而分析后发现,其中有相当部分消极词汇或标记结合特定语境来看,整体呈现积极倾向,属于“明贬实褒”:
Chatbots, for example, can be clumsy and frustrating today, but they will eventually become truly conversational, learning our habits and personalities and even develop personalities of their own. [-ve appreciation: composition: balance; -ve appreciation: reaction: quality]
前半句可直译为聊天机器人目前是笨拙的、令人沮丧的,很明显作者对AI现阶段水平不满意,然而后半句话锋一转,开始描绘聊天机器人的美好蓝图。整句话结合起来就是作者呼吁大家克服不足,对AI的未来充满期待,是典型的数字乌托邦主义者。
排除掉模糊词汇和“假”消极词汇后,《纽约时报》几无对AI的负向评价。综合来看,《纽约时报》通过刊载相关文章,传递通用人工智能将在看得见的未来实现、为人类带来福祉的思想,属于人工智能流派中的乌托邦主义者。
4.3.3. The Verge:人工智能有益运动支持者
正如前文(4.2)所言,与《纽约时报》展现出的强烈正向评价不同,The Verge保持了相对客观审慎的态度,这一点从极性的均衡分布上可见一斑。因此,需要就选取的五篇文章进行细致分析,从而总结The Verge的立场。下段文字摘自2020年一篇文章:
A.I. is refreshing because it is not interested in the question of whether or not we should create self-aware synthetic life, but instead asks what our responsibility toward it would be. If you can create a robot to love a human, one character asks early in the film, how do you get a human to love them back? [+ve appreciation: reaction: impact; +ve judgement: capability]
这篇影评类文章评论了2001年上映的电影《人工智能》及其寓意。电影讲述首个拥有人类情感的人工智能大不为世人接纳,但世界末日到来时,大卫却成为唯一记得人类的“人”,“只想记住人类母亲印在他身上的记忆”。无独有偶,泰格马克设想的未来人工智能与人类关系,其中对“后裔”的描述与之相似:即人工智能向人类学习,适应人类的价值观,让人类感觉到骄傲和被爱,可以让我们从容地退出历史舞台[11]。作者认为这部电影令人耳目一新,片中刻画的机器人拥有爱人的能力,人类与其思考是否应该创造拥有自我意识的合成生命,不如想想怎么去爱AI。可见,引文作者支持AI技术发展,同时认为人类应当着手思考有关伦理,属于人工智能有益运动支持者一派。再看下面这篇:
In 2020, stories like Google’s firing of researcher Timnit Gebru and IBM’s exit from the facial recognition business drove discussions of how AI technology should be applied. But while companies are happy paying lip service to ethical principles, the report notes that most of these “commitments” are non-binding and lack institutional frameworks. As has been noted in the past: AI ethics for many companies is simply a way to slow roll criticism. [+ve affect: un/happiness; −ve appreciation: social-valuation; −ve judgement: propriety]
引文检视了AI行业乱象——企业乐于空谈道德,做出的承诺没有拘束力,缺乏制度架构,被当成规避舆论批评的手段。语篇作者认为虽然AI指数报告(the Index AI report)给出的数据很亮眼,但是没有考虑到道德伦理也是衡量AI发展的一个重要方面。
This is broadly true and is what creates this overhang
...
As the metaphor suggests, though, the prospect of a capability overhang isn’t necessarily good news. As well as hidden and emerging capabilities, there are hidden and emerging threats. And these dangers, like our new skills, are almost too numerous to name. . .Is machine learning going to create a tsunami of spam that will ruin the web forever? [+ve appreciation-social valuation+; −ve appreciation: social-valuation; −ve affect: in/security; −ve in/security; −ve appreciation: social-valuation; −ve appreciation: social-valuation]
“overhang”本意是指“过剩”,暗指人工智能能力过剩(capability overhang),但是结合整篇文章来看,作者是想表达人工智能目前潜能尚未完全发掘,能力被“浪费”掉了,因而说明人工智能的发展前景广阔。但是在文末,作者提出了担忧:AI强大能力的背后潜藏威胁,比如创作铺天盖地的垃圾邮件,使网络崩溃。
It’s a lovely vision, and I think the reality of AI in the near future lies somewhere between “dumpster fire” and “a new golden age of computing.” Or maybe it will be both of those things in small portions, but the bulk of it will land somewhere in the middle. Some of it really will be revolutionary, some of it will be used for awful things. [+ve appreciation: reaction: impact; −ve appreciation: social-valuation; +ve appreciation: social-valuation; +ve appreciation: social-valuation; −ve appreciation: social-valuation]
引文作者认为AI具有美好前景,不久将来就会成为现实,但是AI带给人类的影响却好坏参半。“dumpster fire”根据文意应当理解为“混乱,灾难”,作者用“golden age”来形容AI可能导致的另一种可能性,即计算机技术的黄金时代。语篇作者倾向于认为未来AI将很大程度上处于二者的中间态,一方面讲是革命性的,另一方面则有可能被不当使用造成恶果。作者表达了对AI美好未来的期待,同时告诫人们警惕AI被滥用,属于典型的人工智能有益运动支持者。
Investors weren’t expecting good. They were expecting perfect.
…
News operations attempting to replace journalists with AI-written articles have faced backlash as those articles have been wrong, offensive, or useless. [+ve affect: dis/satisfaction; −ve affect: dis/satisfaction; −ve appreciation: social-valuation]
虽然引文第一句直译为投资人不看好(人工智能),但是结合下一句,投资人的意思应当为:并非没有好的预期,而是有着完美预期,因此将二者合并视为对AI的正向评价。“backlash”这里意为“强烈反对”,AI生成的文章“存在错误,行文冒犯,不具有新闻价值”。文章结尾作者评论道,投资人对AI的投入,AI能否可持续发展,取决于大语言模型能否提升生产力。通篇看来,作者并无明显的态度倾向。
总体来看,节选自The Verge的五篇文章大体认为AI技术具有现实性,但是可能存在一些伦理问题,需要引起人们关注,由此The Verge可划归人工智能有益运动支持者。
5. 结语
本文以“AI”作为关键词,设定时间跨度为2020~2024年从《纽约时报》和The Verge各抽取五篇文章自建小型语料库,并依据Martin评价理论对这十篇文章的态度资源分布进行比较分析。在定量研究方面,本研究存在样本量不足的问题,未来研究应当扩充语料库,引入“方差”分析法。
研究发现,所选两家媒体对AI的社会效用比较关注,均认为AI有益于社会发展。《纽约时报》深受数字乌托邦主义影响,对AI技术持绝对支持态度,认为AI将极大促进社会发展;The Verge则属于人工智能有益运动支持者,对AI技术持肯定态度的同时,认为人类应当小心技术伦理问题,防止AI被滥用。造成这一差异的原因,与两家媒体的性质密不可分。《纽约时报》是一家老牌媒体,在世界范围内具有重要影响力,它一定程度上反映了现今人工智能浪潮下大众对AI的高涨热情,并呈现为报道中有关AI的褒扬与期许。The Verge虽然成立时间较晚,影响力不如时报,但以评论科技见长,所以更关注AI的科技伦理问题。
总的来看,以《纽约时报》和The Verge为代表的美国媒体向公众释放了AI技术有益的信号,并向公众承诺AI的发展前景广阔。在它们描绘下,AI发展迅速,经济效益明显。这将提振民众对AI的信心,并吸引大批资金投入AI产业。事实上,在人工智能开发投资赛道上美国早已处于领先地位[12]。同时,作为民意表达途径之一的媒体,也深深影响着政府决策。例如,与The Verge传递的观点类似,美国总统科技顾问委员会(PCAST)也报告称AI具有推动科学技术发展的巨大潜力,这将极大地造福人类社会和地球环境,但若AI技术在监督缺位情况下被不当使用,可能会产生难以预料的负面影响[3]。未来研究可以在收集更多报道的基础上,构建更丰富的语料库,作更为细致的分析。此外,也可以比较目前AI发展较为迅速的国家和区域组织媒体宣传的话语特征,探究媒体报道对AI发展的影响。