1. 引言
2022年11月30日,OpenAI正式发布了具有革命性的对话式通用人工智能工具——ChatGPT。它的推出迅速在全球范围内引发了热烈反响。短短数日,ChatGPT的注册用户数量便突破了百万大关,而在两个月后的时间里,其月活跃用户规模更是飙升至惊人的1亿[1]。ChatGPT是一种基于人工智能技术的先进语言模型,它使用深度学习算法来模拟人类的语言行为,能够进行自然、流畅的对话。OpenAI公司使用了大量的文本数据对其进行训练,包括书籍、文章、网页等,从而使ChatGPT拥有了丰富的知识储备[2]。在这一领域,国内类似的产品和技术也在不断涌现,比如百度推出的“文心一言”,这是百度在AI领域深耕多年后的又一力作,旨在为用户带来更加智能、个性化的内容生成体验。
当前,ChatGPT的应用场景非常之广泛。在新闻领域,ChatGPT可以用来撰写新闻稿;在教育领域ChatGPT可以构建测试和诊断系统来评判学生的水平;在医疗行业可用于医疗虚拟助手的开发,帮助患者预约挂号、接受治疗,以及管理他们的健康信息等。ChatGPT在多个行业中都表现出了强大的应用潜力,通过其自然语言处理能力,为各行各业提供了智能化的解决方案,提高了工作效率,改善了用户体验。
ChatGPT已然成为社会各界关注的热点话题,随着ChatGPT的发布,意味着人工智能领域已经迈上了新的台阶。目前,国内已经有不少学者对ChatGPT进行研究。为了进一步丰富与拓展对ChatGPT的研究,本文运用了CiteSpace软件梳理分析国内学术界对ChatGPT的研究现状,并分析ChatGPT对新闻传播领域的影响。
2. 研究方法
2.1. 数据来源与研究设计
与本文相关的主要研究文献来源于中国知网(CNKI)文献检索平台。以高级检索方式,在检索框中输入“ChatGPT”进行主题检索,在知网总库中,将检索时间设置为2023年,选中CSSCI,共检索到文献660篇,为确保文献的研究匹配度和数据的有效性,通过人工复核逐一检查,剔除了卷首语、征稿启事、招募令、书评和研讨会通知等非学术类无效文献,最终获得有效文献489篇,以此构成本研究的文献样本。最后,将文献以“Refworks”格式导出[3]。
本文以CiteSpace为工具进行可视化分析,对中国知网(CNKI)导出的文献数据进行作者、机构、关键词共现图谱与关键词聚类绘制。绘制图谱时,将时间切片设置为1,将时间范围选为2023年1月~2023年12月。并对绘制出的图谱进行解读,从而分析该议题研究概况与热点方向,探究其未来发展前景。
2.2. 研究工具
本文利用Citespace6.3.R1版本,针对国内ChatGPT研究的机构、作者合作网络以及关键词分布等情况进行了详尽的图谱分析。此外,为辅助数据的系统整理,本文还采用了Excel表格对研究论文的发文量数据进行了汇总和分类[4]。
CiteSpace作为一款由美国德雷赛尔大学陈超美团队研发的信息可视化工具,其独特之处在于其强大的共引分析和寻径网络算法。通过该软件,研究者可以科学地计量文献数据,生成直观反映知识单元间复杂关系和互动模式的知识图谱,为ChatGPT研究提供有力的数据支撑和可视化分析[5]。
3. 国内ChatGPT研究的文献统计分析
3.1. 发文量分析
某研究领域的发文量波动在一定程度上可以作为该领域研究热度变化的晴雨表,直接反映出研究热度的增减趋势[6]。2022年11月,OpenAI正式发布了ChatGPT,而后引起了国内学者的广泛关注。如图1所示,2023年是国内对于ChatGPT研究的繁荣期,发文数量高达660篇,展现出了极高的活跃度。这一趋势与ChatGPT的诞生及其在各行业领域的广泛渗透紧密相关。关于ChatGPT如何在多元化的领域中实现应用,以及它对这些领域所带来的具体影响等方面研究日益增多。同时,如何有效规避在运用ChatGPT过程中可能出现的风险,也成为了学术界与实践界共同关注的焦点,相关研究数量正显著增长[7]。
Figure 1. Trends in the publication of papers related to ChatGPT studies
图1. ChatGPT研究相关论文的发表趋势
3.2. 研究机构与作者合作分析
用CiteSpace软件制作出作者合作共现图谱,进行共现分析,能够得出不同的作者对该研究的贡献程度。图谱中一部分作者连接紧密,说明该部分作者之间的合作较多,节点明显,发文量多[8]。由图2和表1可知,喻国明、王迁、易宪容等作者之间链接较多,说明合作紧密,共发文章较多。高奇琦、喻国明、叶鹰、曹树金等是该领域发文的核心作者,发文量多,其中方兴东、彭兰、袁曾等学者发文最少,为4篇。这些作者所处的机构对于前沿热点的技术研究的较多,并有一定的研究基础。从总体来看,图谱中展现的作者之间的合作仍然较为有限,尚未形成错综复杂且交织紧密的网络结构。目前,大部分的合作主要局限于导师与学生之间,这在一定程度上反映了该领域核心作者之间尚缺乏深入和广泛的交流与合作。为了推动该领域的进一步发展,加强核心作者之间的交流与合作显得尤为重要,这对于形成更为丰富和多元的研究网络具有至关重要的意义。
量化研究机构的发文量能够客观有效的体现出发文机构在该领域中的影响力[9]。从研究机构来看(见图3),北京师范大学新闻传播学院、武汉大学信息管理学院、南京大学信息管理学院、复旦大学信息学院、浙江大学光华法学院等都是主要对ChatGPT进行研究的机构,这几所大学的研究成果相较其他机构来说更多。
3.3. 高被引文献分析
高被引文献能够体现学术界对当前研究领域内已发表论文的关注程度,揭示出那些具有高度参考价值及广泛代表性的重要文献。根据表2可知,主要议题涉及ChatGPT在教育领域的应用以及影响、ChatGPT
Figure 2. Author collaboration co-occurrence diagram
图2. 作者合作共现图
Table 1. The table of core group of authors table
表1. 核心作者群
序号 |
作者 |
发文频次 |
年份 |
1 |
喻国明 |
7 |
2023 |
2 |
彭兰 |
4 |
2023 |
3 |
方兴东 |
4 |
2023 |
4 |
钟祥民 |
4 |
2023 |
5 |
朱鸿军 |
4 |
2023 |
6 |
高奇琦 |
4 |
2023 |
7 |
黄欣荣 |
3 |
2023 |
8 |
张欣 |
3 |
2023 |
9 |
丛立先 |
3 |
2023 |
10 |
袁曾 |
3 |
2023 |
11 |
曹树金 |
3 |
2023 |
12 |
绕高琦 |
3 |
2023 |
13 |
王迁 |
3 |
2023 |
Figure 3. Chart of bodies concerned with the issuance of documents
图3. 发文相关机构图
Table 2. Statistics of highly cited literature on ChatGPT research
表2.有关ChatGPT研究高被引文献统计
论文标题 |
发表年份 |
被引次数 |
《ChatGPT的运行模式、关键技术及未来图景》 |
2023 |
320 |
《生成式人工智能的教育应用与展望》 |
2023 |
248 |
《超越ChatGPT:生成式AI的机遇、风险与挑战》 |
2023 |
241 |
《ChatGPT爆火后关于科技伦理及学术伦理的冷思考》 |
2023 |
218 |
《生成式人工智能浪潮下的传播革命与媒介生态——从ChatGPT到全面智能化时代的未来》 |
2023 |
209 |
《“阿拉丁神灯”还是“潘多拉魔盒”:ChatGPT教育应用的潜能与风险》 |
2023 |
201 |
《ChatGPT对教育生态的冲击及应对策略》 |
2023 |
193 |
《ChatGPT助推学校教育数字化转型——人工智能时代学什么与怎么教》 |
2023 |
165 |
《生成式人工智能的三大安全风险及法律规制——以ChatGPT为例》 |
2023 |
162 |
《ChatGPT模型的法律风险及应对之策》 |
2023 |
149 |
涉及的法律问题、ChatGPT的伦理问题。此外,通过分析高被引论文,我们同样可以洞察近年来该议题的核心关注方向与研究发展趋势。首先,强调了ChatGPT在教育学领域的应用以及ChatGPT在教育领域的核心能力,卢宇等人将ChatGPT在教育领域的核心能力分为四种,分别是“启发性内容生成能力”、“对话情景理解能力”、“序列任务执行能力”、“程序语言解析能力”[10]。上述四大核心能力不仅彰显了当前生成式人工智能领域的重大进展与核心价值,还为该技术在教育领域的应用开辟了广阔的可能性空间。其次,ChatGPT所涉及的法律问题也称为了学者们的研究重点。刘艳红认为,ChatGPT在个人数据利用的深度、广度以及利用个人数据所得出来的结论上有违规的风险,因此,生成式人工智能在利用数据时,应做好前置性预防工作,通过数据分类和后续合规处理措施,消除数据的安全法律风险。最后,研究逐渐过渡到ChatGPT在新闻学、医学等方面,呈现出跨学科、多学科交叉的特点。
4. 国内对ChatGPT研究热点分布
4.1. 基于关键词共现的研究热点分布
研究热点,是一段时间内,由大量的、有内在关联的文献所讨论的一个科学问题[11]。从文献计量学的观点来看,一个学科中被引用频率较高的科研论文往往反映了这个领域的研究热点。将样本数据进行关键词聚类的,得到了ChatGPT的主题聚类图谱。结合中心度(≥0.1)排序(见表3)可以看出高频词共用12个,分别是人工智能、生成式人工智能、大语言模型、生成式AI、大型语言模型、通用人工智能、人工智能生成内容、知识生产、智能传播、人机协同等。国内对于ChatGPT的研究已经涉及了许多方面以及学科。其中,“人工智能”方面的研究最多,其次是“数据治理”,再来是“人际传播”。这几个方面是我国对于ChatGPT最热门的几个方面,在这几个大方向下还有不少的研究分支,涉及面较为广泛。
关键词的节点越大,说明该关键词的被引用频次就越高。由图4共现图谱可知,国内对于ChatGPT的研究主要聚焦于生成式人工智能、人工智能、大语言模型、数字出版、人工智能技术、生成式AI、内容生产、技术赋能、意识形态风险等主题,这些词汇在研究ChatGPT领域发挥着举足轻重的作用,对该研究的贡献较大。其中,生成式人工智能节点最大,引用的次数多,说明我国对于这方面的研究较多。
Table 3. Literature keyword frequency and centrality table for 2023
表3. 2023年文献关键词频次和中心度表
序号 |
频次 |
中心度 |
年份 |
主要关键词 |
1 |
129 |
0.11 |
2023 |
人工智能 |
2 |
114 |
0.11 |
2023 |
生成式人工智能 |
3 |
26 |
1.05 |
2023 |
大语言模型 |
4 |
15 |
0.03 |
2023 |
生成式AI |
5 |
12 |
0.14 |
2023 |
大型语言模型 |
6 |
10 |
0.11 |
2023 |
通用人工智能 |
7 |
10 |
0.17 |
2023 |
人工智能生成内容 |
8 |
9 |
0.06 |
2023 |
知识生产 |
9 |
9 |
0.22 |
2023 |
智能传播 |
10 |
8 |
0.19 |
2023 |
人机协同 |
11 |
8 |
0.19 |
2023 |
技术伦理 |
12 |
8 |
0 |
2023 |
大模型 |
Figure 4. Keyword co-occurrence network mapping
图4. 关键词共现网络图谱
4.2. 基于关键词聚类的研究热点分布
为更好地考察国内对于ChatGPT研究热点的知识结构,探讨其关键词的组合分类,本文对关键词进行聚类分析,绘制了国内对ChatGPT研究关键词聚类图谱[12]。在一般情况下,当Q值大于0.3时说明制作出来的聚类结构时显著的,而S值大于等于0.7时则说明聚类的结果有较大的信服率和效率。从图5可以看出,关键词聚类图谱Q = 0.8424,大于0.3,表明聚类结构是显著的,S = 0.9385,大于0.7,表明聚类结果是可信的。
聚类结果表明,我国对于ChatGPT的研究热点主要聚集于生成式人工智能、AI治理、人工智能和人机协同等方面。
Figure 5. Keyword clustering network mapping
图5. 关键词聚类网络图谱
5. 研究热点分析
5.1. 热点一:人机协同下生成式AI新闻前沿应用
生成式人工智能(GenAI)正掀起一场新闻行业的革新风暴,它不仅重塑了当前的新闻生产流程和产业链结构,而且全面影响了新闻生产者的地位、内容创作、传播方式以及受众对新闻的接收与反馈机制。这场变革更是促使了关于“人机关系”的观念转变,从传统的对立思维逐渐迈向了更为协同共生的新视角[13]。
5.1.1. 从代替思维转向共生思维
蒋雪颖认为,在生成式人工智能的背景下人机协同有三种模式,分别是代替式、补充式和共生式[14]。生成式人工智能不仅可以代替新闻工作者完成高重复性、细节繁琐的日常工作,特别是信息收集工作,而且能够借助自然语言处理(NLP)技术,对常规的信息进行收集和整理。这种技术的应用极大地提高了信息收集的效率,使得数据获取和整合过程更加迅速和准确。以路透社所采用的News Tracer信息采集系统为例,该系统能够实时从社交媒体的海量信息流中搜集数据,并借助先进的自然语言处理(NLP)技术和机器学习算法,迅速检测并识别出新闻事件。这一创新技术助力路透社记者在报道重大新闻时,相较于其他全球新闻机构,能够领先8至60分钟,确保信息的时效性和独家性。
5.1.2. AI补充人力效率上的不足
AI能还能够补充工作效率上的不足。例如,美联社原先每季度仅能产出300份财务报告,而面对数千份潜在的公司收益报告,他们却显得力不从心。然而,随着人工智能平台Automated Insights的Wordsmith的引入,这一问题得到了显著改善。该平台能够在短短几秒钟内将投资研究的收益数据迅速转化为可发布的新闻报道,极大地提升了工作效率。现在,美联社每季度的收益报告数量一跃提升至4400个,这一成绩相当于手动工作效率的近15倍,展现了人工智能技术在新闻制作领域的巨大潜力和价值[15]。
5.1.3. 人与机器共同发展进步
在未来,生成式人工智能将在工作实践中不断地校准人类的价值与技术工具之间的关系,不断地向人机协同靠近。例如,新闻从业人员对生成式人工智能进行新闻价值的训练,以此达到让人工智能为新闻从业人员发掘更多具有新闻价值的事件。同时,人工智能的崛起也在反向的督促新闻从业人员提高自己的专业能力和素养,提升自己的专业水平才能时刻保持对于人工智能谨慎的态度,培养自己在工作中对于人工智能的质疑、反问、理解能力,防止生成式人工智能对新闻工作者的技术反噬[16]。
5.2. 热点二:类ChatGPT技术在新闻生产领域强势崛起
ChatGPT之所以能够脱颖而出,其背后离不开自然语言处理(NLP)等新一代AIGC技术的迅猛进步和强大推动力。这些技术的不断革新和广泛应用,为ChatGPT提供了坚实的技术支撑,使其能够在众多AI领域中崭露头角,展现出其独特的魅力和价值。类ChatGPT技术作为智能时代的基础设施,也为智能新闻业提供了新的赋能[17]。
郑满宁认为,人工智能技术的初始形态主要体现在对现有数据源的整合与关联上,它依赖于语料库的学习与训练过程,以实现内容创作的结构化和高效生产。在新闻生产的领域,人工智能技术的融入拥有与生俱来的技术优势,能够极大地推动新闻内容的生产效率与质量[18]。
史安斌提到,随着ChatGPT的问世,人工智能正式迈入了自动内容生成(AIGC)的全新纪元。机器人记者,借助先进的机器学习和深度学习算法,能够精准地从浩如烟海的数据和信息中提炼出新闻价值,进而独立、高效地创作出高质量、深入的新闻报道与分析文章。这一变革不仅拓宽了新闻创作的边界,也为读者带来了更为丰富、多元的新闻视角。虽然学界业界还在为此争论,但AI赋能新闻生产已经是不可逆转的潮流了。我们不可否认,AIGC在新闻生产上确实有着一定的优势,与其与新技术对抗,担心新技术带来的各种社会问题以及对新闻业的影响,不如思考如何恰当的运用新技术,让人工智能更好的服务于新闻生产。
陈昌凤、袁雨晴则认为,生成式人工智能(GenAI)的典型应用ChatGPT在赋能新闻业,实现新闻素材检索的海量化、内容生成的智能化、新闻推荐的显性化、新闻反馈的人性化等方面发挥着重要作用[19]。《内幕》杂志(Insider)在2023年4月组建了一个专门的工作组,致力于研究和探索如何负责任地将人工智能技术融入其日常工作流程。该工作组积极鼓励记者们开始审慎地利用ChatGPT等工具来辅助编写文本、构建报道大纲、纠正拼写错误、优化新闻标题,以及协助生成采访问题等,从而提升新闻制作的效率和质量[20]。
综上所述,人工智能技术的快速发展使新闻业在技术革新的浪潮与人本主义的坚守之间寻求平衡。然而,这仅仅是序幕。展望未来,AIGC(人工智能生成内容)将从单纯的数据分析式AI迈向更为先进的生成式AI。在人机互动层面,AI将更深度地模拟人与人之间的交互方式,进一步渗透到新闻业的采集、编辑、传播等核心生产环节,以及分发和消费流程,推动新闻业实现更深入的转型升级[21]。
5.3. 热点三:人工智能引发社会传播的变革和对媒介环境的影响
5.3.1. ChatGPT扩宽社会信息传播的广度
以ChatGPT为代表的生成式人工智能,将以指数级的速度提高社会信息的传播速度以及传播广度[22]。在ChatGPT广泛应用的今天,社会中各个领域的人都可以利用它来生成和获取信息内容,大大提高人们的工作效率,频繁地使用也使得ChatGPT可以快速的学习和升级,生产出更加优质的信息内容。此外,生成式人工智能将显著拓宽信息传播的受众边界。其几乎无边界的内容生成能力不仅在日常生活中扮演着举足轻重的角色,更在特定专业领域如教育、医学、法律、学术和编程等领域展现出超乎寻常的实力。这些能力预示着大模型媒介有潜力成为这些专业领域中不可或缺的基础工具,从而极大地扩展了受众的使用场景和应用范围,这也使得社会信息的扩散变得更加的广泛。
5.3.2. ChatGPT加深社会信息传播的深度
ChatGPT等人工智能的技术特性赋予了其从海量原始数据中学习和提取更复杂、更高阶特征模式的能力,这种能力使得生成式人工智能在理解和生成数据方面展现出卓越的性能[23]。它可以发现许多人们所无法触及的数据知识背后所隐藏的信息,例如在新闻传播学领域中,经常会进行一些交叉学科的研究,ChatGPT的使用可以很好的弥补研究者缺乏的信息内容,提高研究的效率。
对于个人用户而言,ChatGPT已经超越了单纯的信息查询工具的角色,它正逐渐演变为一个能够提供深度交互、辅助思考以及促进学习的智能伙伴[24]。而在社会层面上,它的参与也愈发显著,它正积极地参与到整个社会知识体系的运作之中,源源不断地生成各种形式的公开且广泛流通的文本,甚至图片和影像等。这些内容正逐渐成为公共知识的一部分,也影响着公众舆论的走向,从而更广泛地触及并影响人们的社会观念和形态。
ChatGPT凭借其强大的智能内容生成能力,将极大地丰富和扩展我们的知识体系[25]。因此,无论这些内容是否展现出显著的创新性,它们都将有机地融入并丰富我们的知识体系,为人们的认知边界带来新的突破。周葆华认为,随着类ChatGPT技术在社会中的广泛使用,它正在成为社会舆论的重要参与者和影响者:“ChatGPT已经展现出从个人知识向公共知识传播演化的过程……当机器生成的知识成为公共知识,成为公共对话、讨论和社会运作的资源,必然对公共舆论、公共交往与公共生活产生重要影响。[26]”
5.3.3. 媒介环境改变:使用依赖下的价值观脱轨
从媒介环境学的角度来看,引入生成式人工智能到人类社会不仅预示着数据流动的新趋势、信息获取的新阶段以及人机交互的新形式,而且还将催生一种创新的媒介环境[27]。这种环境有潜力在认知、态度和行为层面对用户产生深远且不易察觉的影响。在大众传播时代,信息传播权是完全掌握在人们手中的,信息传播媒介的主要功能是架起信息传播与接受双方的沟通桥梁。学者邱立楠认为,“编辑人员会按照固有统一的专业价值判断标准,对所有待分发的视频内容进行审核与筛选,并择优将审核通过的视频内容分发给所有受众。[28]”在这一过程中,信息的把关和筛选是人工进行的,新闻从业人员可以把控舆论的走向,即使舆论方向与预期的有所偏差,也可以及时的扭转,确保流传的信息是符合社会主流价值观的。
而在生成式人工智能时代,这一规律被打破。生成式人工智能所生产的内容是由机器筛选的,并不经由人工筛选。而他可以依据不同的场景、不同的需求来生产信息内容的特点也使它超越了传统的信息检索工具的概念,虽然它作为信息传播桥梁的形式并没有改变,但其本质上已经发生了变化,信息生产与传播的主动权和控制权正在经历一场由人类倒向机器的深刻转变。传统的“人类掌权”的范式逐渐被“机器主导”的技术逻辑所取代,这标志着信息传播领域的一次重大变革[29]。
在传统时代,人们的价值观会受到民族、地域、经验等因素的影响,而在当下这个由算法构成的媒介环境中,AI看待世界的方式则受到技术逻辑的影响,并严格按照技术逻辑运行,在此基础之上,它所生成的信息是由最优的、纯理性的角度给出的,而不是按照社会主流价值观和人类利益的角度得出的。因此,人们在运用生成式人工智能进行交互的过程中,不可避免的会受到算法逻辑的影响,并将机器逻辑潜移默化的根植在人们的意识之中,重塑人们的价值观念的态度,使人们的意识逐渐向技术逻辑的方向变化。
6. 展望
自1950年图灵测试概念的诞生,到2022年ChatGPT的问世,跨越了整整72年的科技浪潮。在这段时间里,人类不仅见证了人工智能从理论设想的萌芽到逐步走向民用现实的壮丽历程,更亲身感受到了AI技术如何逐步渗透到日常生活的每一个角落,为人类社会带来了前所未有的变革。
在新闻传播领域,ChatGPT为新闻业带来的崭新机遇,新闻工作者应积极接纳、运用新技术。通过深入学习和掌握运用生成式人工智能的方法,新闻工作者可以巧妙地将人工智能技术融入到新闻生产中,从而使其更好地服务于新闻内容的创作与传播[30]。人工智能的崛起,多样类型的内容生产成为现实,这无疑对新闻工作者提出了更高的要求。在技术与创新的竞争中,新闻工作者应坚持内容为王,通过精心策划和深入报道,以质取胜,为受众提供更加丰富、多元且有价值的新闻产品。
人工智能技术的迅猛发展正以前所未有的速度包括新闻传播领域的各行各业产生着深远而广泛的影响。如何在技术浪潮中稳固人类的位置,确保人工智能技术与社会发展的步伐和谐共振,已然成为我们在每一次技术革命中都需不断探讨的重要课题。
7. 结语
习近平总书记指出:“要加强人工智能同保障和改善民生的结合,从保障和改善民生、为人民创造美好生活的需要出发,推动人工智能在人们日常工作、学习、生活中的深度运用,创造更加智能的工作方式和生活方式。”ChatGPT作为一种新的生成式AI,其许多特点、给社会带来的影响以及如何应对它带来的影响还需进一步研究。
本研究运用知识图谱工具CiteSpace对我国ChatGPT相关研究做可视化分析,从高频关键词、关键词聚类、作者合作图谱等方面进行知识图谱分析,讨论了这一研究领域在我国的研究进展与热点。在针对既有文献的研究中,采用量化处理方式相较于传统的文献处理方法,显著提升了研究的客观性和准确性。这种方法通过精确的数据分析和图表展示,使得研究结果更加生动、直观,易于理解。