1. 引言
生成式人工智能(AIGC)是人工智能领域的一个前沿分支,以数据驱动的方式,利用大模型在大数据集上进行大规模学习,通过识别数据中的模式和关系以创造新内容的人工智能技术。随着2022年末OpenAI公司推出的ChatGPT大模型的问世,生成式人工智能技术正式进入通用化时代。AIGC技术的迅猛发展为学术期刊的编辑出版工作带来了全新的视角,在文本生成、翻译及内容创作方面都展现出不凡的实力,为期刊编辑中的文本处理和分析提供了强有力的支持,使得编辑人员的工作方式和内容发生深刻变化。从最初的自动校对、格式调整,到如今的个性化内容推荐、智能化内容生产,AIGC在出版流程中的应用正变得越来越广泛,使得期刊出版的质量大幅提高。
本文采用文献计量学分析法对国内外AIGC在学术期刊出版领域的相关文献进行分析,旨在全方位揭示AIGC在学术期刊出版领域研究成果的分布特点和发展趋势,为把握该领域研究热点及对我国学术期刊出版领域应用AIGC提供方向参考。
2. 数据来源及研究方法
本研究的数据来源于中国知网和Web of Science核心合集数据库。中文文献来源于中国知网和万方数据库,检索关键词为“生成式人工智能”、“人工智能生成内容”、“生成式AI”、“大语言模型”、“生成式人工智能语言模型”、“AIGC”、“GenAI”、“ChatGPT”、“学术期刊出版”、“学术期刊”、“期刊出版”、“学术出版”、“期刊”、“出版”。其中,在中国知网中来源类别选择“学术期刊”,万方数据不做限制,检索时间范围不限。经过人工预处理,剔除报刊文章、无作者文章、新闻通讯、期刊声明等文献和重复性文章,最终得到有效中文文献365篇。英文文献来源于Web of Science核心合集数据库和Scopus数据库,检索主题为“generative AI”、“generative artificial intelligence”、“GenAI”、“AIGC”、“Large Language Model”、“LLM”、“AI-generated content”、“artificial intelligence generated content”、“ChatGPT”、“academic journal publishing”、“academic journal”、“journal publishing”、“academic publishing”、“scholarly publishing”、“journal”、“publishing”,选择文献类型为“Article”和“Review”,检索时间范围不限,经过人工预处理,剔除了不相关文献以及重复性文献,最终得到有效英文文献150篇。
本研究使用CiteSpace可视化软件分别对中文文献和英文文献进行数据清洗和统计,分析文献的时间分布特征、空间分布特征、内容分布特征,通过统计文献关键词共现、关键词聚类分析AIGC在学术期刊领域研究的热点主题。
3. 研究分布情况
3.1. 发文时间趋势
对AIGC在学术期刊出版领域相关研究的国内外文献的发文数量和年代进行统计分析,分布如图1所示。以ChatGPT为代表的生成式人工智能的出现,对期刊出版带来的机遇和挑战成为学界和业界关注的焦点,中文文献对生成式人工智能在学术期刊出版领域的研究关注度极高,研究热度持续攀升。无论是中文文献还是英文文献,AIGC在学术期刊出版领域相关研究在2023年、2024年发文数量快速增加。
Figure 1. The publishing trend of research related to AIGC in the field of academic journal publishing
图1. AIGC在学术期刊出版领域相关研究的发文趋势
3.2. 空间分布特征
3.2.1. 机构分布
利用CiteSpace软件以机构为节点类型进行可视化分析,得到AIGC在学术期刊出版领域的相关研究主要发文机构及机构合作网络图。如图2所示,中文文献从机构发文量来看,发文机构排名第1位的是武汉大学信息管理学院(8篇);从发文机构属性来看,高校和编辑出版机构在该领域占有绝对优势;从机构合作关系来看,该领域已形成以中华医学会杂志社新媒体部、上海理工大学出版印刷与艺术设计学院、南京大学信息管理学院等机构为中心的具有一定规模的合作网络,在跨领域、跨学科研究方面进行了积极探索。除上述的代表性合作网络外,其他机构之间的合作连线较为分散,表示机构间的合作交流不够紧密,跨机构跨地区的合作仍需加强。英文文献机构合作网络如图3所示,发文机构不仅有高校、编辑出版机构还有医疗机构,研究主体更加多元,发文主体中高校占有绝对优势,发文量最多的是澳大利亚国立大学(3篇)。在英文文献中,AIGC在学术期刊出版领域的相关研究已形成以City Univ Hong Kong (香港城市大学)、National University of Singapore (新加坡国立大学)、University of Michigan (密歇根大学)、Albert Einstein College of Medicine (阿尔伯特·爱因斯坦医学院)等机构为中心的合作网络。从机构间的合作关系来看,呈现整体分散、部分聚集的特点,不同机构之间合作交流不够紧密,仍需增加机构间的合作强度和密度。
Figure 2. The collaborative network of relevant research institutions on AIGC in the field of academic journal publishing in Chinese literature
图2. 中文文献中AIGC在学术期刊出版领域的相关研究机构合作网络
Figure 3. The collaborative network of relevant research institutions on AIGC in the field of academic journal publishing in English literature
图3. 英文文献中AIGC在学术期刊出版领域的相关研究机构合作网络
3.2.2. 作者分布
根据普赖斯定律可以确定某领域的核心作者,核心作者的研究成果一定程度上代表了该领域的研究水平和研究方向。根据计算公式
,其中
表示该领域作者最大发文量,M表示核心作者最低发文数量。经计算,该领域中英文献发文量 ≥ 2篇的作者为该领域核心作者,中文核心作者有42位,其中发文量4篇及以上者有5人,6篇及以上者有3人。英文文献中仅有7位核心作者,这表明该领域高产作者较少,仍有进一步的研究和发文空间。
在CiteSpace软件中以作者为节点类型进行可视化分析,得到相关研究的作者合作网络图。如图4所示,该领域中文文献中已形成以沈锡宾、张新新、刘洪权等作者为代表的合作网络。如图5所示,英文文献中已形成以S. Gill Inderbir、Thelwall Mike、S. Al-busaidi Adil等作者为代表的合作网络。其余学者大多以独立研究或双方合作为主,合作关系较为分散,仍需继续提升作者间的合作频次和范围。
Figure 4. The collaborative network of relevant research authors on AIGC in the field of academic journal publishing in Chinese literature
图4. 中文文献中AIGC在学术期刊出版领域的相关研究作者合作网络
Figure 5. The collaborative network of relevant research authors on AIGC in the field of academic journal publishing in English literature
图5. 英文文献中AIGC在学术期刊出版领域的相关研究作者合作网络
3.3. 研究分布讨论
从发文趋势来看,AIGC在学术期刊出版领域相关研究在2023年、2024年发文数量快速增加,主要有以下原因,其一是2022年末ChatGPT的问世具有颠覆性,学术界迅速响应,而后AIGC技术持续迭代与创新,不断拓展着其在学术期刊出版中的应用边界,如在选题策划、内容创作等出版流程展现出巨大优势,吸引了更多学者围绕AIGC技术的应用展开研究,从而推动了发文数量的增长;其二是AIGC工具的出现,一定程度上提高了学者论文的质量与撰写效率,进而增加论文的录用率,驱使众多学者积极探索AIGC在学术研究及出版流程中的应用;其三是从学术期刊出版行业的发展来看,AIGC在内容生产效率、读者服务个性化等方面表现优异,行业内在的转型需求引发了大量围绕如何将其有效应用于学术期刊出版的研究,推动了相关文献数量的增长。
从中英文献中机构分布和作者分布来看,该领域机构合作网络和作者合作网络均呈现出较为分散、合作关系不够紧密的特点,机构间和作者间虽有代表性的合作关系,但尚未形成一定规模的合作群。究其原因,其一是不同机构和作者研究方向与重点差异大,高校注重基础理论研究,编辑出版机构侧重应用实践,目标与需求不同,合作难度增加。其二是机构和作者缺乏有效合作机制与平台,不同地区机构间沟通协作渠道不畅,难以找到契合点开展合作。其三是该领域的研究尚处于发展初期,许多学者才刚涉足该领域,尚未建立起长期、稳定的合作关系。
4. 研究热点
在CiteSpace软件中以关键词为节点类型进行可视化分析,得到中文文献中AIGC在学术期刊出版领域相关研究的关键词共现网络、关键词聚类网络等可视化图谱,呈现中文文献中AIGC在学术期刊出版领域的研究主题分布和前沿热点。
4.1. 关键词共现分析
Figure 6. The keyword co-occurrence network of relevant research on AIGC in the field of academic journal publishing in Chinese literature
图6. 中文文献中AIGC在学术期刊出版领域的相关研究关键词共现网络
关键词能对文献的研究主题和内容进行概括和凝练,通过关键词共现直观地了解该研究领域的热点、趋势和主题之间的关系。在关键词共现网络中,节点年轮的大小代表关键词出现的频次,年轮越大表示关键词频次越高。中文文献中该领域关键词共现网络共有170个节点,如图6所示,其中“人工智能”、“学术出版”、“数字出版”、“学术期刊”、“科技期刊”、“编辑出版”、“知识服务”、“学术不端”等节点属于网络中的枢纽节点,不同节点之间的连线十分密集,孤立节点较少,各研究方向间交叉融合性较强。英文文献中该领域关键词共现网络共有144个节点,如图7所示,其中“artificial intelligence”、“ChatGPT”、“large language models”、“peer review”、“generative artificial intelligence”、“generative ai”、“academic publishing”等关键词频次最高,同时与其他关键词联系紧密,表示海外AIGC在学术期刊出版领域相关研究已经进行了多层次、多角度的探讨。
Figure 7. The keyword co-occurrence network of relevant research on AIGC in the field of academic journal publishing in English literature
图7. 英文文献中AIGC在学术期刊出版领域的相关研究关键词共现网络
4.2. 关键词聚类分析
运用CiteSpace软件对中英文献的关键词进行聚类分析,聚类分析中,Q值和S值是评价网络图谱整体结构性能的重要指标。Q值代表聚类模块值,Q值大于0.3表示聚类网络结构显著,S值代表聚类平均轮廓值,S值大于0.7表示聚类网络结果可信。中英文献关键词聚类网络模块度相关性紧密,群体之间具有相对显著的同质性,聚类效果良好。
1) 中文文献聚类为11个聚类图谱,分别是#0数字出版、#1学术出版、#2融合发展、#3人工智能、#4编辑、#5出版业、#6出版伦理、#7学术不端、#8科技期刊、#9知识服务、#10出版流程,如图8所示,结合关键词的聚类网络与频次、中心性,可将中文文献中AIGC在学术期刊出版领域的相关研究主题分为融合发展研究、编辑素养研究、出版伦理研究、出版流程研究4个大类。
2) 英文文献聚类11个聚类图谱,分别是#0 academic publishing、#1 bibliometrics、#2 machine learning、#3 international committee of medical journal editors、#4 academic writing、#5 AI-generated content、#6 guideline、#7 academic integrity、#8 generative AI、#9 research evaluation、#10 GAI usage guidelines,如图9所示,结合关键词的聚类网络与频次、中心性,可将英文文献中AIGC在学术期刊出版领域的相关研究主题分为学术应用研究和学术伦理研究2个大类。
Figure 8. The keyword clustering network of AIGC-related research in the field of academic journal publishing in Chinese literature
图8. 中文文献中AIGC在学术期刊出版领域的相关研究关键词聚类网络
Figure 9. The keyword clustering network of AIGC-related research in the field of academic journal publishing in English literature
图9. 英文文献中AIGC在学术期刊出版领域的相关研究关键词聚类网络
4.3. 研究热点分析
据前文关键词聚类结果分析,AIGC在学术期刊出版领域的中文文献研究热点可分为4个大类,分别是融合发展研究、编辑素养研究、出版伦理研究、出版流程研究,现结合文献内容研读分别阐述中文文献中的相关内容。
1) 融合发展研究。人工智能技术不断迭代更新,AIGC作为新的内容生产力,正在变革和颠覆出版的范式和模式,促使学术期刊出版向新模式、新业态深融发展,出现了视频生成出版、沉浸式出版、无障碍出版、智能出版、智慧出版等多元化发展模式。如刘骐荣与张新新[1]集中探讨和分析了融合出版新模式这一议题,解析了纸数融合、人工智能生成内容模式(AIGC)、增强型赋能、仿真型赋能、数据赋能、元宇宙虚实融合出版6种典型的融合出版新模式。李华君等[2]探讨了有关AIGC赋能智能出版的技术特征、伦理风险与编辑把关等问题。郝海平等[3]针对作者、审稿人、期刊编辑构建了AIGC-学术出版融合发展系统,指出要正确认识AIGC在学术出版领域的作用、根据AIGC的发展选择一体化对称性互惠共生模式、尽可能为AIGC提供有利的外部资源环境,为学术出版新质生产力加速发展赋能。刘锦宏等[4]从AIGC变革出版内容生成模式、出版审核工作模式、出版精准营销模式出发,讨论出版融合发展中的人机互联、内容融合、产业融合。面对生成式人工智能在学术期刊出版中的多元应用,如何把握出版主体地位,实现人–机–物的协同融合发展,尚需业界学者深入分析和研究。
2) 编辑素养研究。生成式人工智能的发展和应用使得学术期刊出版流程日益智能化,也使得期刊编辑在新技术快速迭代的背景下面临着新的职业困境,如何正确认识和使用生成式人工智能技术,赋能期刊编辑出版工作,提高自身岗位能力值得业界关注。杨涵等[5]提到人工智能应用给学术期刊的出版流程、加工质量、编辑把关、全媒体传播、资源配置等方面带来机遇的同时也出现了人机协调、内容质量等问题,并指出学术期刊编辑要锻造数据分析和价值发现能力、提高智能环境下的把关能力,形成与技术协同的全媒体编辑能力和以人文价值驾驭新技术的新能力。徐敬宏等[6]指出出版人才要培养新型AIGC出版理念,通过技术人才引进或技术培训的方式提高出版队伍的岗位技能,同时做好AI与人工编辑的合理分工,保证编辑在行业中的竞争力。李侗桐等[7]认为编辑的人工判断不可替代,要谨慎看待ChatGPT的编辑结果,同时重视科技期刊编辑人员的智能化信息素养培育,积极研发我国自主的辅助编辑人工智能工具。AIGC应用于学术期刊出版领域,使得期刊编辑不得不思考如何面对新技术带来的调整与升级,以更好地拥抱新技术,创造新价值。
3) 出版伦理研究。随着人工智能技术的发展,AIGC与学术期刊出版的融合发展,出现了版权归属、学术伦理等问题,学者们也就这些问题展开了研究与讨论。方卿等[8]从著作权、伦理、文化安全三方面关注AIGC的权利归属、侵权、权益保障、技术伦理、学术伦理失范、意识形态渗透、文化价值观偏离等问题,亟需深入探讨与分析AIGC如何赋能出版创新发展,焕发生机与活力。张萍等[9]从数据伦理、学术创新、算法黑箱与偏见、引用与署名等问题讨论机器参与论文写作造成的出版伦理风险,并指出要从完善收稿规则、改进审查技术、提高编辑鉴别能力、严格同行评议机制、增加算法审查、规范机器参与稿件署名、提高“机器”参与论文透明度等防范措施来规范和治理出版伦理问题。袁源等[10]基于利益相关者理论,制定和践行学术出版数字化伦理规制、监管与反馈学术出版数字化伦理规制、监督及配合学术出版数字化伦理规制对确定型、预期型和潜在型利益相关者进行共治共管,实现ChatGPT在学术出版领域的人机协同和智能创新。在AIGC与学术期刊出版融合发展进程中,技术的进步带来版权保护、质量控制、学术不端、虚假信息等威胁,如何使得AIGC在学术期刊出版伦理范畴内更好地发挥价值、实现赋能是需要深入探讨的重要议题。
4) 出版流程研究。AIGC以其强大的内容生成能力,使得知识生产与传播有了新的改变,同时也影响着出版全流程。夏德元[11]认为出版机构可以在内容生成与策划环节将AIGC作为辅助工具,在编辑与质量控制环节与AIGC生成的内容相结合,在市场分析与推广环节充分发挥AIGC的数据处理能力,在个性化服务环节利用AIGC生成定制化服务版本,抓住AIGC赋予出版的机遇。丛立先等[12]指出生成式AI在信息搜索、整合、创作等方面具有更高效的处理能力,能够帮助出版主体摆脱繁琐机械的业务工作,将更多精力聚焦在更有创新创造力的工作中,为打造智能化、一体化、社交化的出版流程提供技术支撑。李嘉宁等[13]认为传统出版要在选题、创作、编校、营销和服务等环节利用AIGC赋能传统出版全链条智能化升级。倪明[14]将Claude 3 Opus和Kimi应用在生物医学期刊的同行评议环节,认为两种AIGC模型在审查方面表现出较好的能力,与责任编辑审查有较高的一致性,但尚未能达到专家同行评议的能力。生成式人工智能对传统出版全链条产生深刻影响与变化,推动其在选题策划、内容创作、同行评议、编辑加工、发行推广等方面转型升级,但技术是把双刃剑,同时也要注意隐私泄露、版权保护等问题。
英文文献研究热点可分为学术应用研究和学术伦理研究2个大类,结合文献内容研读进行分析阐释:
1) 学术应用研究。AI技术的发展,如AIGC工具、大语言模型等辅助工具进入科学研究领域,使得学术期刊出版的流程环节、出版过程、政策制定正在经历巨大变化。Hosseini与Horbach [15]的研究从审稿人角色、编辑角色、同行评议功能质量、可复制性、同行评议和社会认识功能5个主题探究了大语言模型对同行评议的影响,同时会导致不透明性、安全性、保密性等问题。Curtis [16]指出ChatGPT能加快论文内容生产与编辑过程、减轻编辑工作量,但也会引发论文抄袭、作者身份替代、知识技能贬值的风险。Dwivedi等[17]从多学科角度指出AIGC技术应用的风险和挑战,也提出要通过培训AIGC所需资源和能力、探索适合其应用环境、确定人机协同最佳组合、识别AIGC准确性、揭示AIGC伦理与法律问题等途径来应对AIGC所带来的变革。
2) 学术伦理研究。AI技术的发展与AIGC的赋能为学术期刊出版带来颠覆性改变,但其使用会带来学术伦理方面的思考。Lund等[18]指出学术出版使用ChatGPT会产生作者身份、版权和抄袭对学术工作期望、任期和晋升的影响三方面的伦理问题。Hosseini等[19]讨论了使用和披露ChatGPT或大语言模型等AI工具来撰写或者编辑学术论文相关的道德问题,认为最合理的回应是制定促进透明、问责、公平、诚信的使用政策。Carobene等[20]描述了AI工具具有科研论文写作与评议的共同创作者和道德挑战者的双重角色,带来高效、创新以及协作的同时也出现了作者署名争论、虚假或无意义信息、侵权或抄袭、工具依赖、偏见等问题。在学术期刊出版中使用AI工具的开放性、透明性、安全性对于科学研究的完整性、可重复性、严谨性至关重要,如何解决这些问题以确保负责任地使用AIGC等工具仍需进一步探讨。
4.4. 研究热点讨论
中英文献研究热点的共同点在于均高度重视AIGC在学术期刊出版中引发的伦理问题,中文文献聚焦版权归属、学术不端、算法偏见等方面,英文文献则关注作者身份界定、抄袭、引用规范等方面,两者均意识到AIGC技术对学术诚信和规范的冲击。中英文献还同时关注到了AIGC技术对选题策划、内容创作、编辑加工、同行评议等出版流程的影响。中英文献研究热点的不同点在于研究范围的广度和视角差异,中文文献研究范围更广泛,除伦理和流程外,重点关注融合发展,偏向行业转型与系统构建。英文文献研究范围相对集中,更侧重技术在具体学术场景的具体应用及直接伦理挑战,偏向技术应用与风险管控,对其他方面探讨较少。出现这种差异的原因可从以下几个方面分析,一是从技术发展阶段来看,海外在人工智能技术研发上起步较早,学术期刊出版行业对新技术的接受和应用相对较快;二是从学术研究传统来看,海外的学术研究注重实证研究和跨学科融合,在医学、计算机科学等领域有着强大的学科优势。三是从政策环境来看,海外在AIGC技术研发和应用方面的政策支持力度较大,为学术研究提供了良好的政策环境。但在学术伦理方面,也面临着更严格的监管和审视,促使英文文献对学术伦理研究更加深入,关注AI工具使用中的学术诚信、版权和作者身份等问题。
5. 研究结论与展望
本研究采用文献计量法对AIGC在学术期刊出版领域相关研究的中英文核心期刊文献进行多维度分析,研究发现该领域的中英文文献发文整体呈现上升趋势,发文主体中高校占有绝对优势,机构间的合作交流不够紧密,跨机构合作仍需加强。国内外文献均没有高产作者,仍有较大发文空间。国内AIGC在学术期刊出版领域的相关研究主题可分为融合发展研究、编辑素养研究、出版伦理研究、出版流程研究4个大类,英文文献中该领域研究主题可分为学术应用研究和学术伦理研究2个大类。同时,根据对国内外文献的研究热点进行内容分析,笔者认为目前AIGC在学术期刊出版领域相关研究的研究深度、广度还有待发展,在人工智能算法持续迭代升级后应用迅速广泛的大趋势下,未来亟待对以下两个方面开展进一步研究:1) 面对AIGC在学术期刊出版中的多元应用,仍需开展深层次出版伦理研究,例如,如何完善AIGC在学术期刊出版中的特定伦理规范及监管体系。2) 赋能学术出版行业,如何推动AIGC在期刊选题策划、内容创作、同行评议、编辑加工、发行推广等方面转型升级,推动AIGC技术在期刊出版领域的有效应用。
6. 研究启示
通过对国内外文献的分析,AIGC在学术期刊出版领域的广度和深度仍需进一步挖掘,机构间、作者间的合作研究仍需要加强。对比国内外研究各有特点和优势,海外研究的突出优势主要表现在学术伦理研究更有深度等方面。针对国内需求和特点,对于AIGC在学术期刊出版领域的研究提出以下启示。
(一) 构建跨机构跨地区合作机制。
期刊社应积极联合高校、科研院所、编辑出版机构以及相关技术企业,搭建AIGC在学术期刊出版领域的合作交流平台,促进各方资源共享、优势互补。围绕AIGC在学术期刊出版中的关键技术应用、业务流程优化、伦理规范制定等问题,共同开展研究项目,推动技术创新与应用实践。同时,在选题策划环节,期刊社应充分利用AIGC技术的数据分析能力,精准洞察学科前沿动态、研究热点以及潜在的研究空白点,为选题策划提供科学依据。
(二) 提升AI使用能力及素养。
期刊编辑应通过积极参加相关培训课程、学术讲座和研讨会等方式深入学习AIGC的基本原理、技术特点和应用场景,掌握常见AIGC工具的使用方法,如文本生成工具、数据分析工具等。同时,学会识别AIGC生成内容的优缺点,判断其是否符合学术要求和期刊风格,确保最终出版的内容质量。编辑还应培养数据思维,学会运用AIGC技术对学术数据进行分析和挖掘,从数据中获取有价值的信息,为选题策划、内容编辑和读者服务提供支持。
(三) 加强学术伦理监督。
科研管理者一方面应鼓励科研人员开展AIGC在学术期刊出版领域的研究与应用,搭建不同地区机构和学者的沟通联系平台,促进跨学科、跨地区研究主体的合作研究,另一方面,还应制定相关政策,出台AIGC在学术研究和出版中使用的规范文件,明确规定科研人员在使用AIGC技术时的权利和义务,防范学术不端行为的发生。同时,加强对科研人员的政策宣传和培训,确保政策的有效执行。
NOTES
*通讯作者。