1. 引言
习总书记指出:“科技创新、科学普及是实现创新发展的两翼,要把科学普及放在与科技创新同等重要的位置”[1]。科普出版历来是科普事业的晴雨表,是国家科技软实力的重要组成部分。作为国民科普的重要媒介,科学技术与社会生活之间的一座桥梁。科普出版承担着传播科学知识、传承科学理念、弘扬科学精神、普及科学技术的作用。近年来,科普越来越受到国家的重视,一系列政策也相继出台。科普出版发展速度明显加快,已经成为了新的经济增长点。
2024年2月15日美国开放人工智能研究中心(OpenAI)研究推出的人工智能视频生成模型Sora又一次震撼了世界,而这距离它推出人工智能聊天机器人ChatGPT仅仅过了两年。人工智能快速发展的速度在震撼世人的同时,也不断拨动着各行各业的神经。当下,人工智能已经在金融业、制造业、医疗业等行业实现了不同程度的融合,掀起了行业大融合的新浪潮。2024年政府工作报告中指出要开展“人工智能+”行动,打造数字产业集群[2]。在此背景下,人工智能与科普出版的融合正在成为出版业的一个重要趋势。
2. 人工智能融合科普出版的时代机遇
科普是提升国民综合素质的核心,是提升综合创新能力的必然要求。2024年11月4日,科学技术普及法修订草案首次提请全国人大常委会会议审议,这是科学技术普及法施行以来的首次修订,对我国科普事业的目标和方向进行了完善。作为科普的首要阵地,科普出版承担着推动科学知识与科学技术的重要任务。在当今数字化时代,随着深度学习、自然语言处理、知识图谱等技术的发展,科普出版与人工智能的融合速度开始加快。
(一) 内容创作:自动生成内容,符合读者需求
内容创作是出版工作的核心环节,其重要性不言而喻。传统的科普内容创作是一个繁重复杂的过程,在策划选题阶段,作者需要深入调研,广泛搜集并筛选来自多方渠道的资料,同时全面把握国家政策导向、图书市场动态以及读者群体的需求偏好等情况,并以此为基础确定内容选题。随后进入内容生产阶段,作者需要投入大量时间精力,确保所引用的科学理论知识、科研项目等内容来源的真实性与权威性,此外,作者还需要对其创作的内容进行反复打磨与精心润色,以提升内容的可读性与普及性,使内容既能够满足专业读者的需求,又能够使得普通读者所理解与接受。随着科技的迅猛发展,人工智能技术在原创内容创作领域的应用日益广泛,其中自然语言处理(NLP)技术发挥了至关重要的作用,通过对关键词的识别提取,自动收集整理大量相关数据及重要内容,这大大缩短了传统创作过程中信息搜索的时间成本。同时,人工智能具备强大的学习能力,能够基于海量数据快速生成内容提纲、段落甚至完整的文章。更为先进的是,某些写作工具还能够通过深入分析文章的核心概念与关键点,在此基础上自动生成一篇新内容。例如,韩国图书《寻找人生目标的45种方法》就是在ChatGPT技术的支持下,仅仅用七天时间便创作完成的成功案例,这充分展示了人工智能技术在内容创作领域有着广阔发展前景。
(二) 编辑校对:减轻工作负担,提高工作效率
编辑校对作为出版行业的重要环节,要求编辑具备高度的专注力与敏锐的审读能力。尤其是面对众多待处理的稿件时,他们通常需要按顺序对文档格式的标准化、文字风格的统一性以及错别字检索等问题依次处理。在这一过程中,人工智能以其强大的自动处理能力为编辑工作提供有力支持,具体而言,它能够精准识别错别字、捕捉语法错误和句子歧义等,并基于其内置的数据库提出针对性的修改意见,从而有效减轻编辑的工作负担,提高工作效率,确保文章质量的提升。此外,自然语言处理技术、图像识别技术与机器学习技术的深度融合,为图书内容的深入分析和版权审查工作提供了新的路径,这些技术能够自动识别并标记图书中高度相似或重复的内容,并通过与公开发表的文章进行对比分析,以免造成侵权的风险。例如在期刊出版领域,中华医学会杂志率先在其采编系统中全面引入AI监测工具,该工具能够准确判断文章是否由AI生成或是否包含由AI撰写的部分,其准确度高达96%。此外,中国科学院计算技术研究所和北京大学方正集团联合研发的北大方正审校系统,通过运用自然语言处理技术和计算机算法,专注于文献的审校、排版等环节,极大程度上预防了学术不端行为的发生,为出版行业的健康发展提供了强大的技术支撑。
(三) 数字呈现:技术融合出版,增强沉浸体验
教育科普是推动创新发展的基础工作,习近平总书记强调“要把科学普及放在与科技创新同等重要的位置”。十八大以来,随着国民素质的普遍提升,受众对于科学知识的需求呈现出多元化和深层次化的特征,传统的科学普及形式已难以满足广大受众日益增长的多元化需求。在此情况下,人工智能技术与科普工作的结合成为了各界关注的焦点,二者结合不仅提升科普内容的互动性和沉浸感,还使得科普形式得以创新。人民教育出版社针对纸质教材在使用过程中的复杂性和不便性等问题,充分利用人工智能技术,并融合多种新兴技术对传统纸质教材进行了系统性的数字化转型。这一举措不但简化了教材的使用流程,而且实现了科普教育形式的创新,有效解决了传统科普形式面临的困难。此外,虚拟现实(VR)和增强现实(AR)技术的发展为科普内容带来了沉浸式的体验,通过模拟极其罕见或特殊的情境并呈现给用户,增强了科普内容的吸引力。例如,《中国少年儿童海洋百科全书》这本书将二维码放入图书内页,读者扫取二维码后就可以真实地看到相关的立体模型与简单的动画效果,科普融合人工智能向互动性和实时性转变[3];人教社与中央广播电视总台合作的《千秋诗颂》运用人工智能技术将古诗文转化为唯美的国风动画,再现了古人作诗的真实场景,也让受众感受到中华优秀传统文化的魅力[4]。这些创新实践不仅为科普教育提供了新的路径和方法,也展示了人工智能技术在科普出版中的巨大潜力。
3. 人工智能时代下的科普出版面临挑战
随着科学技术的不断发展,人工智能时代下,大数据、自然语言处理技术、虚拟现实技术等为科普出版注入了新的活力。在内容创作、知识传播、数据分析等方面都表现出极强的创新力。然而,技术变革总能引发挑战,人工智能技术蓬勃发展应用于科普出版领域会引发虚假科学、知识产权归属、成本投入、从业人员淘汰等一系列挑战,对科普出版造成冲击。
(一) “文化污染”造成虚假信息频发
如今,在众多自媒体平台上传播的短视频中可以看到部分短视频底部会提示“该内容可能使用了AI合成技术,请注意甄别”的字样。这一字样透露出对人工智能生成内容准确性的深刻反思。在文化生态语境下,“文化污染”具体解释为一旦目标知识超越了人工智能的内置数据库的整体覆盖范围,或者当人工智能程序未充分理解用户提出的问题内涵时,人工智能程序就会根据文本的表层含义与联系,机械性地检索并重组相关知识信息。由于缺乏对语境的深度解析能力和对文化内涵的精确捕捉,这极易导致错误信息的产生,进而引发“文化污染”的现象。对于刚接触科学知识的青少年而言,其科学素养的初步形成可能会因此被误导,产生深远的负面影响。比如“深度伪造”视频,开源人工智能技术的兴起大大降低了虚假视频的生成门槛,它可以生成表面看似真实但实则包含错误信息的视频或图片,这些虚假信息的广泛传播不仅破坏了社会共识,还严重削弱了权威性与公信力。
(二) 侵权案件激化产权保护争议
人工智能在知识产权保护方面带来了许多新的挑战。人工智能创作模糊了“原创性”和“创造性步骤”的界限。例如北京互联网法院审理的“AI文生图”著作权侵权案,引发了关于AI生成作品著作权归属的讨论。著作权法保护的核心是作品,始终保护作者的权益。人工智能融合出版背景下,探讨人工智能生成内容著作权归属的争议变得尤为重要。由于人工智能生成的内容可能包含第三方的内容,作品版权的归属就变得复杂起来。人工智能生成内容是否侵权需要从多个方面考虑,包括人工智能生成内容本身是否侵权、训练数据库的使用是否侵权、内容组合生成的过程是否侵权等。
人工智能技术在科普文章创作领域的伦理议题已激起广泛学术探讨,其中,抄袭行为的界定不再局限于纯文字层面的复制,而是扩展至图表、图像乃至思维框架等更广泛的范畴,均应纳入保护之列。鉴于科学普及的核心在于确保知识信息的准确无误,需要广泛引用相关数据和结论。因此,在科普作品中明确标注引用来源,成为防止抄袭行为、维护学术诚信的关键措施。当前,我国著作权法律体系对于人工智能生成内容的权利归属与保护尚未形成定论,将具备具体独创性的人工智能生成内容纳入著作权法的保护范畴,不仅是实践中的迫切需求,也是法学理论研究亟待解决的重要课题。
(三) 技术局限制约业界创新
在技术支撑层面,人工智能系统在应对知识与资源库匮乏的问题时展现出一定的局限性。在系统设计的初始阶段完成数据知识的采集后,其后续行为将不再受新经验的直接影响。为了将最新验证的科研成果纳入系统,往往需要对整个系统进行重新设计。鉴于当前知识更新速度的显著加快,这一局限性导致人工智能系统在面对外部环境变化时难以实现有效适应。
成本投入层面,OpenAI发布的报告显示,到2030年,训练AI大模型的成本将从原先的1亿美元上升至5亿美元,像Gemini Ultra这样的前沿AI模型开发成本甚至高达1.91亿美元。这可能就使得只有少数大公司可以掌握人工智能技术,同时在是否可以支付人工智能费用的两大部分群体间出现一道鸿沟。对于科普出版,单一的出版系统可能无法支付高额的人工智能租用费用,AI辅助科普出版的可持续性受到干扰。
(四) 融合时代促使角色转变
人工智能技术正在全面推动编辑行业的转型,从内容创作到出版流程的各个环节都受到了显著影响。人工智能通过自然语言处理和机器学习技术,帮助编辑更快、更准确地完成搜集、策划、写作等工作,从而提升创作效率和质量。例如,AI工具可以自动进行语法检查、抄袭检测和科学事实核查,使编辑能够投身于更具有创造性的工作中去。
人工智能技术的广泛应用在编辑领域带来便利的同时也引发了一系列问题。首先,编辑人员的最终决策不可避免的会受到算法偏见的影响。在AI训练数据存在偏见的情况下,这些固有偏见会一直存在甚至被放大,导致内容选择的不公平或者观点的扭曲,引起一系列的决策失误。造成的科学知识错误也会损害编辑行业的公信力和社会的良好形象。
此外,在人工智能时代的大背景下,数字技术的熟练掌握已逐步演变为知识内容创作者不可或缺的核心能力。编辑人员需积极学习并应用人工智能技术,以实现日常事务处理及宣传推广等工作目标的高效达成,进而力求突破传统界限,实现“破圈”效应。对于拥有多年从业经验的编辑而言,此任务的执行颇具挑战性,其真正掌握与应用需依赖整个行业层面的系统性推进。
4. 科普出版融合人工智能的新路径
(一) 技术检测抵御科学错误
第一,为了应对人工智能生成的科学知识准确性不高的问题。要开发和改进深度伪造监测技术,对来源不明的数据进行重复多级审核,直到科学团队统一认为该数据正确、符合事实才可进入下一阶段的系统运行阶段。在监测技术的基础之上使用更加复杂的算法识别深度伪造。比如使用加密算法在科普视频中插入哈希值,若视频被改动,哈希值也随之改变。在智能手机上嵌入关键信息以识别数字图像的元数据来防止伪造作品的产生。但是,目前这些检测工具在准确性和可靠性上还存在挑战。例如,某些AI检测工具的准确率低于80%,而且在一些特殊情况下会将人类的作品和AI的作品混淆。
第二,目前一些研究提出了多模态信息错误检测框架,为了提高检测的准确性和可靠性,框架从信号、感知、语义以及人类四个方面进行检测分析。多模态检测下最大程度降低错误遗漏的可能性。目前在检测生成内容是否为AI生成方面成果显著,在检测信息客观准确性方面还有待提高。
(二) 法律法规适应复杂背景
在专利权方面,人工智能的广泛应用使得传统的专利保护标准需要革新。例如,如何界定人工智能生成技术方案的创造性、新颖性等问题成为亟待解决的法律难题。为了解决这些难题,可以在专利法中引入有关人工智能内容版权归属的新概念,如“数据处理权”可以赋予人工智能处理相关信息的法律权利[5];“算法透明度”可以更加方便查找侵权源头。由于人工智能知识作品的版权归属问题的核心在于人工智能法律主体资格的缺失,为了合理地解决AI作品版权归属的问题,可以将人工智能看作“虚拟人”,赋予人工智能有限的法律人格,使其能够成为专利法上的适格发明人[6]。
另外,在保护人工智能大数据需求方面,在不违反其他现存法律的情况下,可以结合具体情况将公共信息放入公共领域促进知识流通。是否符合进入公共领域的标准则需要建立一套完整细致的法规。
(三) 技术革新附带多方协作
针对人工智能现存的技术局限性,可以以人工智能本身为出发点,使用高性能的存储系统。为满足万亿级参数模型的高效数据处理需求,系统的读写性能要求很高。例如,浪潮信息推出的AIGC存储解决方案通过智能资源调度和深度数据管理,实现了数据在不同存储层级中的高效流动。为了保证人工智能系统的平稳运行,可以研发完善的系统监控服务技术,即使监测系统的软硬件、数据、网络的变化情况,出现异常情况及时发出警报提醒。
面对人工智能的成本问题,需要构建多方协同合作机制,出版社、科技企业、学术研究机构共同承担开发成本,实现资源的高效利用。同时降低人工智能应用门槛,扩展使用范围,帮助出版单位高效使用人工智能技术辅助科普。出版机构也需要结合已有的人工智能技术与条件,更加准确地学习科学知识与技能,探索多元化的营利模式,促进业内的可持续发展。
(四) 传统出版拥抱新兴科技
科普出版机构从业人员应具备综合性的系统素养和数据素养,需对AI技术的核心原理、算法逻辑及其在不同出版环节中的潜在应用有深刻的认识。出版人则需要掌握数据收集、清洗、分析以及可视化的基本技能,能够运用统计学、数据挖掘等方法从海量数据中提取有价值的信息,为内容创作提供灵感,为编辑校对提供精准指导,为市场分析提供科学依据。
人才培养方面可以建立“产 + 教 + 产”(深化数字出版产业、高等教育职业教育、人工智能产业)三方共建协同培养模式。在此体系下,联合实验室与基地将成为培养复合型、创新型出版人才的重要载体。不仅能够促进理论知识与实践技能的深度融合,还能够有效激发人才的创新思维与问题解决能力。从而为出版行业培养出一批既具备深厚专业素养,又富有创新精神与实践能力的复合型人才。
5. 结语
科普出版作为联结科学技术与社会生活的关键桥梁,承载着传播科学认知与普及科技应用的重任。目前,科普出版领域与人工智能技术的融合尚处于探索的初级阶段。深入分析人工智能时代背景下科普出版的应用现状、面临的挑战以及探索其发展新路径,对于推动科普出版的转型升级具有重要意义。在科学技术迭代更新速度不断加快的当今时代,科学技术的创新与科学知识的普及被赋予了同等重要的地位。鉴于此,政府机构、科研人员及编辑人员需协同合作,共同致力于科普工作的深化,以期实现科普事业的持续繁荣发展。