生成式AI赋能教育出版研究
Research on Generative AI Enabling Educational Publishing
摘要: 随着信息快速传播时代的到来,生成式AI的应用普及速度不断加快,它在教育行业中也得到极大重视。以ChatGPT为代表的生成式AI横空出世,它在上线的一周内就火爆全球。据已有数据分析,ChatGPT推出仅仅一周就收获大于100万的用户,并且在其发布后的两月间,月活跃用户就突破1亿。本文聚焦在生成式AI赋能教育出版的发展研究,通过深入分析生成式AI在教育出版中的应用现状及其潜力,探讨了二者融合发展的可行性及路径。研究发现,生成式AI能有效提升教育出版内容的质量和效率,满足个性化学习需求。为实现融合发展,需关注数据内容资源、算法优化、版权保护等方面的问题,并提出相应策略。本研究也为教育出版社在数字化转型中提供了有益参考,有助于推动教育出版的创新和可持续发展。
Abstract: With the arrival of the era of rapid information dissemination, the popularity of the application of generative AI has been accelerating, and it has been greatly valued in the education industry. Generative AI represented by ChatGPT came out of nowhere, and it exploded globally within a week of its launch. According to the analysis of existing data, ChatGPT gained more than 1 million users in just one week after its launch, and its monthly active users exceeded 100 million in two months after its release. This paper focuses on the development research of generative AI-enabled educational publishing, and through in-depth analysis of the current status of the application of generative AI in educational publishing and its potential, it explores the feasibility and path of the integration of the two. It is found that generative AI can effectively improve the quality and efficiency of educational publishing content and meet the demand for personalised learning. In order to achieve the integrated development, it is necessary to pay attention to the problems of data content resources, algorithm optimisation, copyright protection, etc., and propose corresponding strategies. This study also provides a useful reference for educational publishers in digital transformation, which helps to promote the innovation and sustainable development of educational publishing.
文章引用:武子怡. 生成式AI赋能教育出版研究[J]. 新闻传播科学, 2024, 12(6): 1495-1500. https://doi.org/10.12677/jc.2024.126228

1. 引言

2023年可以被称为“AIGC元年”,生成式AI技术在国内外的发展都很有成效。在2022年的年底,美国OpenAI公司推出了基于大语言模型、爆火出圈的AI聊天程序ChatGPT。这是人工智能生成内容的一个显著突破,它实现了资料采集、文字内容创作以及优化等多方面的创新。同年,Midjourney也推出。在2024年的年初,OpenAI公司又推出了人工智能文生视频大模型Sora。这又引起了各行各业以及出版业界的轰动,它不同于以往的AI生成工具。Sora能够基于大数据学习、模拟并智能生成符合人类认知规律的视频[1]。在Sora、ChatGPT、Midjourney等生成式AI技术日益成熟后,教育出版与生成式AI的融合发展也有了全新的动能。

教育出版是一种新兴的出版产业,它本质作为知识服务的提供者,系统地满足读者学习的需要。传统理解上的教育出版,主要指针对教材教辅、家庭教育、教师教育、职业培训及教育研究等教育类图书的出版活动[2]。教育出版物涵盖教育教辅(基础、高等、成人教育以及社会培训等)和各类教育图书。在数字时代背景下,教育出版呈现多层次、全方位、立体化的特征。在生成式AI大火的境况下,各种新兴的技术与教育出版融合发展,并体现在生产效率和智能创作等多方面的新结合。目前,基于大模型生成式AI的崭新教育产品不断地更新迭代。例如,针对传统教辅的配套多媒体资源,针对传统教育出版机构的跨媒体生成和交互,以及面向学生端的自主学习、智能助教等应用。

综上,未来教育出版与生成式AI的融合会向纵深发展。这已经在业界引起关注,并且已经有许多两者融合发展的应用案例。但相关的实践探索缺乏系统全面的视角,大多是新的AI生成技术在教育出版的一些尝试性应用。本文将分析在新的时代背景下,生成式AI与教育出版融合发展所面临的新机遇和挑战。以期探究生成式AI引发的教育出版发展的现实影响,找到未来二者深度融合发展的现实可行路径。

2. 生成式AI与教育出版融合发展的应用与发展机遇

2.1. 生成式AI与教育出版融合发展的应用

2.1.1. 教育平台和APP

在校园教育领域,生成式AI与教育出版的结合日益紧密,催生出众多商业化的人工智能教学产品及应用场景。就比如高教社的人工智能平台,依托出版社的大模型技术,融合了多方商业AI的优势,为自己的平台业务提供网页端AI应用及Paas (云计算)接口服务,涵盖智能检索、审核、对话、创作与服务五大核心系统。同时,人民教育出版社与中教云联合推出的智能教辅APP在市场上取得了显著成绩。该产品以社内专业优质资源为核心,结合AI学习场景,为用户提供个性化的学习体验。据统计,其市场规模已达到百万量级,显示出强大的市场潜力和广阔的发展前景。随着科技的迅猛发展,以ChatGPT、Sora等为代表的新一代人工智能技术在中国教育领域的应用逐渐崭露头角。这些技术的出现,不仅为教育提供了更强大的支持,也进一步推动了教育与人工智能技术的深度融合。据不完全统计,截至2023年8月,百度的文心一言、抖音的云雀、百川大模型、清华的智谱华章、中科院的紫东太初等生成式AI大模型均已通过审批,可向全社会全面开放,这无疑为教育出版领域的技术融合和跨界协作提供了更多的路径选择[3]

2.1.2. 数字教材教辅

粤教翔云数字教材在研发初期,广东出版集团数字出版公司对多种AI大模型进行了广泛探索,涵盖通义千问、智谱清言、百川等开源模型及ChatGPT、文心一言等闭源模型。基于此,明确了两大应用方向:一是内部优化,如提升研发效率、内容创作(文本、图像、音视频等)、AI题库与交互式内容制作,以及构建内部多模态知识库以增强检索能力。二是外部产品创新,重点打造学科AI助手与教育出版AI助手。学科助手覆盖备课、授课、伴学、学情分析、评测及教研等全流程,结合粤教翔云平台的用户基础,助力广东教育数字化转型。教育出版助手则强化标引与创作辅助,依托公司数字教材教辅平台,提升出版物的智能制作效率。这标志着生成式AI在数字教材教辅领域的有效应用,预示着其未来的广阔发展前景。

2.1.3. AI编辑团队

“AI编辑室”是一个集出版流程专业能力于一体的人工智能团队。在内容创作上,AI画师已掌握108种出版风格,涵盖书籍封面、各类插图、设计素材等,能快速、低成本地生成16张与图书相关的图片。它助力设计师高效打造美观、规范的封面与插图,优化版式设计与排版,提升设计品质。通过深度学习大量设计案例,AI能预先理解书籍主题、内容及受众,依据用户需求自动生成符合规范的设计方案,推动出版设计智能化发展。AI编辑团队的智能应用赋予了数字时代教育和出版的新发展与新机会。

这些应用不仅覆盖了学校端的多个环节,如智慧校园的建设、学情分析、智能阅卷与考试测评、精准教学以及教研支持等,还拓展到了学生个体端,如自适应学习系统、口语陪练工具、拍照搜题功能以及智能助教等。这些技术的广泛应用,极大地推动了教育教学的现代化进程。

2.2. 生成式AI与教育出版融合发展的发展机遇

2.2.1. 政策方面

据2024年政府工作报告的发布,可以明确得出国家政策层面对于人工智能技术在教育出版领域应用的重视和支持。该报告明确将“人工智能+”行动纳入国家发展议程,并特别强调“大力发展数字教育”的重要性。在新的政策扶持下,既有的人工智能+教育的产品积极响应国家号召,不断推动技术升级和产品更新。这些产品很好地适应了当下的快速发展环境,同时又满足了社会对教育多元化和个性化的种种需求[4]

在2024年3月13日,欧洲议会正式通过了《人工智能法》。预计该法将于2025年初生效,2026年正式实施。(法律内的一些条款将会提前起效。)该法律则是对人工智能在政策制度方面的具有划时代意义的举措。它引领了世界范围内有关AI的潜在风险和影响做出的制度约束。在openAI、微软等生成式AI发展强大的背景下,该法规对生成内容来说是值得肯定的保障。

综上所述,政策层面对人工智能技术和教育出版融合发展的重视与支持为行业发展带来了新的机遇。

2.2.2. 技术方面

随着AI技术的不断发展,生成式AI有望成为教育出版领域的重要技术风口。其强大的性能优势和潜在用户需求,将推动教育出版向更高层次发展。通过应用生成式AI技术,教育出版机构可以更加精准地把握用户需求,提升产品的个性化和智能化水平,从而加速实现智慧教育出版的目标。这些产品通过引入最新的算法和模型,在教育教学过程中展现出更高的智能化水平,为学生提供了更为精准、高效的学习体验。与此同时,基于大模型的新鲜教育产品如雨后春笋般涌现,成为行业发展的新亮点。这些产品充分利用了人工智能技术的最新成果,通过构建庞大的数据模型和强大的计算能力,为教育教学提供了更为丰富、个性化的解决方案。它们不仅提高了教育教学的效率和质量,也为学生提供了更为广阔的学习空间和机会。在此背景下,无论是传统产品的升级迭代还是新鲜产品的涌现,都充分展示了人工智能技术在教育领域的广阔应用前景和巨大潜力。未来,随着技术的不断进步和应用场景的不断拓展,人工智能将在教育领域发挥更加重要的作用,推动教育行业的持续创新和发展。

2.2.3. 市场方面

强大的教育出版市场需求,这为教育出版与生成式AI的深度融合提供了利好的前景。早在2020年,我国的数字教育公司就新增9.4万家,比例接近20%。在这样的时代下,传统的教育出版机构应该打破原有赛道,借助需求巨大的用户市场,加快生成式AI和教育出版融合的进程。在未来更好地打造出满足市场需求的智能教育产品。这也助力了二者融合发展的纵深步伐。

综上所述,新的技术、新的政策以及新的社会关注度都为教育出版行业带来了新的发展机遇。随着技术的不断进步和应用场景的不断拓展,生成式AI与教育出版的融合应用前景将更加广阔。

3. 生成式AI与教育出版融合发展的困境分析

3.1. 内容方面

现阶段,生成式人工智能仍在不断优化与完善的时期。它与教育出版行业的融合会面临多个现实问题,主要由于技术本身生成内容的不确定性所引发。尽管生成式AI在专业性和创造力方面存在一定限制,但其在引入教育出版领域时,很可能产生并传播错误甚至有害的“知识”,与教育出版的专业性背离。作为一种预训练语言模型系统,生成式AI的算法和语料库的偏差可能导致错误信息的广泛传播,并可能缺乏事实来源的内容,甚至产生有害信息。这就会引发内容的准确性问题,对教育出版的导向和教育目标追求产生负面影响。即存在现有知识受限的因素,跟不上教育出版研究的相关领域最新和前沿的知识成果。

3.2. 技术方面

目前,人工智能存在内在的技术风险。其一,可能会造成新的作弊和抄袭机制。其二,可能导致用户隐私数据的泄露。这种生成式AI的技术风险主要源于自己本身的不完善。尽管ChatGPT的问世标志着AI在核心技术上实现了巨大进展。但由此引发的隐私泄露问题表明技术风险并未随着技术升级得以消除,反而愈发深化和复杂化。当前,该技术已经具备了一定的自主学习能力。它能够在与用户交互的过程中自动收集对话信息,并通过数据分析进一步处理。这就有利于生成用户喜好的答案,绘制完整的用户画像。与此同时,信息也被详细地收集,用户的隐私安全难以保障。生成式AI带来的技术威胁引发了各行各业的热议。据报道,三星电子在短至20天的时间里引入了ChatGPT,却引起三起员工通过ChatGPT泄露内部机密资料的事故。对此,三星公司声称在紧急情况下将考虑切断公司内网与ChatGPT的连接。2023年3月31日,意大利个人数据监管局(GPDP)宣布,由于涉嫌违反欧盟的《通用数据保护条例》和意大利的数据保护法,暂停使用聊天机器人ChatGPT,并展开调查。这一行政措施使得意大利成为首个对生成式AI采取措施的西方国家。然而,AI工具的隐私泄露和数据安全问题仍然存在,并且在短期内难以得到彻底解决[5]

3.3. 教育伦理方面

从教育伦理方面来说,教育的本质也是思维和精神间的交流与碰撞。而生成式AI本身作为一种大数据模型,它不会具备人类独有的精神文明价值观。教育知识传播的过程中离不开教育主体和受教育者之间的互动,人工智能则存在有悖于教育伦理的问题。比方说,假设生成式AI的技术主体人员存在某些教育伦理理解的偏差,那么会影响技术的开发。这就会造成教育伦理的缺陷,误导使用者。甚至会不断加深某种错误的教育理念,这则给教育出版带来不利的影响。此外,教育出版的现状是追求个性化教学。虽然生成式AI能够自我优化,汲取用户数据,更加针对性地为用户提供所需知识。但目前的大数据只是固化的片面理解用户,并不能内化评估用户的潜在学习意愿等各项指标。例如使用者是否可以具备学习中很重要的批判思维,能不能正确把握AI的依赖度。另外,AI获取的用户数据集本就存在结构性不平等和不平衡的现实问题,教育出版知识服务追求的教育公平性将无法得到保障[6]。这些问题也与教育伦理的评价机制不符,亟需新型的教育评价方式。生成式AI与教育出版的融合应当考虑能够准确评价用户的学习效果,如何规范教育伦理。

4. 生成式AI与教育出版融合发展的优化路径

4.1. 内容优化策略

教育出版在与生成式AI的融合发展进程中,应立足于教育出版的本质。坚持以优质的知识内容作为重心,结合AI来助推教育出版向纵深化、个性化和系统化发展。在西方已有的人工智能法下,国家也应该积极推出相关生成式AI的正式法规。据研究,于2023年我国为了规范新技术带来的市场变革,打造良好的市场生态,颁布了《生成式人工智能服务管理暂行办法》。这是一个好的开端,对教育出版融合生成式AI发展做出了政策内容的指引。为了使得生成式AI更好地服务于教育出版,应进行生成内容策略的优化。要做到扩大AI教育出版知识服务的应用领域,生成式AI要持续改进和完善预训练模型。在涉及思维训练、助学服务、教研辅助、智慧管理等应用场景中,全面动态的实践数据和事实材料需要被提供给内容生成式人工智能后台数据库进行使用。同时,为了满足不同应用场景的需求,需要构建标准化的输入框架和输出模板。并在实践中进行多次的反复预训练,以达到自动生成符合用户要求内容的目标。面临实际应用里介于版权、资源不充分等问题,AI相关企业应具备合成数据的能力,来解决有效数据材料获取的难题。合成数据的应用既能够自动创建和生成现实世界中难以采集或无法采集的场景数据,也能够提高内容生成式人工智能在诸多学习场景中的适应性和准确性。其高效、低成本和高质量的特点使合成数据对AI生成内容产业的前景具有积极的助力作用。并且据美国数据公司分析,至2024年,将有百分之六十的合成数据来训练AI。而这可能对于用户的隐私保护来说是有利的方面。

4.2. 技术规范策略

技术的发展离不开相关高素质人才的培养,应该根据生成式AI技术发展的需要,培养相关的专业人才,提升其在教育出版领域的实际应用效果。在AI不断更新升级的场景下,数据标注是能够提升机器学习能力的保障。虽然生成式内容技术已经可以做到自我升级完善,但其想达到与教育出版领域的内容知识服务准确性和相符性一致,则需要进行更细致和客观的数据标注。在文本数据得到准确标注后,版权侵权相关问题也能得到缓和。智能化的自适应教学与评估系统,是教育出版与人机混合增强智能融合的一种模式。自适应学习,是系统通过计算机算法协调与学生的互动,在学、练、测方面为学生提供定制学习资源和学习活动,以满足每个学生独特需求的教育方法[7]。在技术变革的未来,如果想阅读某本名著,读者发布命令与要求,生成式AI就可以生成相关的文字、人物介绍、同名电视剧精彩片段以及沉浸式VR等内容。这就需要技术不断探索,加快智能技术的优化。在2022年的7月,数字内容智能分发技术创新中心成立。该项目由相关的技术企业和出版机构共同创办,在两者的强有力结合下,共同发展进步。同时,规范技术应用,开发融合技术的智能分发平台,创新相关的运行模式,打通跨界合作渠道。

4.3. 伦理治理策略

在教育伦理方面,应该在结合市场需求的前提下,有效进行技术开发阶段的伦理治理。生成式AI与教育出版的融合离不开市场的广泛应用,更离不开教育伦理的遵循。教育的本质是教育者和受教育者两者之间的交流互动,受教育者要充分培养锻炼自己的思辨能力。教育不是一味地单向输出过程,更应该是双向的沟通共鸣。因此这就需要生成式AI的技术开发人员遵循教育伦理规制,规避自身潜在的认知偏差。介于从事人工智能科研工作,承担科研开发工作的中坚力量,缺乏专门的人工智能伦理教育和培训,这个问题应给予相当的重视。为了确保人工智能教育出版知识服务的科研开发人员能够承担起具有远见卓识的道德责任,科研机构有必要将教育伦理原则转化为技术开发过程中的实际应用。并建立一套系统化的内部治理机制和技术解决方案,以进行专业化的教育伦理培训。根据目前生成式AI的算法机制,未来应该不断优化升级,真正做到算法运作的客观公正和可溯源。相关的技术供应商应该做到满足消费者在使用教育服务时明晰个人信息采集应用的实际用途。

5. 结语

本研究旨在深入探讨生成式AI在教育出版领域的应用及其影响。随着生成式AI技术的快速发展,其在教育出版中的应用逐渐成为研究热点。本研究首先通过文献综述,梳理了生成式AI技术的发展现状及其在教育出版中的应用案例,明确了研究问题的背景和重要性。我国AI正处于上升的发展道路上,教育出版与生成式AI的融合发展仍处于初级阶段。整体来看,面临着内容、技术和教育伦理方面的难题。本研究针对这些方面提供了可行的解决路径,为两者未来的融合发展提供了有益的参考。通过优化生成式AI在教育出版中的应用路径,以促进教育出版的可持续发展。但仍存在一些局限性和不足之处。例如,数据分析的广度还有待提高,对这一领域的专业人员和技术的了解也有待加深。未来,希望学界业界能够完善深入这一领域,以期生成式AI更好地服务于教育出版,两者融合的发展道路愈渐广阔。

参考文献

[1] 姚建东. 艺术创作领域生成式人工智能逻辑内涵与语义要素的应用研究[J]. 新楚文化, 2023(26): 54-56+79.
[2] 周粟. ChatGPT对我国教育出版影响及应对策略[J]. 中国出版, 2024(7): 27-34.
[3] 杨凡. AI时代的教育出版研究——以生成式AI为技术驱动力[J]. 出版广角, 2023(16): 27-31.
[4] 彭玺, 刘晓琰, 肖颜. 生成式AI助力教育出版融合发展的机遇、挑战与建议[J]. 数字出版研究, 2023(S2): 16-20.
[5] 刘嘉文. 生成式AI的风险挑战与敏捷治理——以ChatGPT为分析起点[J]. 通信与信息技术, 2024(1): 113-116+131.
[6] 聂静, 宗利永. 内容生成式AI赋能教育出版知识服务的现实困境与优化路径[J]. 出版广角, 2023(15): 48-52.
[7] 王涵, 江静怡, 叶阳. 数字教育出版与人工智能融合发展研究[J]. 出版广角, 2022(16): 71-75.