1. 问题的提出:人工智能生成内容司法争议引发的思考
随着生成式人工智能(Generative AI)技术的加速演进,以大语言模型为代表的新一代人工智能系统正以前所未有的速度重构内容生产方式、文化传播机制与公共讨论生态。生成式人工智能能够输出内容丰富、风格类人的内容并非一蹴而就,其创作过程大致可以分为三步。第一步是接触并获取海量数据,并通过数字化、结构化的处理形成可供其自身调用的数据库,为后续的模型训练提供了统计规律和语义信息。第二步则是深度学习与预训练,通过数以万亿计的参数调整与高频循环训练,生成式人工智能在系统内部形成多个隐含的表征层级,自动建构语言模型中的“规则”与“模式”,并在持续迭代中不断优化。第三步是模型推理与用户交互阶段,结合用户的输入提示及其上下文语境,通过对概率空间的实时计算,过滤相关信息并且自动优化,并最终输出符合语言逻辑与人类期待的文本、图像抑或其他内容。
在我国背景下,人工智能生成内容的大规模应用同样对既有法律制度提出了结构性的挑战。中共中央、国务院印发的《知识产权强国建设纲要(2021~2035年)》及《“十四五”数字经济发展规划》强调对未来知识产权和数字经济发展目标作出全面的部署规划,这些顶层设计亦表明,建立适应人工智能发展的法律制度已成为国家战略共识与迫切需求。在国际范围内,生成式人工智能技术竞争已成为战略博弈的新焦点。美国、欧盟、日本等国家和地区纷纷推动数据治理、人工智能伦理与算法规制体系的政策化与立法化。如英国颁布的《人工智能(监管)法案》草案、日本参议院批准的首部针对人工智能的专门法规——《人工智能技术研究开发与利用促进法》、欧盟颁布的《人工智能法案》及《数字单一市场版权指令》、国版权局发布的人工智能生成内容登记指南及相关司法实践,以及WIPO推动的全球对话,都体现了世界各国和经济体在积极探索规制人工智能生成内容的路径,以抢占未来科技标准与规则制定权。
因此,在技术变革、国家战略和国际竞争的三重驱动下,系统研究人工智能生成内容的法律定性问题,不仅是其他相关问题研究展开的基础,更关乎国家治理现代化、文化产业安全与国际规则话语权。
2. 人工智能生成内容的主要类型
人工智能生成内容依据其数据来源与用户指令的不同,最终的生成类型或表现形式存在着多样化的可能,限定在文学艺术与科学领域之内进行分析,现今的人工智能生成内容的主要类型有文字成果、图片成果与视频成果三种模式。
2.1. 文字成果
在“文生文”(text-to-text)模式下,生成式人工智能主要是依据用户输入的文字提示,通过对其数据库中数以万计的文本与数据资源进行分析,继而生成符合用户要求的文本内容。用户只需简单、清晰地概述其生成要求,人工智能即可完成从文本内容的生成到润色与优化的全过程,其生成内容包括但不限于诗歌、小说、论文、评论以及营销文案等多种文体形式。与传统写作模式相比,这一过程不仅明显减少了人工智能使用者的写作时间,也让一些非专业人士也能够轻松获取其需要的文字内容。这背后依赖的是自然语言处理技术与大规模语言模型的深度学习能力,通过不断技术的不断更新迭代,生成式人工智能不仅能够进行基本的文字内容生成,还能通过对用户上下文聊天语境的分析,了解用户的风格特征,进而模拟人类的写作习惯。例如,在论文写作中,人工智能可以根据用户输入的研究主题自动生成论文提纲和摘要,并对已有段落进行润色和修改;在商业营销中,它可以结合当下热点话题,快速生成用户所需要的文案,从而帮助用户实现内容的生产与传播。
更进一步来说,生成式人工智能并不仅限于“辅助写作”的角色,它甚至还展现出看似“自主写作”的特征。这种能力在新闻行业的体现尤为明显。例如,美联社推出的“WordSmith”、《纽约时报》的“Blossom”、新华社的“快笔小新”以及腾讯的“Dreamwriter”等人工智能技术,它们通过获取和整合数以万计的新闻信息,结合媒体给定的写作习惯与风格要求,能够在极短时间内完成财经、体育等领域的新闻撰写作。这类系统不仅在写作效率与准确性上具有显著优势,而且能够通过算法技术不断提升文章的质量,从而替代那些重复性较强的写作活动。与此同时,它们的应用也推动了媒体行业的数字化转型,使得人类记者能够从一些枯燥、重复、机械的工作中解放出来,将更多精力投入到更为深入的调查与报道中去。
2.2. 图片成果
在当前有关图像生成的人工智能中,主要生成内容包括“文生图”(text-to-image)和“图生图”(image-to-image)两种。其中,“文生图”模式是指用户通过输入文字形式的要求,尽可能详细地描述出自己所需要的图像内容,例如画面中的场景设计、人物特征、主要色调等等,生成式人工智能系统根据这些文字信息便可生成相应的图片。与传统的绘画创作相比,这种生成方式极大地降低了创作门槛,用户无需具备专业绘画技能甚至绘画工具,只需凭借语言的表达便能获得让其满意的图片内容。实现这一效果的关键在于系统在开发和训练阶段所依赖的大规模图像数据库,继而将用户语言描述的要求与数据库中的内容相对应。近年来,“文生图”的生成速度和图像质量都有了大幅度的提升,这种模式也正在广泛应用于广告与游戏设计等领域,成为一些设计类产业的重要辅助工具。
此外,许多生成式人工智能应用还具备“图生图”的功能,即用户上传一张已有的图片,人工智能可以对该图片进行进一步的处理。在这种情况下,人工智能不仅能识别该图片的内容与风格,还能结合用户的要求,对图片的细节进行修改或优化,或者对图片的风格进行模仿,甚至是对多张图片进行整合处理,从而输出符合用户需求的新图片。与“文生图”相比,“图生图”更强调在所给图片的基础上进行再次生成。例如,设计师可以只上传一张基本的初稿,通过提示指令实现完整的设计内容;摄影爱好者可以上传一张带有“瑕疵”的照片或者老旧照片进行处理,使其像素更加清晰,或者改善局部的瑕疵。由此可见,“图生图”不仅能满足用户的个性化需求,也在图片修复等方面发挥了重要的作用。随着相关技术的不断提升和进一步优化,这种基于图片输入的生成模式将持续促进生成式人工智能技术渗透到人们生活的各个方面。
2.3. 视频成果
2024年2月15日,美国人工智能研究公司OpenAI再度升级了相关人工智能技术,推出名为Sora的文生视频模型(text-to-video)。相较此前的文生文、文生图等类型的生成技术,文生视频模型的出现标志着生成式人工智能模型的发展迈上了新的台阶,它能够更为精准地了解上下文的语境,从而生成更加贴合用户需求的视频[1]。用户通过输入一定的文本指令,人工智能应用便可自动解析出用户所期望的视频角色、动作、场景以及整体的氛围,随后将其生成为动态的视频画面。与图像生成相比,视频生成对模型的处理能力提出更高的要求,不仅要在每一帧中展现出精细的画面,还要确保视频中的人物动作自然、剧情发展连贯。换言之,Sora能够处理复杂场景下多角色互动的动作、表情抑或神态,使其生成内容在视觉表现上呈现出一定的真实感与艺术性。
与此同时,视频生成的过程通常包含多个步骤,用户先通过提示词来确定视频的基本内容框架,随后对初步生成的视频结果进行进一步的调整,如变换视频中的环境、改变视频中人物的动作、为视频添加字幕或者背景音乐等,以更好契合用户的具体需求。这种高度灵活的视频生成机制,使人工智能视频生成技术在影视、广告、教育以及自媒体等领域展现出强大的应用潜力。尤其是在短视频领域,各个平台已出现上传“纯AI”制品的自媒体账号,例如根据用户输入的剧情生成带有一定故事情节的视频、利用文生视频技术对已有视频进行剪辑或缝合的二创、抑或是带有各类特效头像的纯口播视频。这使得用户甚至都不需要拥有任何专业的拍摄设备即可在自己的主页上传内容,以达到内容的快速更新并保持账号的活跃度,进而满足其视频传播的需求,甚至将流量变现为其带来不菲的经济价值。
3. 人工智能生成内容的判定应与人类作品基于相同的独创性标准
作品独创性的主观主义标准与客观主义标准侧重点不同,采纳不同的判断标准将直接影响对作品是否具有版权属性的认定,进而可能导向截然不同的法律结论,对版权保护范围和适用边界产生重要影响。
3.1. 主观主义标准:作品须体现创作者的独立性表达
作品独创性判断的主观主义标准又称目的主义标准,指在对象的可作品性判定中,存在一个作者主观上存在的,与客观世界完全独立的精神世界,作者从这个世界中以“无中生有”的方式创作出独一无二的作品,作品是作者主观构想的再现[2]。因此,独创性主观主义标准的内涵主要包括两个方面:一是以过程为视角;二是以作者为中心,即强调作者在创作过程中的独立性表达[3]。主观主义标准强调作品是创作者精神活动的外化,其核心在于“独立性表达”——即作品必须体现创作者在形式与内容选择上的自主决策与个性化表达。与客观主义标准聚焦于创作结果不同,主观主义标准更注重创作过程中的主观能动性,强调创作者在选题、结构、语言、风格等方面所展现出的独特创意与个性。换言之,主观主义标准的最大优势在于指出了作品之所以构成“独创”,并非仅因其外观具备一定的差异性或新颖性,而是由于其反映了创作者精神世界的独立生成与个体化表达,这种“作者中心主义”的标准取向与法哲学视角下康德之“人居于主体地位”理论相契合。同时,该标准也强调了创作者在创作工具和技术手段使用上的主动性和自主选择能力,无论是手工创作还是利用现代数字工具,都应体现作者的决策痕迹和独特思维方式,从而凸显作品的精神原创性。
尽管主观主义标准在理论上强调“以人为本”的价值取向,并在应对人工智能生成内容问题时具有一定的适用空间,但该标准在版权法体系内部仍面临诸多质疑。首先,依据传统“思想与表达二分法”,版权法只保护作品中表现出来的具体表达,而不涉及其背后的思想与意图,但主观主义标准强调创作者的精神世界与主观构想,某种程度上模糊了思想与表达的界限,可能引发对思想本身的实质保护,与著作权保护的表达区分性原则相违背。另外,与结果为中心的客观主义标准相较而言,其对“作者控制力”与“工具使用程度”的判断仍依赖高度主观的认定标准,缺乏清晰的评价框架,“创作高度”、“作品个性”等概念并不比“独创性”概念更好理解,这种界定实际上等于是没有界定[4]。此外,在人工智能辅助创作的背景下,如何界定作者的主观意图和独立性表达也面临更复杂的挑战,尤其当创作过程涉及算法生成、数据训练等环节时,主观主义标准的适用边界更加模糊,对作品的法律认定和权利归属提出了新的思考空间。
3.2. 客观主义标准:具备作品外观的对象即可被视为作品
作品独创性判断的客观主义标准又称形式主义标准,它将作品独创性的判断标准着眼于创作结果,即作品本身。客观主义标准说是指在对象的可作品性判定中,以独立的、终局性的作品为关键唯一的判定对象,而对创作的主体与创作的过程不予顾及[5]。客观主义标准在形式上对作品的判定要求相对较低,符合作品外观特征的对象即可被视为作品,该理论最早系统化地出现在美国联邦最高法院在Feist案中的判决中,法院明确指出:“独创性不是要求作品新颖、独特或令人惊叹,而是需要至少表现出‘最小程度的创造性’(a modicum of creativity)。”[6]这一判决表面宪法规定受版权保护的作品至少需要少量的创造力作为原创性的组成部分,强调了从作品客观呈现的内容中识别是否具备最小程度的创造性,而非分析作者创作时是否具有创新意图。客观主义标准的明显优势在于强调判断的客观性与结果导向性,不仅有效摒弃了主观因素可能带来的不确定性与裁判难度,确立了以“表达是否呈现个性化选择”为核心的外部性评价机制。同时,这种标准便于司法实践中统一尺度,减少对创作者意图或心理状态的复杂考量,使版权认定更易操作和量化,尤其在处理大量作品或数据生成内容时能够提供明确的判定框架。
与此同时,也有学者指出保护和激励人类创作是著作权制度的价值目标,人的创作意图和思想情感促成了作品是作者与受众“对话”的载体[7]。而彻底的客观主义标准将会导致对“作者死亡”理论的认可,这种过于形式化的判断也可能忽略作品的深层文化价值和作者的情感表达,容易出现形式上“独创”但实际缺乏思想内涵的作品获得保护的情况,从而与著作权制度旨在激励创作和传播人类思想的初衷产生一定张力。正如在猕猴自拍案中[8],猕猴的自拍照不属于摄影作品受到保护,并非缺乏客观主义标准上的“独创性”,而是将其认定为作品并提供著作权保护会从根本上违反著作权法的立法目的和精神,也与法律的规定不符。由此可见,若单纯依赖客观主义标准,著作权法在面对非人类创作或自动生成内容时可能出现保护过度或保护失衡的风险,同时也忽视了创作者在社会文化语境中的主体性和作品的交流功能。
3.3. 主客观主义标准相结合:回归独创性的综合判断标准进行分析
著作权法语境下作品独创性判定的主观主义标准和客观主义标准并不是一成不变的,而是时刻处在动态互易融合之中[9]。著作权制度下的独创性判断,应是主观与客观相结合、有机统一的判断流程。关于人工智能生成内容的独创性认定,应确立“主客观相统一”的独创性标准,同时从创作过程与创作结果两个分析视角进行独创性判断[10]。在著作权客体的判定过程中,如果采用彻底的主观主义或客观主义标准,势必会割裂创作与作品之间内生因果关联,忽视作品作为创作活动外化结果所承载的映射意义,同时也忽视了创作活动作为作者主体精神世界与客体表达形式之间的转化意义。
具体而言,在有关独创性的判断路径上应遵循“由果溯因、从表及里”的逻辑进路,即首先通过审视创作结果是否呈现出个性化表达与创意选择的表现形式,初步建立客观基础;进而追溯创作过程,考察人类主体是否对创作行为实施了实质性控制、是否具备独立性表达的主观基础,最终完成完整的独创性判定闭环。在人工智能深度参与创作的背景下,这一“主客观协同判断”路径不仅能够有效区分人类创作与算法自动生成的边界,而且有助于回应司法实践中不断增长的著作权主体识别难题,著作权法的独创性认定标准将不再停留于单一静态的规则适用,而是向兼具开放性与规范性的方向发展,从而推动著作权制度在技术与人文交汇的新时代中实现理论创新与体系重塑。
4. 人工智能生成内容不可版权性的关键——独创性分析
对于“独创性”从字面上进行分析,其具体包括“独”和“创”两方面的内容。对于人工智能生成内容的独创性分析,若单一采取客观主义标准或主观主义标准,皆存在一定不足。而是应该回归独创性的综合判断标准进行分析,从结果和过程两方面对人工智能生成内容进行独创性分析,并且在此基础上需要注意的是独创性分析只是判定版权属性的核心条件,换言之,即便人工智能生成内容满足一定的独创性要求,也不能就此判定其属于著作权意义上的作品。
4.1. “独”:人工智能生成内容不符合独立完成的特征
判断人工智能是否具有自主生成的能力,要从人工智能生成内容的过程出发,去考量其自主能力在执行生成任务时的作用体现。现如今仍有不少支持生成式人工智能具备独立完成创造的观点,认为人工智能能够从对给定的数据资料进行学习和消化,进而自主的选择可供参考和使用的素材和资料,并且依据人类主体事先设定的需求,进行数据信息的分析、组合和排列创作,到最终得到人工智能生成内容这一创造性成功的这一整体流程,都与人类主体没有任何关系,因为其并未向人类主体寻求任何额外的辅导和帮助[11]。对此,本文持否定意见。
首先,人类输入指令是人工智能开始生成的前提,现阶段的人工智能并不具备自主决定是否进行创作的抽象意图,脱离了人类的指令输入,人工智能便无法自主启动内容生成的过程。这意味着,其生成行为本质上仍是对人类意图的技术回应,是人在表达思想或实现特定目的过程中所借助的工具;其次,在实践中鲜有使用者仅通过一轮的指令输入就能得到自己满意的作品,往往使用者不断对生成结果进行审视、判断并提出调整意见,使人工智能根据其反馈进行内容优化,通过多轮的指令输入才完成最终作品。这一过程也体现了人类在生成内容中的持续性参与和主导作用,这种反复交互不仅反映了人工智能创作活动中的高度依赖性,也凸显了人类创作意图对最终成果的决定性影响。人工智能在生成过程中并不具备目的设定能力,其生成路径和表达方式,皆由用户输入所限定,其所谓的“选择”与“组合”不过是在预设算法范围内进行最优化计算,这种技术执行行为无法被等同于真正意义上的创造行为。
不仅如此,即便某些人工智能生成内容在结构、语言风格等方面看似完整,仍需指出的是,尽管在技术上人工智能展现出一定程度的自动化与复杂处理能力,但这并不意味着其具备真正的“自主性”。其生成行为本质上是对人类设定规则、提供语料与输入指令的综合响应,而非基于自身意识或创作动机所作出的自由表达。
4.2. “创”:人工智能生成模式的本质是选择而非创造
支持人工智能生成内容具备独创性的学者指出,独创性不是有和无的问题,而是高和低的问题,故而不应过度拔高独创性门槛[12]。并认为用户通过对人工智能生成内容后续的无限修改行为,使得该输出物呈现出个性表达,更是用户贡献了独创性的表现[13]。本文对此持相反观点。
正如前文所述,人类的生成意图才是影响人工智能生成过程的开始,换言之,只有人类的生成意图才对最终生成内容的存在起决定性作用,不过这并不代表着人类直接决定着人工智能生成的内容,内容本身仍是基于人工智能自身的算法和所受的素材训练而生成的[14]。基于人工智能的运作是“暗箱模式”,即便用户输入很具体的文本指令,也无法预见到人工智能输出的具体内容,并且修改次数的多寡对于作品创造性的判断并无实际意义,因为无论经过多少轮的指令修改,都只是在人工智能自身的算法和训练素材中进行选择和排列组合,人工智能生成模式的本质是选择而非创造。
并且在输入相同指令的情况下,人工智能所输出的结果并不唯一,这使其看似具有较大的变化空间来将用户输入的“思想”外化成受著作权保护的具备独创性的“表达”。但是问题在于,尽管随机算法使得人工智能在接收指令后能生成不同的组合,并且人工智能的素材库正以难以估计的速度实时更新,但这种随机组合的数量真的是无限的吗?答案当然是否定的,因为人工智能的“创造性”本质上是建立在有限素材和既有模式基础上的组合与重组。正如前文所述,人工智能生成内容依赖于机器学习技术,而机器所学习的内容皆来源于人类已有的创作成果。相比之下,机器的“创新”则受到训练数据、算法机制以及程序逻辑的多重限制,其“变化空间”虽大,但终究有限,无法跳出其所依赖的素材集合与逻辑框架。因此,生成式人工智能的本质——它不是自主的创作者,所谓“创作”的表现实际上是在现有素材库中进行选择,无法与人类真正的智慧成果等量齐观。
4.3. 独创性是认定作品可版权性的必要条件而非充分条件
诚然,独创性作为著作权法中判断作品是否可受保护的核心标准之一,其重要性毋庸置疑。但独创性虽为判断标准中的“门槛”,却并不足以单独决定是否赋予版权保护,在现代著作权体系中,除了“独创性”这个实质要件以外,还需结合创作行为的主体性以及创作方式的合法性等因素,综合判断生成内容是否构成“作品”。
例如,在创作主体方面,人工智能目前尚不具备被普遍认可的民事主体资格,其是否拥有独立的民事行为能力以及是否能够与自然人、法人等传统民事主体平等享有权利与义务,亦缺乏明确的法律依据与统一的理论共识。而人工智能的民事主体资格是作者资格的授予前提,因此,在如今的弱人工智能发展阶段上,人工智能显然无法具备在知识产权领域中作为“作者”的主体身份,而若将人工智能背后的相关权利主体拟制为“作者”,亦颠倒了著作权法中拟制作者应该以存在受著作权法保护的作品为前提的逻辑关系。再者,人工智能的生成前提是机器学习,而在这一过程中,如果是未经版权人授权使用而进行作品训练与机器学习即面临着侵权问题。基于此,更有学者创造性地提出了“豁免训练端、管住生成端”才是规制大模型训练中使用数据的更为合理与可行的方案[15]。换言之,无论是从判断标准还是前端处理的层面来说,人工智能生成内容都应跳脱出“作品”属性去重新进行法律定位。
结合我国著作权法关于作品构成所要求的独创性标准与其他形式要件的体系性分析可见,在当前技术发展水平下,人工智能生成内容尚不具备满足上述标准的实质条件与形式特征。因此,人工智能生成内容在现阶段应被理解为一种基于大规模信息训练与算法处理的数据集合,其价值更多体现为信息资源的利用与再生,而非文学、艺术或科学作品意义上的独立原创成果。
5. 人工智能生成内容的法律定性及保护路径重构
通过前文所述,人工智能生成内容虽在形式上与人类创作相似,但其生成过程依赖算法与数据训练,缺乏著作权法意义上的“独创性”基础,难以被认定为作品。因此,对于人工智能生成内容的法律定性及保护路径应跳脱出“作品的是与否”的思维桎梏进行重构。例如,人工智能生成内容在事实层面与技术层面具备数据属性,在法律与价值层面亦具备一定的财产与经济属性,因此可探索用数据权益保护模式为人工智能生成内容提供恰如其分的法律定性与制度保障。
并且从国家政策导向的角度来看,将人工智能生成内容纳入数据权益保护范畴,不仅与人工智能生成内容的法律定性与技术特质相匹配,还与我国数据要素市场化配置改革的顶层设计高度契合。2022年国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》明确提出,应探索建立“数据资源持有权、数据加工使用权、数据产品经营权”三权分置的数据产权制度框架。该“结构性分置”改革的核心在于既突破传统所有权中心主义思维,又聚焦数据使用价值动态实现,依托数据的来源、生成过程及投入贡献等因素,在不同主体之间实现差异化、层次化的权利配置,从而促进数据要素的高效流通与多维利用。在此背景下,人工智能生成内容恰可视为该制度设计的典型适用场景。例如,人工智能生成过程依赖于开发者所提供的算法模型,这对应数据资源持有权;而用户输入的指令与人机交互行为则对应数据加工使用权;另外,人工智能技术的相关投资者和平台的运营者则与数据产品经营权相对应。目前,健全的数据确权与流通机制尚亦未完全建立,本文所提出的人工智能生成内容数据权益保护路径,并非对现行法律体系的无源创设,而是对国家数据权益制度在新兴人工智能领域的制度化延伸,不仅具有事实上的合理性还具备坚实的政策基础。期待日后的研究能够在包括但不限于以上所提及的方向持续拓展,为构建科学、合理且可持续的人工智能生成内容数据权益保护体系提供坚实的理论支撑与实践指导。
6. 结语
人工智能生成内容的法律定性问题是相关法律问题研究展开的基础性环节,而在当今时代下,生成式人工智能的本质是以机器学习为基础的算法程序,当前人工智能尚不具备人类情感与自我意识,因此讨论将人工智能视为与人类具备同等地位的创作主体去讨论人工智能生成内容的著作权问题还为时尚早。随着人工智能技术的不断演进,未来可能会出现更加逼近于人类的人工智能系统,届时人工智能生成内容的数据权益保护模式将会面临更多实践考验。因此,本文主张在人工智能非法律主体与人工智能生成内容不可版权性的基本立场下,通过构建以使用者为核心、兼顾开发者与投资者权责配置的数据权益保护机制,在保障创新激励与促进数据流通之间实现动态平衡,并为未来技术形态演进预留制度弹性与规范空间。