生成式人工智能训练中直播数据利用的著作权规制研究
Research on Copyright Regulation of the Use of Live Streaming Data in Generative Artificial Intelligence Training
摘要: 生成式人工智能的训练需要海量的数据,而网络直播数据作为其中的重要组成部分,便逐渐成为了训练重要的数据来源之一。此类数据通常同时具备视听作品等多重作品属性,而人工智能训练过程中不可避免的数据复制与处理行为,现实中极有可能落入著作权专有权的控制范围,从而引发侵权风险。现行合理使用制度因依赖个案裁量、对市场替代效应敏感且难以适用于大规模商业化利用,无法为AI训练提供稳定合规基础。在此背景下,引入法定许可制度被认为是一种更具制度可行性的解决路径,其允许AI开发者在支付合理报酬的前提下使用数据,并通过集体管理组织整合权利主体、设计差异化版税分配机制,以期在降低交易成本、避免“反公地悲剧”的同时,保障权利人的获酬权,实现技术创新与知识产权保护之间的平衡。
Abstract: The training of generative artificial intelligence requires massive amounts of data, among which online live streaming data has gradually become an important data source. Such data often possesses multiple layers of copyright-protected attributes, including those of audiovisual works. During the process of AI training, the unavoidable acts of data copying and processing are highly likely to fall within the scope of exclusive rights under copyright law, thereby giving rise to significant risks of infringement. The existing fair use doctrine, due to its reliance on case-by-case judicial discretion, sensitivity to market substitution effects, and limited adaptability to large-scale commercial data utilization, fails to provide a stable and predictable legal basis for AI training activities. Against this backdrop, the introduction of a statutory licensing regime has been proposed as a more institutionally viable solution. Under this framework, AI developers are permitted to use copyrighted data upon payment of reasonable remuneration, while collective management organizations are employed to consolidate fragmented rights and design differentiated royalty distribution mechanisms. Such an approach aims to reduce transaction costs, avoid the “anticommons tragedy”, safeguard the remuneration rights of copyright holders, and ultimately achieve a balance between technological innovation and intellectual property protection.
文章引用:徐沐阳, 李想, 冯璐雯, 慕译家. 生成式人工智能训练中直播数据利用的著作权规制研究[J]. 电子商务评论, 2026, 15(3): 718-726. https://doi.org/10.12677/ecl.2026.153327

参考文献

[1] 陶乾. 基础模型训练的著作权问题: 理论澄清与规则适用[J]. 政法论坛, 2024, 42(5): 152-164.
[2] Geiger, C., Frosio, G. and Bulayenko, O. (2018) Text and Data Mining in the Proposed Copyright Reform: Making the EU Ready for an Age of Big Data? Legal Analysis and Policy Recommendations. IIC-International Review of Intellectual Property and Competition Law, 49, 814-844. [Google Scholar] [CrossRef
[3] 魏丽丽. 生成式人工智能数据训练中著作权限制制度的适用选择[J]. 政法论丛, 2025(5): 159-172.
[4] Calabresi, G. and Melamed, A.D. (2013) Property Rules, Liability Rules, and Inalienability: One View of the Cathedral. In: Modern Understandings of Liberty and Property, Routledge, 139-178.
[5] 孙昊亮. 论视频的分类与独创性认定[J]. 法律科学(西北政法大学学报), 2024, 42(6): 36-48.
[6] 何渊, 周琴生, 周长福, 等. 网络游戏直播画面著作权归属问题研究[J]. 河南科技, 2022, 41(12): 155-158.
[7] 林汶欣. 类型化视角下网络游戏直播画面的著作权归属问题[J]. 法学, 2023, 11(6): 5425-5430. [Google Scholar] [CrossRef
[8] 韩思宇. 虚拟数字人表演的著作权保护问题研究[J]. 争议解决, 2024, 10(6): 163-169. [Google Scholar] [CrossRef
[9] 薛佳. 新媒体场域用户弹幕可版权性研究——以Bilibili网站为例[J]. 河南科技, 2023, 42(5): 120-124.
[10] 周啸. 生成式AI数据使用中的著作权侵权风险研究[J]. 法学, 2024, 12(5): 3261-3267. [Google Scholar] [CrossRef
[11] 刘晓春. 生成式人工智能数据训练中的“非作品性使用”及其合法性证成[J]. 法学论坛, 2024, 39(3): 67-78.
[12] Triaille, J.-P. (2014) Study on the Legal Framework of Text and Data Mining (TDM).
[13] [匈]米哈依·菲彻尔. 版权法与因特网[M]. 郭寿康, 万勇, 相靖, 译. 北京: 中国大百科全书出版社, 2009: 650-651.
[14] 焦和平, 李泽僖. 合理界定数据训练中使用作品的行为[N]. 中国知识产权报, 2025-02-20(03).
[15] 王果, 曹梓怡. 我国著作权合理使用的认定困境与规则完善——基于142份判决的分析[J]. 重庆邮电大学学报(社会科学版), 2025, 37(2): 76-84.
[16] 黄荣楠, 刘佳迪, 赵怡青. 再议AIGC “版权合理使用例外”: 美国Anthropic案解读[EB/OL]. 2025-07-03.
https://www.junhe.com/legal-updates/2727, 2026-01-06.
[17] 王玉琪. 合理使用要素分析在司法实践中的适用与反思[J]. 社会科学前沿, 2024, 13(5): 367-373. [Google Scholar] [CrossRef
[18] 黄炜杰. 论著作权合理使用规则的优化——基于界权成本的有效配置[J]. 学术研究, 2024(10): 67-72.
[19] Didsbury, H. and Zhu, X.A. (2025) Transformative Training: An Analysis of AI Training Data and Fair Use in Authors Guild v. OpenAI Inc. Publishing Research, 4, e002. [Google Scholar] [CrossRef
[20] 陈艺. 用户生成内容中的反公地悲剧及其应对[J]. 暨南学报(哲学社会科学版), 2024, 46(11): 74-88.
[21] 万勇. 人工智能时代著作权法合理使用制度的困境与出路[J]. 社会科学辑刊, 2021(5): 93-102.
[22] 孙新强, 姜荣. 著作权延伸性集体管理制度的中国化构建——以比较法为视角[J]. 法学杂志, 2018, 39(2): 34-42.
[23] 梁远高. 论人工智能大模型训练数据风险的分层规制[J]. 郑州大学学报(哲学社会科学版), 2025, 58(3): 61-67+144.
[24] 孙山, 曾翊展. 从“分散许可”到“集中治理”: 法定许可制度因应人工智能训练行为的优化方案[J]. 科技与出版, 2025(10): 105-118.
[25] 汤广花. 人工智能时代版权保护三大难题如何破解? [N]. 中国新闻出版广电报, 2025-07-17(005).