生成式AI训练数据的著作权侵权规制路径
Regulatory Approaches to Copyright Infringement in Generative AI Training Data
摘要: 生成式AI发展离不开海量高质量训练数据,其数据获取与使用常涉及受著作权保护的作品,引发产业发展与著作权保护的突出矛盾。现行授权许可、合理使用、法定许可等著作权规制路径存在实操困难、场景适配不足、机制僵化等局限,难以应对相关问题。准法定许可制度通过公告异议、默示同意、合理付酬的设计,兼顾AI开发者授权成本与著作权人合法权益,契合知识产权制度本质与国家发展战略,且有立法先例与技术支撑,具备可行性。构建该制度需明确权利义务、规范程序、完善配套,实现技术创新与权利保护的平衡,为生成式AI产业健康发展提供法治保障。
Abstract: The development of generative AI is inextricably linked to massive volumes of high-quality training data. However, the acquisition and utilization of such data frequently involve copyright-protected works, triggering a prominent conflict between industry development and copyright protection. Current copyright regulatory frameworks—such as authorized licensing, fair use, and statutory licensing—suffer from limitations including practical operational difficulties, insufficient adaptability to varying scenarios, and rigid mechanisms, making them inadequate for addressing these emerging challenges. A quasi-statutory licensing system, designed around mechanisms of public notice and objection, implied consent, and reasonable remuneration, effectively balances the licensing costs for AI developers with the legitimate rights and interests of copyright owners. This approach aligns with the fundamental principles of the intellectual property system and national development strategies. Supported by legislative precedents and technical feasibility, it represents a viable solution. Establishing this system requires clarifying rights and obligations, standardizing procedures, and perfecting supporting mechanisms to achieve a balance between technological innovation and rights protection, thereby providing robust legal safeguards for the healthy development of the generative AI industry.
文章引用:赵悦. 生成式AI训练数据的著作权侵权规制路径[J]. 法学, 2026, 14(5): 128-137. https://doi.org/10.12677/ojls.2026.145142

参考文献

[1] 康骁. 行政法如何应对生成式人工智能——基于算法、训练数据和内容的考察[J]. 云南社会科学, 2024(4): 80-88.
[2] 吴汉东. 人工智能生成作品的著作权法之问[J]. 中外法学, 2020, 32(3): 653-673.
[3] 游涛, 计莉卉. 使用网络爬虫获取数据行为的刑事责任认定——以“晟品公司”非法获取计算机信息系统数据罪为视角[J]. 法律适用, 2019(10): 3-10.
[4] 张吉豫, 汪赛飞. 大模型数据训练中的著作权合理使用研究[J]. 华东政法大学学报, 2024, 27(4): 20-33.
[5] 王健, 吴宗泽. 生成式人工智能反垄断论纲[J]. 法治研究, 2024(6): 130-147.
[6] 孙济民. 从合理使用到合理学习: 人工智能训练数据的著作权困境与规范重构[J]. 中国法律评论, 2025(5): 52-65.
[7] 张伟君. 论大模型训练中使用数据的著作权规制路径[J]. 东方法学, 2025(2): 79-92.
[8] 韩雨潇. 人工智能大模型训练数据的版权风险与化解路径[J]. 中国出版, 2025(2): 54-59.
[9] 黄孟苏. AI大模型训练数据的版权风险与治理路径[J]. 湖北大学学报(哲学社会科学版), 2025, 52(5): 185-193.
[10] 张平. 人工智能生成内容著作权合法性的制度难题及其解决路径[J]. 法律科学(西北政法大学学报), 2024, 42(3): 18-31.
[11] 戴文怡, 肖冬梅. 生成式人工智能训练数据的著作权法因应: 著作权合规方案[J]. 图书情报知识, 2025, 42(1): 89-100.
[12] 魏丽丽. 生成式人工智能数据训练中著作权限制制度的适用选择[J]. 政法论丛, 2025(5): 159-172.
[13] 刘一帆. 生成式人工智能数据训练行为的著作权困境与出路[J]. 江海学刊, 2025(4): 182-189+256.
[14] 任保平, 郭晗. 新科技革命背景下形成新质生产力的战略逻辑与实践路径[J]. 商业经济与管理, 2024(8): 21-29.
[15] 王文敏. 人工智能对著作权限制与例外规则的挑战与应对[J]. 法律适用, 2022(11): 152-162.
[16] 陈锐, 江奕辉. 生成式AI的治理研究: 以ChatGPT为例[J]. 科学学研究, 2024, 42(1): 21-30.
[17] 陈雨悦, 李军. 生成式人工智能数据训练的著作权困境及其对策[J]. 时代法学, 2025, 23(1): 58-79.
[18] 张涛. 生成式人工智能训练数据集的法律风险与包容审慎规制[J]. 比较法研究, 2024(4): 86-103.
[19] 李杨. 著作权侵权认定中的转换性使用理论适用阐释[J]. 北方法学, 2023, 17(3): 42-56.
[20] 姚志伟, 黄丹敏. 人工智能训练中作品的合理使用问题[J]. 西安交通大学学报(社会科学版), 2025, 45(6): 121-130.
[21] 侯玉玲. 图书馆开展网络扶贫服务思考——以《信息网络传播权保护条例》第九条为依据[J]. 图书馆研究, 2015, 45(6): 82-85.
[22] 赵立冬. 合理使用还是法定许可? 生成式人工智能训练数据著作权规制例外路径研究[J/OL]. 图书馆建设, 1-15.
https://link.cnki.net/urlid/23.1331.G2.20250917.1316.002, 2026-03-28.