关注生成式人工智能发展中的著作权问题

2024-12-06 15:08

生成式人工智能的迅速发展依托于涵盖大量著作权客体的大数据资源，如既有作品等，以满足其数据训练需求。这种对他人作品的广泛且持续的使用行为，会以人工智能生成物的形式通过网络输出呈现。在推动生成式人工智能良性高效发展的同时，如何维护著作权法框架下权利人的合法权益，行政、司法机关已在积极探索。依据著作权法规定，生成式人工智能对他人作品等著作权客体的使用主要集中在信息网络传播权等相关权项，人工智能服务提供者需在取得授权的情况下开展数据训练等活动，以避免因人工智能产品投入市场后遭集中批量维权而影响其正常业务发展。

2022年11月，OpenAI推出的ChatGPT引发了人工智能迈向大模型时代的浪潮。生成式人工智能开始深入人们的日常生活，在带来便利的同时，也可能改变人类成果的权益划分和收益分配规则。由此，人工智能引发的各类法律争议接踵而至，著作权纠纷成为焦点。

一、人工智能引发著作权纠纷的相关背景

国内，北京互联网法院和广州互联网法院分别判决了首例“AI文生图”和“生成式AI服务”著作权纠纷案，引发学界、业界广泛热议，最高人民法院也对首例“AI文生图”案的著作权保护路径进行了评价。国内诉讼纠纷主要集中在人工智能生成物的客体性质及提供人工智能生成物行为的侵权责任层面。

近期，美国多家报纸媒体起诉OpenAI和微软，国外也有多幅漫画或图像因缺乏人的创作性贡献而被拒绝作为作品登记且得到法院支持。相关争议聚焦于人工智能大模型数据训练的著作权保护等问题。

人工智能是技术和数据的集合产物，其利用已有数据寻找规律并生成相关内容，其中数据训练是利用已有数据寻找规律的主要过程。现阶段国内外的争议反映了人工智能的两类焦点问题：一是输入端问题，即根据人工智能生成物认定人工智能服务提供者在数据训练中未经许可使用他人作品及法律责任；二是输出端问题，即人工智能生成物能否成为著作权法保护的作品等权利客体及权利主体的认定。

二、人工智能数据训练涉及的著作权问题

发展优化人工智能，尤其是生成式人工智能，需要大量数据进行数据训练，这不可避免地会使用他人已发表作品等公开的权利客体。在训练阶段使用他人作品，若未进入应用阶段，他人难以知晓。但人工智能不能仅停留在训练阶段，而应进入应用领域，通过用户的广泛使用来完善数据训练。如ChatGPT的用户协议中约定，用户输入的内容将作为学习文本数据之一。

（一）从人工智能生成物看数据训练行为

若人工智能产品将推向市场，人工智能服务提供者一般应取得训练阶段所使用他人作品的授权，尽管目前人工智能尚未达到极高水平。按照著作权法“先授权后使用”的理论，不能因权利人不知作品被使用而使人工智能服务提供者无需取得授权。然而，数据训练过程中对作品的使用具有“黑盒”性质，往往只能通过人工智能生成物的表现形态来主张数据训练过程中可能影响的著作权权项。实践中，此类争议多发生在用户使用人工智能产品获得生成物后，权利人发现生成物中体现其权利客体内容。若生成物能完整体现他人作品表达或受保护的权利客体内容，权利人可能提出侵权主张，反之则举证困难。若未利用他人著作权作品生成类似风格作品，原则上不构成侵权。在未来的强人工智能时代，当前的问题或将迎刃而解，但目前人工智能尚未脱离人的自主意识阶段，通过人工智能生成物探讨数据训练相关的著作权问题仍具意义。

（二）因人工智能数据训练可能引发的著作权侵权责任

1. 人工智能训练数据是否构成对著作权权利客体的使用

使用大量已有数据进行数据训练是人工智能完成内容智能合成的必要条件，此过程可能涉及对作品、制品的多个著作权权项的侵权行为。我国及欧盟的相关法规都规定了人工智能服务提供者应依法开展训练数据处理活动，不得侵害他人知识产权。

（1）复制权

复制权是著作权人之经济权利的核心，但人工智能数据训练过程中的数据存储情形是否构成复制权侵害存在争议。实践中，作品的复制行为常与其他使用行为结合，而人工智能数据训练过程中的收集、存储作品行为，除有数据存储情形涉及复制行为可能侵害复制权外，一般不认为会侵害复制权。

（2）表演权和表演者权

人工智能训练数据使用他人作品并非公开表演，且数据训练过程不具备公开性，一般不会涉及表演权和除“许可他人通过信息网络传播其表演”外的表演者权其他权项。

（3）广播权

广播权强调实时性，与人工智能数据训练的使用情形差异较大。

（4）信息网络传播权

当前人工智能产品以互动聊天方式提供生成物，若生成物中出现他人享有信息网络传播权的客体，可推定人工智能服务提供者将他人受保护客体用于数据训练，信息网络传播权纠纷可能是人工智能数据训练面临的主要著作权问题。

（5）改编权等

若人工智能生成物是对他人作品的改编，可推定人工智能服务提供者在数据训练中使用了他人作品。人工智能服务提供者进行数据训练时，应根据客体类型取得相应权利，如信息网络传播权、改编权等。若发现侵权，权利人可根据具体使用情节维权，情节严重的可提出惩罚性赔偿请求。

2. 人工智能数据训练对他人著作权客体的使用是否构成合理使用

著作权合理使用需满足“不得影响该作品的正常使用，也不得不合理地损害著作权人的合法权益”的基本要件，并列举了12项典型情形。人工智能数据训练过程中对作品的使用一般不属于著作权法规定具体权项所涵盖的行为范畴，若他人作品等著作权客体出现在人工智能生成物中，被认定为合理使用的难度较大，我国法院在司法实践中也极少适用美国法中的“转换性使用”等理论作出裁判。

3. 人工智能服务提供者取得权利主体的授权能否解决人工智能数据训练可能产生的侵权责任

我国及美国、欧盟等出台的规范性文件对人工智能数据训练中的来源数据提出要求，实践中，不少企业已意识到需与权利人订立合同取得授权以降低侵权风险。首先，取得授权可降低侵权风险，人工智能的可持续发展需建立在各方权利有序、边界清晰、利益分配合理的基础上。其次，人工智能服务提供者应根据具体使用场景等需求与相关权利主体订立许可使用合同，解决著作权问题。再次，当前人工智能服务提供者大多将人工智能生成物的权利让渡给用户，但这并不意味着人工智能服务提供者无需为使用他人作品的行为承担责任。最后，著作权客体权利人在向人工智能服务提供者授权时，需注意转授权权利及授权范围，人工智能服务提供者也应谨慎审查授权范围等效力。

三、人工智能生成物的客体性质及权利主体

（一）人工智能生成物能否作为著作权法的权利客体

人工智能生成物的客体性质及权利主体问题是当前司法实践和学者探讨的重点。不同案例的判决结果和审判思路存在差异，学者们也形成了不同观点。目前，我国对人工智能生成物的客体性质尚无明确立法或政策规定，仍需在个案中具体审理判断。考虑现阶段人工智能发展水平，按照“AI文生图”案判决，人工智能生成物因用户提供提示词的作用而属于人的创作，可构成作品。

（二）人工智能生成物客体性质差异对著作权权利主体的影响

国内司法实践中对人工智能生成物是否构成作品的认定存在差异。一方面，不论人工智能生成物的客体性质如何，其中所体现的他人权利客体不受影响。另一方面，对人工智能生成物客体性质的认定差异，会影响权利人选择维权对象。若生成物不构成作品，维权对象仅有人工智能服务提供者；若构成作品，维权对象还包括用户。在人工智能服务提供者和用户合一的情况下，则不存在区别对待的问题。

四、小结

国务院将人工智能发展列入国家战略，我国人工智能进入快速发展阶段，其中数据训练成效是关键因素之一。用于数据训练的数据集合包含大量他人享有著作权的权利客体，人工智能的发展应在现有法律框架下合法取得数据并进行训练，以实现高效、持续、良性发展。

推荐资讯