DeepSeek来了!人工智能知识产权法律保护须强化
2025年1月28日,深度探索DeepSeek发布,在世界产生巨大反响,DeepSeek在知识问答、长文本处理、代码生成和数学能力等方面达到顶尖水平,实现中国人工智能技术的突破性进展,开源大模型对全球人工智能产业格局产生深远影响。当前,以大模型为代表的人工智能飞速发展实现了从“复制”到“创造”的跨越,对现有创作模式产生颠覆性的变化,对知识产权法律保护带来前所未有的机遇与挑战。近年来,《生成式人工智能服务管理暂行办法》《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》等法规颁布,其目的是预防技术滥用带来的各类安全风险,确保技术创新发展符合知识产权规范,防止滥用,预防风险。在科技创新和新质生产力发展的新时期,强化法律监管和创新司法实践是预防知识产权带来的法律合规风险的有效手段,是促进人工智能安全可靠发展的制度保障。
开展模型训练的合理使用
生成式人工智能全生命周期主要阶段包括模型训练、应用运行和模型优化等阶段,涉及开发者、服务提供者、服务使用者等多方主体。模型训练阶段涉及大量数据收集、数据清洗、分词后用于模型训练和验证。生成式人工智能的数据来源主要分为两个部分:第一部分为生成式人工智能的训练数据库,内容几乎涵盖所有能收集到的人类数字化信息,包括公共数据、网络信息、数字化图书、自媒体对话数据集、报纸杂志、科学论文等,可能遭遇知识产权瓶颈;第二部分为生成式人工智能在服务用户的过程中所收集和输出的信息,也就是人工智能合成数据收集,可以减少知识产权风险。生成式人工智能的治理应顺应技术发展给社会生产带来的变化,改变原有的“技术支持者—服务提供者—内容生产者”的监管体系,构建“基础模型—专业模型—服务应用”的生成式人工智能分层治理体系。
从输入端看,训练数据来源的合法合规问题十分突出,生成式人工智能需要进行海量的阅读和摄取,在海量数据的摄取过程中,包括爬虫技术无法识别抓取内容的著作权问题,已经成为生成式人工智能合规发展中制约性的难题。《生成式人工智能服务管理暂行办法》规定:“生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;不得侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。”该条款的主要目的是规范生成式人工智能服务提供者数据来源的合法性问题,如果数据来源不合法不合规,该产品将无法进入市场应用阶段。从输出端来看,终端用户、模型提供者的生成内容是否拥有著作权,人工智能服务的提供者生成的内容是否侵权,都是法律监管和司法实践中面临的难点问题。
在大模型产业快速发展和应用的过程中,围绕创作激励与产业发展的作品使用行为性质面临诸多争议,目前已发生多起作者、版权方针对生成式人工智能模型训练过程中未经授权的作品使用行为提起诉讼。近期,四位绘画创作者将某社交平台诉至法院,诉称其未经授权使用了原告的原创作品作为训练数据,从而生成与原作高度相似的图片,侵犯其创作者的合法权益,目前案件仍在审理中。去年广州互联网法院开庭审理并一审判决被称为“全球AIGC平台侵权第一案”。原告发现被告经营的网站具有AI对话及AI绘画功能,其生成的奥特曼形象与原告公司获得独占性授权以及独立维权权利的奥特曼形象构成实质性相似,遂向法院提起诉讼,争议焦点是人工智能生成内容的著作权定性问题及应用中对作品使用的合法性问题。广州互联网法院最终认定,网络平台作为生成式人工智能服务提供者未尽合理注意义务,未采取措施避免侵权行为,违反了《生成式人工智能服务管理暂行办法》《互联网信息服务深度合成管理规定》。被告AI公司未经许可,复制了案涉奥特曼作品,构成直接侵犯奥特曼著作权的复制权;上述行为构成对案涉奥特曼作品的改编,且被告未经许可,改编了案涉奥特曼作品,侵犯了原告对案涉奥特曼作品的改编权,并责令其停止侵权行为,赔偿原告经济损失。该案例的重要性在于确立了网络平台作为人工智能服务提供者的责任边界,在司法上落实了《生成式人工智能服务管理暂行办法》《互联网信息服务深度合成管理规定》的合规要求。
人工智能生成内容的著作权问题
《民法典》规定网络服务提供者责任承担的一般原则,即网络服务提供者无须为用户利用网络服务的侵权行为承担责任,但对于其知道或应当知道的网络用户侵权行为应及时采取必要措施以避免损害扩大。在人工智能面向终端用户提供服务的场景下,生成内容是算法自身基于对人工智能服务使用者输入内容的理解,通过算法生成的方式完成。由于人工智能需要利用现有作品进行模型训练,通过依赖训练作品形成的算法模型产生人工智能生成内容,不可避免的携带训练作品的记忆或痕迹,可能呈现出训练作品的某些元素、特征、风格等。如果人工智能生成内容与训练作品在表达上构成实质性相似状况,则可能存在侵权风险。目前我国《著作权法》中著作权属主体不包括人工智能模型,因此人工智能模型本身是否能够成为《著作权法》保护的主体存在争议。在当下的司法实务中,通常是由生成式人工智能的使用者向法院请求著作权保护的方式进行维权。北京互联网法院近期针对人工智能生成图片作品(AI绘画图片)著作权侵权纠纷作出一审判决,认定人工智能生成的图片作品体现了原告的智力投入,具备“智力成果”要件和“独创性”要件,应当认定为作品,受《著作权法》保护,体现了人工智能绘画作品保护的司法创新。人类大量投入研发、优化的人工智能算法生成的内容应当被认定为满足“创造性”的要求。法院认可自然人对其利用人工智能绘画大模型生成图片在符合一定条件下享有知识产权,有利于保护和强化人在人工智能产业发展中的主导地位,鼓励人们使用人工智能软件创作更多高质量作品,促进新技术、新业态的健康发展。该判决填补了人工智能技术快速发展导致《著作权法》保护滞后的空白。
利用海量的数据进行深度学习、训练并调用,很可能涉及他人仍在著作权保护期内的作品。《生成式人工智能服务管理暂行办法》明确规定,生成式人工智能开展训练数据处理活动应当使用合法来源的数据,不得侵害他人知识产权。如果生成式人工智能深度学习、训练、调用的数据中,涉及他人仍在著作权保护期内的作品,或者有他人公开的具有竞争利益的数据或者素材,但未经他人特别授权的,是否会构成侵权或者不正当竞争?根据《著作权法》第五十二条的规定,剽窃他人作品的,“未经著作权人许可,以改编、翻译、注释等方式使用作品的(本法另有规定的除外)”,均构成对他人著作权的侵权行为,应依法承担侵权民事责任。所以,生成式人工智能服务提供者通过其人工智能生成并输出的内容,与他人仍在著作权保护期内的在先公开作品构成实质性相似的,只要未经著作权人许可,应当构成对他人著作权的侵犯,承担侵权责任。