一、AIGC 版权归属法律争议与确权机制
1.人工智能生成物的作品属性界定
在判定人工智能生成物是否属于作品时,独创性是关键的判断标准。然而,这一标准在司法实践中存在诸多争议。从我国现行著作权法来看,作品需是文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。对于人工智能生成内容,部分具有人类作品的外观,若不加以提示,难以准确区分是人类创作还是人工智能生成。此时,就需要深入考察人工智能创作过程是否体现了人类的智慧贡献。
以我国苏州市中级人民法院在 “丰某诉东山公司侵害著作权及不正当竞争案” 为例,用户首次输入提示词由人工智能绘图软件自动生成的内容,不被认定构成作品;但如果用户通过增加提示词、修改参数等对最初生成的图片进行调整、选择和润色,对图片的布局、比例、视角、构图要素、色彩、线条等表达要素做出了个性化选择和实质性贡献,则满足作品的独创性要件。这一判决明确了人类在人工智能创作过程中发挥主导作用时,其生成内容可获得著作权法保护,为后续类似案件审理提供了重要参考。
国际上,不同国家对此观点和做法各异。美国版权局坚持作品必须是人类创作的,必须体现人的创造性,否则排除其作品资格和著作权保护。这种严格的立场,源于对传统著作权体系中 “人类创作” 核心要素的坚守,旨在维护著作权法体系的稳定性。而相对而言,我国司法界和学术界更加开放,不少法院已经判决人工智能生成内容体现了使用者的创造性,基于作品资格并进行著作权保护。这一趋势顺应了人工智能技术快速发展的现实需求,在保护创新的同时,也在探索如何平衡各方利益。在欧洲,对于人工智能生成物的著作权归属也在不断探讨和研究中,尚未形成统一的定论。欧盟部分成员国倾向于通过制定专门的法律条款,对人工智能生成内容的著作权问题进行规范,以应对法律适用的不确定性。
2.训练数据来源合法性风险
知识产权侵权隐患:AIGC 技术在数据采集中存在诸多知识产权侵权风险。例如,未经允许采集他人作品用于训练,存在著作权侵权风险。像 LAION – 5B 数据集争议,该数据集在收集过程中可能未经授权使用了大量受版权保护的图像,引发了广泛的版权争议。此类事件不仅损害了原作者的合法权益,也给使用该数据集训练模型的企业带来潜在法律风险。利用爬虫协议等底层技术绕开第三方设置的访问限制或审核要求对数据进行搜索抓取,有非法获取计算机信息系统数据、侵犯个人信息或商业秘密的风险。三星代码泄露事件就是一个典型案例,代码的非法获取和使用可能涉及到商业秘密的侵犯。这警示企业在数据采集过程中,必须严格遵守法律法规,确保数据来源的合法性。
生物特征数据合规问题:未经允许采集和使用他人声音、面部特征等生物识别数据,存在人格权侵权风险。生物特征数据具有唯一性和不可更改性,一旦泄露,将对个人权益造成严重且难以挽回的损害。企业在使用生物特征数据进行训练时,必须严格遵守相关法律法规,确保数据来源的合法性和合规性。例如,在采集用户生物特征数据前,应获得用户明确、自愿的授权,并采取严格的数据保护措施,防止数据泄露和滥用。
3.企业版权合规实践路径
企业要做好版权合规,首先应建设数据源合法性审查机制。依据《生成式人工智能服务安全基本要求》,企业在模型训练和内容生成过程中,要使用具有合法来源的数据和基础模型。可以设计语料授权协议,明确数据提供者和使用者的权利义务,确保数据的使用获得合法授权。在制定协议时,应详细规定数据的使用范围、使用方式、保密义务等条款,避免出现模糊不清的表述,以降低法律风险。
同时,应用区块链溯源技术,对数据的来源、使用和流转进行全程记录,实现数据的可追溯性,有效防范版权侵权风险。例如,通过区块链技术记录每一次数据的采集、处理和使用情况,一旦出现版权纠纷,可以快速准确地查明数据的来源和使用情况。区块链技术的不可篡改和去中心化特性,为数据溯源提供了可靠保障,有助于提高版权纠纷解决的效率和公正性。
此外,还应推动标注规则的标准化。对生成或者编辑的信息内容在合理位置、区域进行显著标识,明确内容的生成方式和来源,做到有效防范企业的知识产权侵权风险。通过标准化的标注规则,不仅可以提高企业的合规性,也有助于用户更好地识别和使用 AIGC 生成的内容。企业可以参考行业标准和相关法律法规,制定适合自身业务的标注规范,并在实际运营中严格执行。