以色列司法部发布了一份重要的意见书,即根据现行的以色列版权法,版权材料可用于机器学习环境中。具体而言,以色列司法部在意见书中认为机器学习显然属于以色列《版权法》合理使用条款的范畴。因此,该意见书让世界上允许将版权作品用于机器学习和文本及数据挖掘(TDM)的国家名单又增加一员。
以色列司法部法律顾问和立法事务办公室的意见书涉及“有机器学习业务的企业可否未经授权使用受版权保护的材料来训练人工智能系统”的问题。这个问题的简要回答是肯定的。
意见书首先阐述了背景。它解释称,机器学习是使计算机能够从过去的数据中自主学习的过程。因此,它为人工智能系统提供了基础。人工智能系统的价值首先取决于机器在学习阶段被提供的材料的数量,以及这些材料的多样性和质量。根据机器要学习执行的任务,机器必须摄入的材料可能是受版权保护的作品,例如照片、文本、声音或视频。事实上,鉴于机器学习所涉及的作品数量巨大,机器学习过程几乎总是需要使用众多第三方拥有的版权作品。因此,出于机器学习目的使用版权材料的合法性对有效的人工智能系统至关重要。意见书指出,以色列作为人工智能系统的生产国在这一领域拥有领先地位,“消除围绕这一问题的版权不确定性可以刺激创新,并最大限度地提高以色列企业在机器学习和内容创作方面的竞争力。”
司法部认识到以色列的现行法律没有对机器学习使用受版权保护的材料的合法性提供明确的指导,因此提供了自己的评估。首先,意见书指出,“合理使用原则通常涵盖机器学习。”以色列的合理使用条款,即《版权法》第19条,是以美国《版权法》中的合理使用条款(《美国法典》第17编第107条)为蓝本的。该意见的合理使用分析依赖于美国法院的判决,如作家协会诉谷歌(Authors Guild v. Google)一案和美国版权学者的许多法律评论文章。意见书指出,为训练机器而创建数据库属于法律意义上的学习和研究。此外,这种使用是“变革性的”。
接下来,意见书指出,“一些机器学习项目可能属于《版权法》第22条规定的允许附带使用版权材料的条款范畴。”此外,如果版权作品在机器学习过程结束时被删除,企业可以享受《版权法》第26条规定的“短暂使用原则(doctrine of transient use)”的保护。
意见书提醒称,这些措施不适用于“完全由一个作者创作的作品组成的机器学习数据集,此类数据集的目的是在现有市场上与该作者竞争”。此外,该意见“不适用于机器学习过程的输出”。可能存在这样的情况:机器学习过程本身可能不侵权,但人工智能系统的输出会侵犯现有作品的版权。
虽然该意见对以色列法院没有约束力,但以色列版权专家认为,法院在相关案件中应用《版权法》时,会对该意见给予很大的重视。
全球范围内越来越多的法律体系允许计算机而不是直接由人类使用受版权保护作品。这方面的法律大多集中TDM方面,这往往是机器学习过程中的一个重要步骤。如上所述,该意见书依据的是作家协会诉谷歌的裁决。此案涉及建立一个包含数百万本书籍的检索数据库。此外,最近在三年一度的第1201条规则制定程序中,美国版权局注册官认为,隶属于非营利性的高等教育机构的研究人员为研究和教学目的而进行的TDM可能是一种合理使用,因为该机构使用了适当的安全措施,而且语料库的内容只能为验证目的而查看。
同样,欧盟《数字化单一市场版权指令》要求欧盟成员国对TDM采用版权例外。欧盟成员国正在实施这一指令。自2014年以来,英国对非商业研究的TDM有例外规定。经过公众咨询,英国政府于2022年宣布,它将把这一例外情况也扩大到商业用途。日本和新加坡也颁布了TDM的例外规定。
版权人士指出,以色列司法部的意见是正确的,其结论——根据版权法,机器学习系统的训练通常是被允许的——与全球其他法律体系的方法一致。该意见将为以色列的人工智能系统的发展提供必要的法律确定性。此外,该意见将为包括美国、加拿大和韩国在内的其他实施公平使用的管辖区的人工智能开发者和法院提供有益的指导。(编译自infojustice.org)
翻译:罗先群 校对:王丹
杭州君度专利代理事务所版权所有 浙ICP备12043267号-1