在纽约联邦地区法院提起的一连串备受瞩目的诉讼将对人工智能研究公司ChatGPT和其他人工智能产品的未来提出考验,如果它们没有使用大量受版权保护的人类作品,那么这些产品也不会有如此强大的功能。
但是,人工智能聊天机器人——在本案中,OpenAI及其商业合作伙伴微软公司(Microsoft)制造的广泛商业化产品——是否违反了版权法和公平竞争法?专业作家和媒体机构要想在法庭上获胜,将面临着一场艰难的斗争。
曾经为学术出版巨头约翰.威利父子公司(John Wiley & Sons)工作的版权律师阿诗玛.阿格瓦尔(Ashima Aggarwal)表示:“我很想代表作者保持乐观,但我却做不到。我只能认为在这里他们将面临一场艰难的斗争。”
其中一起诉讼来自《纽约时报》。另一起诉讼来自知名小说家群体,如约翰.格里沙姆(John Grisham)、乔迪.皮考特(Jodi Picoult)和乔治.马丁(George R.R. Martin)。还有一起诉讼来自畅销非小说类作家,包括普利策奖获奖传记的作者,热门电影《奥本海默》就是根据该传记改编的。
OpenAI面临的多起诉讼
非小说类作家的代理律师贾斯汀.尼尔森(Justin Nelson)表示,每起诉讼都提出了不同的指控,但它们指向的都是总部位于旧金山的OpenAI公司“在他人的知识产权基础上打造了其产品”。尼尔森的律师事务所也代表了《纽约时报》。
尼尔森说:“OpenAI的意思是,他们可以随意获取任何人的知识产权,只要这些知识产权在互联网上存在。”
《纽约时报》于12月提起了诉讼,该媒体认为ChatGPT和微软公司的人工智能产品Copilot正在与它们所培训的同一家媒体竞争,并将网络流量从报纸和其他版权所有人那里分流出去,而这些版权所有人是依靠从其网站上获得的广告收入来继续制作新闻的。它还提供了聊天机器人逐字逐句地写出《纽约时报》文章的证据。还有一些时候,聊天机器人将错误的信息虚假地归咎于该媒体,从而使其声誉受到损害。
到目前为止,资深的美国联邦地区法院法官西德尼.斯坦因(Sidney H. Stein)正在主持审理这三起案件以及不久前由另外两名非小说类作家提起的第四起案件。斯坦因自1995年被时任总统比尔.克林顿(Bill Clinton)提名以来一直在曼哈顿法院工作。
应对措施
OpenAI和微软公司尚未就纽约的案件提出正式的反驳意见,但OpenAI发表了一份公开声明,称《纽约时报》的诉讼“毫无根据”,并表示聊天机器人逐字逐句转述某些文章的能力是一个“罕见的错误”。
OpenAI在一篇博客中写道:“使用公开的互联网材料训练人工智能模型是合理使用,这一点得到了长期存在和并被广泛接受的先例支持。”它接着表示,《纽约时报》“要么指示模型进行逐字逐句转述,要么从许多尝试中挑选出他们想要的例子”。
该公司引用了去年与美联社、德国媒体公司Axel Springer和其他组织达成的许可协议,其中显示了该公司是如何努力支持健康的新闻生态系统。OpenAI正在支付一笔尚未公开的费用以获得美联社的新闻报道档案许可。《纽约时报》在决定起诉之前也进行了类似的谈判。
该公司曾在今年早些时候表示,访问美联社的“高质量事实文本档案”将提高其人工智能系统的能力。但其最近的博文淡化了新闻内容对人工智能训练的重要性,认为大型语言模型是从“巨大的人类知识集合”中学习的,并且“任何单一数据源——包括《纽约时报》——对模型的预期学习都没有意义。”
谁将胜出?
人工智能领域的大部分论据都基于美国版权法的“合理使用”原则,该原则允许对受版权保护的材料进行有限度的使用,例如用于教学、研究或将受版权保护的作品转换为不同的内容。
代表《纽约时报》的法律团队作出了回应,OpenAI和微软公司的所作所为“无论从哪个角度来看都不属于合理使用”,因为他们正在利用该媒体在新闻方面的投资,“在未经许可或未付费的情况下打造替代产品”。
到目前为止,法院在解释版权法应如何对待人工智能系统时,基本上都会站在科技公司一边。2023年,旧金山的一名联邦地区法院法官驳回了针对人工智能图像生成器的第一起大型诉讼。另一位加州地区法院法官驳回了喜剧演员莎拉.西尔弗曼(Sarah Silverman)的关于Facebook母公司Meta公司侵犯其回忆录的文字以建立人工智能模型的论点。
尽管最近的诉讼提供了更详细的证据来证明所谓的伤害,但阿格瓦尔表示,当涉及到使用受版权保护的内容来训练人工智能系统,并将其中的“一小部分内容提供给用户时,法院似乎并不倾向于认定这是侵犯版权的行为”。
科技公司将谷歌成功击退对在线图书馆的法律挑战作为先例。2016年,美国最高法院维持了下级法院的裁决,驳回了作者关于谷歌将数百万本书数字化并向公众展示其中的片段构成侵犯版权的主张。
但是,荷兰公司Wolters Kluwer的高管凯西.沃尔夫(Cathy Wolfe)认为,法官会根据具体案件解释合理使用的论点,而且“实际上是非常依赖于事实的”,这取决于经济影响和其他因素。沃尔夫也是美国版权清算中心的董事会成员,该中心负责协助美国印刷和数字媒体许可的谈判。
沃尔夫称:“仅仅因为某些内容在互联网上、在网站上是免费的,并不意味着你可以复制它并通过电子邮件发送它,更不用说用它来开展商业活动了。谁会赢得诉讼,我并不清楚,但我肯定为我们所有人提供版权保护。这样才能推动创新。”
法庭之外的呼声
一些媒体和其他内容创作者将目光投向了法庭之外,呼吁立法者或美国版权局加强人工智能时代的版权保护。美国参议院司法委员会的一个分委会将于近期在一场专门讨论人工智能对新闻界影响的听证会上听取媒体高管和版权拥护者的证词。
康泰纳仕(Conde Nast)杂志的首席执行官罗杰.林奇(Roger Lynch)计划告知参议员们,生成式人工智能公司“正在利用被盗的知识产权来构建替代性工具”。
林奇准备好的发言稿上写道:“我们认为,对立法的修复可能很简单——澄清将受版权保护的内容与商业生成式人工智能结合使用不是合理使用,需要获得许可。”(编译自www.usnews.com)
翻译:王丹 校对:吴娴
杭州君度专利代理事务所版权所有 浙ICP备12043267号-1