简介
ChatGPT和其他大型语言模型能够生成类似人类创作的文本,这引发了关于其对知识产权潜在影响的担忧。具体而言,人们会担心这些模型可能被用于制作欺诈或侵权内容,例如抄袭的文字作品或经篡改的音频或视频。此外,生成的内容有可能被冒充来自某一个人或组织,可能损害其声誉或侵犯其公共形象权。这些担忧突出表明了进一步开展研究和进行规范以解决语言模型对知识产权的潜在影响的必要性。
背景
实际上,本文简介部分的原文是由ChatGPT撰写的。正如许多人现在所知道的,ChatGPT因其具有类似人类的对话能力以及为大学生撰写整篇文章的能力而成为头条新闻。
ChatGPT是人工智能研究实验室OpenAI的测试版产品。OpenAI成立于2015年,是一家位于加利福尼亚州旧金山的公司。该公司最初由一家盈利性分支机构OpenAI LP及其母公司OpenAI Inc.组成。该公司后来被重组为一家有利润上限的“盈利性”公司,将其利润限制设定为任何投资的100倍。
虽然OpenAI的既定目标是以造福人类的方式促进和发展友好的人工智能,但现实是它也是企业的一项业务。预计到2024年,OpenAI的收入将达到10亿美元,显而易见的问题是,OpenAI是如何盈利的?部分答案可以通过查看其知识产权策略来找到,即OpenAI计划如何开发、获取和利用知识产权。
从对公开信息的粗略分析来看,OpenAI似乎正在用专利和商业秘密保护其部分技术,同时将其余部分开源。如果执行得当,那么这种方法可以支撑OpenAI的业务,并为知识产权和商业战略紧密联系提供一个很好的示例。OpenAI正在利用其知识产权创造收入(例如与微软合作),同时利用其开源内容在用户中创造商誉和良好的声誉。这种使用开放性和排他性知识产权资产的混合策略是一些人工智能公司发现的有益策略。
OpenAI的知识产权资产组合
专利资产
OpenAI目前拥有一项已颁发的美国专利和一项已公开的美国专利申请。然而,他们可能还有其他未发布的专利申请。
OpenAI已获得的专利(美国专利号11521611)涉及一种用于确定多方对话中问题的答复的方法,包括接收具有多个非结构化自然语言节点的多方对话。OpenAI的专利申请(美国专利申请号17/152338)披露了一种能够自动生成对传入的自然语言通信信息的建议性回复的设备,该设备包括一个分类器和一个生成性自然语言模型。
专利和商业秘密保护这两种资产之间的共同点是,它们撰写的目的是保护计算机实现(或人工智能实现)的过程,这些过程涉及自然语言通信信息解析或使用语言模型生成回复。这可以被认为是驱动OpenAI技术发展的“引擎”。这与语言模型和人工智能训练集不同,这二者可以被视为辅助OpenAI技术的“燃料”,更适合使用商业秘密保护。
商业秘密
虽然“OpenAI”这个名字表明该公司的信息是透明的,但事实并非如此。OpenAI可能会使用商业机密来保护其专利中未涵盖的专有信息。这是因为专利不能用于保护人工智能的某些方面。具体来说,它们不能保护数据编译,例如人工智能训练集、程序员对源代码的某种表达方式或其他可能提供竞争优势的专有信息。
商业秘密可以用来应对这一挑战。例如,OpenAI的商业秘密可能包括:训练集、数据输出和其他数据;神经网络,包括模块化网络结构和单个模块;学习、反向传播和其他算法,这些算法可以使其在竞争中获得竞争优势。
OpenAI和开源代码
OpenAI还提供了一些开源代码。例如,OpenAI的Jukebox是一种开源算法,可以生成带有人声的音乐。以开源形式提供软件可以带来商业利益,推动创新,并有助于进行更广泛的知识共享。然而,人工智能的创新者应该明白,开源软件是有限制的。虽然开源代码的软件对公众免费,但免费并不是指成本,而是指被许可方所获得的使用的自由。被作为开源代码许可的软件意味着被许可方可以使用、修改、增强和分享软件,并提供对所需源代码的访问权限。
鉴于开源软件许可的多样性,人工智能开发人员应确保他们了解那些与使用每种许可相关的权利和责任。虽然在开源软件许可下提供或使用软件有其优势,但有效的知识产权策略将确保不会披露超过要求提供的信息。
知识产权风险管理
OpenAI以及任何其他计划对基于人工智能创新采取分层方法的公司,都需要考虑与其知识产权相关的各种问题,特别是在风险管理方面。OpenAI的知识产权策略的某些要素可能无法从公开的信息中收集到,例如,OpenAI的知识产权风险识别和缓解策略。虽然这些要素可能无法确定,但如发明人/作者身份和版权侵权等问题很可能正在考虑之中。
发明人/作者
开发面向最终用户的产品的人工智能公司必须考虑谁可以保留对其产品输出的权利。例如,OpenAI的使用条款将其在输出中的所有权利、所有权和利益转让给提供输入的用户,前提是用户遵守使用条款。这可能会给OpenAI带来问题,因为在许多国家,人工智能是否可以被授予作者身份或被指定为发明人尚不明确。这也可能会对用户造成困扰,因为在许多司法管辖区,转让目前可能不包括主张或申请此类输出的专利或版权保护的能力。
而使这个问题变得更加复杂的是,其他ChatGPT用户也可能缩小转让范围。例如,OpenAI的使用条款政策指出,由于机器学习的性质,用户可能会从ChatGPT收到相同或相似的输出,因此这种转让的输出不包括呈现给其他ChatGPT用户的结果。这引发了几个问题,包括原始所有权(如果这些权利可是用的)——这种所有权可能会随着时间的推移而被削弱以及未来使用权的不明确。
版权侵权
版权侵权是人工智能开发人员应该注意的另一个问题。就目前的情况而言,如何根据版权法处理人工智能的输入和输出尚不清楚。当人工智能参与创作基于文本的作品(或艺术作品)时,它可能会使拥有人工智能的公司和/或使用人工智能的人面临因侵犯版权而被起诉的可能性。例如,基于受版权保护的材料训练的大型语言模型(如ChatGPT)可能会导致的问题是该模型在向用户提供答复时过度借鉴他人的作品。这可能会违反《版权法》规定的复制权,并导致卷入侵权诉讼。事实上,此类案件已经开始被提交至法院。例如,美国盖蒂图片社(Getty Images)已经对人工智能公司StabilityAI提起诉讼,称其人工智能艺术工具将人类创作的受版权保护的图像用于训练数据。
结论
当被问及知识产权在人工智能领域是否重要时,ChatGPT公司表示:
“是的,知识产权是人工智能领域的一个重要因素。人工智能技术通常基于复杂的算法和软件,这些算法和软件受到专利和版权的保护。通过保护知识产权,公司可以保护其人工智能发明,并阻止他人未经许可复制或使用其技术。此外,专利可以通过将技术许可给他人来创造收入。”
ChatGPT的回应没错,但如何处理商业秘密、开放源代码和知识产权风险呢?不能忽视的一个事实是,利用开源软件的基于人工智能的公司如果想要盈利,就不能泄露所有的秘密。因此,采用分层方法的知识产权策略——由公司决定哪些创新应获得专利,哪些创新应作为商业机密——具有显著的优势。
此外,以文本和艺术生成器等人工智能创新为业务的公司将希望确保能拥有一个强大且经过深思熟虑的知识产权风险缓解计划。随着法律不断进步以应对人工智能的发展,企业应定期审查其知识产权战略。现实是,知识产权无处不在,在当今的知识经济中则变得越来越有价值。保护人工智能创新也不例外。(编译自www.lexology.com)
翻译:王丹 校对:刘鹏
杭州君度专利代理事务所版权所有 浙ICP备12043267号-1