几秒即可生成歌曲，Suno和Udio因版权争议被三大唱片公司起诉

DeepTech深科技

2024-06-28 17:36DeepTech深科技官方账号

全文4355字，阅读约需13分钟，帮我划重点

划重点

01人工智能音乐初创公司Suno和Udio因版权争议被索尼音乐、华纳音乐和环球音乐起诉，指控其在训练数据中大量使用受版权保护的音乐。

02Udio和Suno分别发表声明，称努力确保模型不会模仿受版权保护的作品，但均未具体说明训练数据中是否包含这些作品。

03专家表示，音乐版权远比电影、图像和文字版权更为集中，三大唱片公司拥有1000多万首歌曲和20世纪大部分音乐的版权。

04然而，人工智能生成音乐的风险比图像生成工具或聊天机器人更高，因为受版权保护的音乐较少且受众较小。

05如果法院裁定人工智能音乐公司不能在唱片公司的音乐上免费训练，昂贵的许可协议将成为唯一出路。

由腾讯混元大模型提供技术支持

人工智能音乐突然迎来了生死时刻。6 月 24 日，Suno 和 Udio 这两家领先的人工智能音乐初创公司被三大唱片公司起诉，这两家公司开发的工具可以在几秒钟内根据提示生成完整的歌曲。

索尼音乐、华纳音乐和环球音乐声称，这些初创公司在训练数据中“以几乎难以想象的规模”使用了受版权保护的音乐，使人工智能模型能够生成“模仿真实人类唱片质量”的歌曲。

两天后，英国《金融时报》报道称，YouTube 正在采取一种相对光明正大的做法。

据报道，YouTube 没有在秘密数据集上训练人工智能音乐模型，而是考虑向顶级唱片公司缴纳（未披露的）一次性费用，以换取使用其版权作品进行训练的许可。

作为对诉讼的回应，Suno 和 Udio 都发表了声明，称其在努力确保自己的模型不会模仿受版权保护的作品，但两家公司都没有具体说明它们的训练数据集中是否包含这些作品。

Udio 表示，其模型“已经‘听过’了大量音乐，并从中学习”。

在被起诉前两周，Suno 的 CEO 迈克·舒尔曼（Mikey Shulman）告诉我，其训练数据集“既符合行业标准，也是合法的”，但具体的信息不能透露。

虽然情况变化很快，但这些举措并不出乎意料：以诉讼为起点的“训练数据战争”已经是生成式人工智能公司必须面对的挑战。

这一趋势导致包括 OpenAI 在内的许多公司一边要应对诉讼，一边还要为数据许可协议付费。

（来源：COURTESY SUNO.AI）

然而，人工智能生成音乐的风险比图像生成工具或聊天机器人更高。针对文字或照片的生成式人工智能公司可以有办法绕过诉讼。

例如，他们可以用不受版权限制的文本来训练模型。相比之下，不受版权保护的音乐要少得多，而且受众较小。

其他人工智能公司也可以更容易地与感兴趣的出版商和创作者达成授权协议，可选的范围很宽。

但业内专家表示，音乐版权远比电影、图像和文字版权更为集中。

音乐版权主要由三大唱片公司管理，也就是开头提到的三家原告。这三家唱片公司的出版部门总共拥有 1000 多万首歌曲和 20 世纪的大部分音乐的版权。

诉讼文件列出了一长串艺术家的名单，唱片公司声称，它们被错误地纳入了训练数据中，包括瑞典 ABBA 乐队和汉密尔顿音乐剧原声唱片里的艺术家。

除此之外，创作好听的音乐也更加困难，用人工智能生成可以接受的诗歌或插图是一项技术挑战，但为模型注入我们喜欢的音乐品味则是另一项挑战。

当然，人工智能公司有可能赢得这场官司，但这些都无关紧要，它们想要免费使用受版权保护的音乐来训练模型只不过是一张空头支票。

专家表示，唱片公司的理由很充分，如果人工智能公司想生存下去，可能很快就会付出真金白银，而且是付出很多。

如果法院裁定人工智能音乐公司不能在这些唱片公司的音乐上免费训练，那么昂贵的许可协议，比如 YouTube 据传正在寻求的协议，似乎是唯一的出路。最终，这将让财力最雄厚的公司成为领头羊。

与迄今为止的任何训练数据诉讼相比，这一案件的结果将决定生成式人工智能的一大应用分支，以及它是否还有发展下去的可能。

案件的来龙去脉

Suno 公司的音乐生成工具推出还不到一年，就已经获得了 1200 万用户，上个月刚刚获得了 1.25 亿美元的融资，并与微软 Copilot 建立了合作关系。

Udio 公司更加年轻。它的工具 2024 年 4 月才上线，由 will.i.am 和 Common 等音乐投资者提供了 1000 万美元的种子资金。

唱片公司声称，这两家初创公司都在其模型的训练和输出方面侵犯了版权。

美国康奈尔大学法学院数字与信息法教授詹姆斯·格里梅尔曼（James Grimmelmann）表示：“在所有诉讼中，这起案件的原告击败人工智能公司的几率是最高的。”

他将其与《纽约时报》正在进行的、针对 OpenAI 的案件进行了比较。他说，到目前为止，这是权利持有人对人工智能公司提出有力诉讼的最佳例子。但出于很多原因，对 Suno 和 Udio 的诉讼“是更糟糕的”。

《纽约时报》指控称，OpenAI 涉嫌在未获授权的情况下使用其发表的文章并用于模型训练，此举侵犯了版权。

格里梅尔曼表示，OpenAI 在应对这一指控时可以“钻空子”。因为该公司可以说，它在互联网上抓取了大量的训练语料库，《纽约时报》文章的副本出现在了该公司不知情的地方。

对于 Suno 和 Udio 来说，这种自我辩白是不太可信的。

格里梅尔曼说：“它并不能说，‘我们在网上搜索了所有的音频，却无法将商业制作的歌曲与其他歌曲区分开来。’很明显，它们一定收集了大型商业唱片的数据库。”

除了对训练的投诉外，新案件还称，像 Suno 和 Udio 这样的工具更具模仿性，而不是生成式人工智能。

这意味着，它们的输出内容模仿了受版权保护的艺术家和歌曲的风格。

格里梅尔曼指出，《纽约时报》列举了 ChatGPT 复制其文章全文的例子，但唱片公司声称，他们能够用简单得多的提示从人工智能音乐模型中产生有问题的回复。

例如，原告说，用“my tempting 1964 girl smokey sing hitsville soul pop”提示 Udio，产生的歌曲“任何熟悉诱惑合唱团的听众都会立即听出它与经典歌曲《我的女孩》（My Girl）相似。”

法庭文件包括 Udio 上面的例子，但这些歌曲似乎已被删除。原告还提到了 Suno 上的类似例子，包括与 ABBA 曲风相似的歌曲。该歌曲是用“70 年代流行音乐”提示和“Dancing Queen”歌词生成的。

更重要的是，格里梅尔曼解释说，歌曲中有比新闻文章更多的版权保护的信息。

他说：“在捕捉玛丽亚·凯莉（Mariah Carey）歌声和嗓音时，信息密度比文字要高得多。”这也许是过去涉及音乐版权的诉讼会如此漫长和复杂的原因之一。

舒尔曼在一份声明中写道，Suno 优先考虑原创，该模型“旨在生成全新的输出，而不是记忆和重复先前存在的内容。”

他补充道，“这就是为什么我们不允许用户的提示提及特定艺术家。”

Udio 的声明同样提到，它使用“最先进的过滤器，以确保我们的模型不会复制受版权保护的作品或艺术家的声音。”

事实上，如果一个请求指定了一位艺术家，这些工具就会阻止它。但唱片公司声称，这些保障措施存在重大漏洞。

例如，在诉讼消息传出后，社交媒体用户分享的一些例子表明，如果用户用空格隔开艺术家名字里的字母，这个请求就有可能会通过。

我自己提出的“像 Kendrick 唱的歌”的请求被 Suno 阻止了，但“像 k e n d r i c k 唱的歌”则成功通过，产生了“嘻哈节奏节拍驱动”的曲目。

公平地说，生成的成果并不像艺术家的独特风格，但模型能够生成差不多的风格，这表明它实际上熟悉很多知名艺术家的作品。类似的变通方法在 Udio 上失败了。

可能的结果

格里梅尔曼说，这起案件有三种可能走向。其中一个是诉讼失败，法院完全支持人工智能初创公司，它可能会认定，公司在模型产出中没有违反合理使用或者模仿受版权保护的作品。

如果这些模型被认为是合理使用，这将意味着歌曲作者和权利持有人需要寻找不同的法律机制来寻求赔偿。

另一种可能性是喜忧参半。法院认定人工智能公司在训练中没有违反公平使用，但必须更好地控制其模型的输出，以确保其不会随便模仿受版权保护的作品。

格里梅尔曼表示，这将类似于针对 Napster 的最初裁决之一。在该裁决中，该公司被迫禁止在其图书馆中搜索受版权保护的作品，尽管用户很快就找到了解决办法。

第三个走向是最具毁灭性的，即法院认为，公司在人工智能模型的训练和输出方面都有过错。

这意味着，这些公司不能在没有许可的情况下使用受版权保护的作品进行训练，也不能允许模仿受版权保护作品来输出内容。

这些公司可能会被责令为侵权行为支付赔偿金，每家公司的赔偿金可能高达数亿美元。

即使它们没有因这样的裁决而破产，许可协议也将迫使它们彻底重新收集训练数据集，这也可能会导致成本过高。

许可或不许可

尽管原告的直接目标是让人工智能公司停止训练并支付赔偿金，但美国唱片业协会主席米奇·格拉齐尔（ Mitch Glazier）已经在展望一个有许可的未来。

他在一篇专栏文章中写道：“与过去一样，音乐创作者将行使他们的权利，保护人类艺术的创意引擎，并促进一个健康、可持续的许可市场的发展，承认创意和技术的价值。”

这样一个许可证市场可能类似文本生成工具目前面临的情况。OpenAI 已与包括《政治》、《大西洋月刊》和《华尔街日报》在内的多家新闻出版商达成授权协议。

这些协议可以让 OpenAI 的产品获得出版商的内容，尽管模型在信息引用透明度方面能做的极其有限的。

如果人工智能音乐公司遵循这种模式，那么唯一有能力创建强大音乐模型的公司可能是那些拥有最多资金的公司。这也许正是 YouTube 的想法。

YouTube 没有立即回应《麻省理工科技评论》关于其谈判细节的问题，但考虑到训练人工智能模型所需的大量数据以及音乐版权的集中性，最后达成协议的价格可能是天价。

理论上，人工智能公司可以完全不需要获得许可，只在不受版权保护的音乐上构建模型，但这将是一项艰巨的任务。

在文本和图像生成领域也有类似的努力。美国芝加哥的一家法律咨询公司创建了一个基于监管文件的模型，以及 Hugging Face 创建了一个使用了 20 世纪 20 年代米老鼠图像进行训练的模型。

只不过，这些模型很小，并不起眼。如果 Suno 和 Udio 被迫只在公共领域进行训练，想想那些军事宣传片和公司宣传视频中的免费歌曲，最终的模型（成果）将与我们今天看到的相去甚远。

格里梅尔曼说，如果人工智能公司真的推进许可协议，谈判可能会很棘手。

音乐授权因两种不同的版权而变得复杂：一种是歌曲版权，通常涵盖作曲，比如音乐和歌词，另一种是后期处理版权，比如涵盖录音和母带处理等等（你听到的歌曲通常经过了后期处理）。

一些艺术家，如泰勒·斯威夫特（Taylor Swift）和弗兰克·奥申（Frank Ocean），在经过漫长的法律斗争后，已经拥有了他们曲库的后期处理版权，因此将在任何潜在的许可协议中占据主导地位。

然而，许多其他歌手只保留歌曲版权，唱片公司则保留（母带）后期处理版权。

在这些情况下，理论上，唱片公司可能能够在未经艺术家许可的情况下授予人工智能公司使用音乐的许可，但这可能导致艺术家与其决裂，引发更多法律纠纷。

是否将他们的音乐授权给这些公司，这一问题引起了音乐团体的分歧。在代表艺术家和演员的美国 SAG-AFTRA 工会于 2024 年 4 月通过的合同规则中，工会成员的声音可以被人工智能克隆，但有最低付费标准。

早在 2023 年 12 月，一个名为 Indie Musicians Caucus 的组织就对拥有 7 万名成员的美国音乐家联合会（AFM，American Federation of Musicians）表达了失望。

因为它认为后者在面对人工智能侵害时做的不够，未能保护好其普通成员。

该小组写道，它将投票反对任何“要求 AFM 成员在没有同意权、补偿权或认可的情况下参与训练生成式人工智能（我们的永久性替代者），从而自掘坟墓”的协议。

但在这一点上，AFM 似乎并不急于促成任何交易。

我问 AFM的国际财务秘书肯尼思·谢克（Kenneth Shirk），他是否认为音乐家应该与人工智能公司合作，推动获得公平的报酬，无论这意味着什么，还是完全抵制许可协议。

他告诉我：“这些问题引发了我的思考，你宁愿让一群火蚁爬满你的全身，还是在满是碎玻璃的床上打滚？我们希望音乐家能得到补偿，但我们也希望确保我们的后代可以继续从事音乐工作。”

作者简介：詹姆斯·唐奈尔（James O'Donnell）是《麻省理工科技评论》的人工智能记者，他专注于自动驾驶汽车、手术机器人和聊天机器人等技术的前景和风险。在加入《麻省理工科技评论》之前，他是调查新闻媒体 FRONTLINE PBS 的报道研究员。他的其他作品曾出现在《华盛顿邮报》、ProPublica、WNYC 和其他媒体上。

支持：Ren

运营/排版：何晨龙

查看原图 157K