最近科技圈里有个事儿挺有意思,不知道你刷到没有——好几家音乐公司联合把一家搞AI的公司给告了,说他们未经允许就拿海量歌词去训练聊天机器人,这事儿乍一听好像挺技术流的,但仔细琢磨琢磨,里头牵扯的东西可真不少。
咱们先说说这事儿是怎么被捅出来的,有个搞音乐版权维护的组织,在分析某个热门AI聊天工具的时候,发现它生成的歌词和现有歌曲的相似度高得有点不对劲,比如你让它“写一段关于失恋的流行歌词”,它吐出来的东西,从用词到结构,甚至某些独特的比喻方式,都跟市面上已有的热门歌曲有微妙的相似,这就像什么呢?就像你让一个从来没学过画画的人临摹名画,结果他画出来的东西连原画的笔触习惯都一模一样,这就不太可能是“巧合”了。
然后他们顺藤摸瓜,发现这家AI公司在训练模型的时候,用的数据包里包含了数百万首歌曲的歌词文本,而这些数据,绝大多数都没有获得版权方的明确授权,这就好比有人未经允许,把整个图书馆的书都扫描进了自己的数据库,然后声称自己只是“学习了一下写作风格”。
这事儿一出来,音乐圈直接就炸了,有位从业二十多年的作词人在社交媒体上发了一段挺长的感慨,他说:“我们花几个月甚至几年去琢磨一句词,去感受情绪,去捕捉那些稍纵即逝的灵感,现在AI一夜之间就能‘学会’所有套路,这感觉就像自己家被洗劫一空,强盗还拿着你的东西开起了展览。”这话说得挺重的,但也能理解那种憋屈。
AI公司那边也有自己的说法,他们的工程师在技术论坛上辩解,核心观点大概是:我们这不是抄袭,是“学习”,模型从海量文本中识别的是语言模式、情感表达的逻辑框架,而不是在记忆和复制具体的句子,就像一个人读了无数首诗,然后自己开始写诗,他写出来的东西可能带有前人的风格影响,但内容是全新的,他们管这叫“转化性使用”,认为这应该算合理使用的范畴。
.jpg)
但问题就出在这个“转化”的界限上,法律上对“合理使用”的判定,通常要考虑几个因素:使用的目的和性质、版权作品的性质、使用的数量和实质性、以及对作品潜在市场的影响,AI公司觉得自己是“学习”和“研究”,但音乐版权方认为,你最终产出的产品是商业性的,而且大量使用了他们作品的“核心表达”——也就是那些独特的、创造性的歌词部分,这就好比,你拿一本小说去研究叙事技巧,没问题;但你研究完之后,出版了一本在情节、人物设定上都极其相似的书,那就有问题了。
更让音乐人头疼的是,这种AI生成的内容,正在以一种模糊的方式进入市场,已经有独立音乐人发现,在一些低成本的商业项目里,比如地方广告歌、短视频背景音乐,开始出现用AI生成的歌词,这些歌词质量说不上多高,但价格极其低廉,甚至免费,这直接挤压了那些靠写词为生的底层创作者的生存空间,一位匿名的接单作曲者跟我说:“以前一个简单的广告词单子,可能还能赚个千八百,现在甲方直接说,‘我用AI生成了几版,你帮我挑挑改改就行’,预算直接砍掉三分之二。”
这事儿还扯出一个更根本的讨论:训练AI用的数据,到底该怎么界定?现在的互联网,本身就是一个巨大的、未经严格分类的数据池,公开可访问的网页、论坛、甚至歌词网站上的文本,从技术上讲,爬虫都能抓取,AI公司认为,公开可访问就等于可以用于分析学习,但版权方认为,公开是为了让人“阅读和欣赏”,不是为了让你“复制和用于制造替代品”,这个认知上的鸿沟,目前法律还真没有特别清晰的条款能完全覆盖。
有法律学者打了个比方:这就像早期摄影技术刚出现时,画家们觉得相机剥夺了他们为人画像的权利,但后来法律和实践逐渐厘清,纯粹复制一幅画是侵权,但用照片作为素材进行全新的艺术创作,则是另一回事,AI歌词生成的问题可能更复杂,因为它学习的是“创作方法”本身。
有没有可能找到一条中间道路呢?一些比较前沿的讨论已经在进行了,是不是可以建立一种“数据信托”或者“集体授权”机制?音乐版权方组成联盟,将歌词数据池进行标准化和匿名化处理(剥离掉具体的歌曲和作者信息,只保留语言模式),然后以合理的费用授权给AI公司用于研发,在AI生成的内容产生商业收益时,通过智能合约自动向数据贡献方分配一定比例的收益,这听起来有点理想化,但在区块链等技术逐渐成熟的今天,并非完全不可想象。
也有技术专家提出,未来的AI模型训练可能需要更精细的“数据标注”和“使用追踪”,不仅要知道数据用了没有,还要知道它如何被使用、对最终输出产生了多大权重的影响,这样,在发生争议时,才可能进行更清晰的责任界定。
作为普通用户,我们可能觉得这事儿离自己挺远,但仔细想想,也不尽然,我们现在听歌、看视频,享受的很多个性化推荐,背后都有AI模型的功劳,如果支撑这些模型的数据来源本身是“有原罪”的,那么整个数字文化生态的根基就不太稳当,我们当然希望AI能带来更多便利和创意,但这种进步,不应该以牺牲原创者的基本权益为代价。
说到底,这次歌词数据风波,不过是AI时代知识产权巨大冰山露出的一角,它逼着我们所有人去思考:在智能机器的学习能力面前,人类创造力该如何被定义、被尊重、被保护?技术的车轮滚滚向前,但法律的框架和伦理的共识,也需要尽快跟上,否则,当AI真的能写出打动人心的“金句”时,我们或许已经忘了,那份感动最初来源于何处。
这件事最后会怎么收场,是法庭上的一场漫长博弈,还是行业间达成新的默契,现在还不好说,但可以肯定的是,关于创作、版权与AI的这场大讨论,才刚刚开始,而我们每一个身处数字时代的人,都将是这个故事的见证者,甚至参与者。
(免费申请加入)AI工具导航网

相关标签: # AI被指滥用歌词训练聊天机器人
评论列表 (0条)