网易天音学步Suno

发布于: 雪球转发:0回复:0喜欢:0

“少壮不努力,长大玩摇滚”。

天才鼓手Buddy Rich以此强调大多限于五声音阶的摇滚乐鼓手与和弦编排丰富的传统爵士鼓手的区别,隐喻专业音乐的素质门槛。于当下这个时代的音乐人来说,这句话应该改成“少壮不努力,长大玩AI”。

以Suno、Udio为代表的的新一代AI音乐平台,借由大模型对人机交互方式的重构,将音乐生产的门槛拉低至自然语言的层面。

“我们的目标就是让每个人都能将脑海中的音乐灵感 ,通过简单易用的工具 , 转化为实际的音乐作品”,Suno AI 首席执行官和联合创始人Mikey Shulman所言亦道出了其主要面向C端的产品策略,以最大幅度降低音乐生产门槛。

这也让针对音乐生产中“词曲编录混”等不同环节分别生成音乐,更符合音乐人的创作流程而非C端“玩具”的符号生成路线的产品黯然失色。更重要的是,国内AI音乐赛道的玩家们大多都属于此类,比如5月20日借着节日热点正式向公众开放AI音乐能力的网易云音乐。

音频生成对符号生成的挤压之下,相对偏向专业生产语境的产品特点客观上导致国内AI音乐产品被“束之高阁”。面对这一情况,原本在技术落地上便略显踟蹰的网易似乎更加举棋不定——我们了解到,网易云音乐向公众开放的音乐生成能力存在次数限制,而更深入使用需要注册成为平台音乐人。

网易云音乐如此“瞻前顾后”,实际上也折射出国内AI音乐既不愿成为“玩具”,又无法大举进入专业生产语境的落地困境。


不做“玩具”

与ChatGPT类似,被业内视作音乐创作的“ChatGPT时刻”的SunoV3在用户层面的成功源于其将技术产品化后“玩具化”——通过大模型“暴力”交互的特点:用户输入文字,大模型输出一首带人声的完整歌曲。

截至目前,Suno累计用户达1000万,项目也趁势于5月22日完成1.25亿美元的B轮融资。

有趣的是,恰是因为Suno在用户层面的成功,让直接生成完整音乐的“Suno路线”,成为相对趋于保守的AI创投圈眼中的唯一正解。而过去基于MIDI的符号生成路线反而一定程度上陷入了一种“自证困境”——有创业者向我们抱怨:“如果你没法证明自己能对标Suno,投资人就不给钱了”。

虽然背靠网易集团没有资金支持之虞,但网易云音乐旗下的AI编曲平台网易天音同样陷入了“自证困境”——光子星球在《丁磊的权杖,挥向音乐版权》中就有提到,网易天音一直在用户层面的玩具与专业生产工具中摇摆,而本次向公众开放能力似乎是其“玩具化”的尝试。

目前网易天音开放的3项工具分别是AI编曲、AI一键写歌、AI作词,其中编曲与作词是早在2022年网易天音上线之时便已封装成熟的能力,显然重头戏在于更适合音乐小白的写歌。

值得注意的是,网易天音的一键写歌并非音频直接生成,而是根据提示词分别生成伴奏与人声,再综合渲染。伴奏方面基于网易云既有编曲库的风格生成,而人声则来微软小冰的X·studio中的AI歌手,无论是人声还是伴奏编曲均支持用户自行编辑。

我们体验后发现,用户只需输入数个关键词或场景作为意象,即可串联成完整曲目。就目前产品体验看,网易天音的成品曲目表现不尽如人意,在不采用大模型直接生成的情况下,词曲之间存在一定的割裂,歌词不甚通顺,和弦生硬且断句不得其法。

相对出色的是编曲部分,AI编曲中有海量渲染风格可供选择,在门槛不高的前提下兼具了一定可玩性。我们可以通过对歌词的修改以及调整渲染风格、节奏、音调等,让曲目变得“可堪一听”。

这意味着,网易天音虽然借Suno式一键成曲来推动产品的落地,看似成为了“玩具”,但本质上还是走的过去的产品路径,即音乐人的生产工具。

回顾网易天音的产品历程,其自2022年7月支持分轨导出MIDI后便再无较大的产品改动,直至去年6月与小冰合作推出AI人声。只是受限于符号生成技术路线整体性不足的缺点,人声相关技术的引入对其落地并无太大帮助——好词+好曲的组合不一定等于好音乐,正如上文提到的词曲间的割裂。

显然,网易需要在一定场景下打磨词曲“兼容”的能力。另一方面,在Suno的压力下,符号生成路线产品的生存空间被不断挤压。一直在暗处“发育”的网易天音,也不得不披上“玩具”的外衣,以求打开公众认知。


剑指版权

“没有一定乐理知识,小白也就只能拿来玩玩,拖来拖去消磨一下时间。”

在一位独立音乐人看来,网易天音在成曲之下的编曲、拍速、升降调等功能均面向专业用户,需要进行一定程度的乐理学习方能顺畅使用。即使其面向公众开放,也难以掀起多大水花。

与之相比,网易天音主页下方高亮的“入驻网易音乐人”的图标,才是网易希望讲述的to P(专业生产者)故事。前文有述,成为平台音乐人即可不受限制使用网易天音,这其实与该产品此前的准入并无二致。但经历这次“全民玩音乐”的活动,无论是产品使用者还是平台音乐人的数量无疑都将获得不错的增长。

据网易云音乐财报,截至2023年底,平台原创音乐人数量累计约68.4万,共创作了约310万首音乐曲目。此外,财报还提到AI推荐算法,进一步提升了音乐生产与消费环节的高效连接,2023年来自平台推荐的音乐播放量占比持续增加,平台算法推荐领先优势进一步扩大。

由此不难看出网易云音乐为原创音乐社区设计的商业链路:AI分别自生产工具(网易天音)以及算法推荐把握消费天平的两端,网易天音降低音乐人的准入并产出更多音乐,平台算法则负责将这些音乐“喂”给用户,从而给音乐人带来收益。

我们了解到,在网易天音这个生产端的变量普及前,网易云音乐之上活跃着大量“十八线音乐人”。

有音乐爱好者长传自己玩音乐的作品,而收入随着平台算法的演进逐步自过去的月均几百元提高至上千元(日播放量10000以上)。也有专业音乐人斥资数千元租赁录音室录歌,再数百元请工作室做歌曲后期渲染,却因为缺少播放量而几乎颗粒无收。

前者随着平台AI算法的演进,音乐人的身份也自其爱好逐渐演变成一种副业形式;后者则可以通过AI工具大幅减少试错成本,从而能在音乐创作的道路上走得更长远。

另一方面,AI原创音乐的生态版图扩大也意味着其在用户总收听时长中占比的扩大,部分来自上游版权方的音源将被替代——切入生产环节从而摆脱“二道贩子”身份,一直是流媒体平台追逐的圣杯。况且,经网易天音能力生产的歌曲均关联其为联合创作者,在AI音乐臻至成熟的未来,这或许是平台借版权合理分润的形式雏形。

不过需要注意的是,在音乐分发形式未有明显变革的情况下,平台借AI发力生产端的上限似乎并不高。

“现在的音乐市场虽然呈现出增量趋势,但本质上是生产过剩造成的‘假象’”,一家音乐工作室主理人告诉光子星球,“一首歌火不火全看资本助推(推荐)和概率”。

言下之意是,当下的音乐市场中,需求端并未出现明显增长,而生产端却在野蛮扩张。正如为适应短视频BGM生产节奏而诞生的流水线作业,一首歌的生产成本被简化为人工、水电以及投流费用。

AI虽能进一步降低生产门槛与成本,但在上述分发模式下,难免存在催生赛博垃圾的可能。或许在符号生成与音频生成的路径之争下,这才是殊途同归的终点。

全靠“内驱”?

2023年4月7日,网易CEO丁磊在网易云音乐的个人账户上分享了由AI生成的网易严选7周年纪念歌曲《如期》。一个简单的分享不仅为严选业务“带货”,更是将网易天音带入大众视野,同时也预告了与其小冰在AI人声方面的合作。

事实上,作为目前少数仍活跃在台前的互联网时代CEO,丁磊从不吝为自家产品站台。这背后是丁磊在网易业务拓展中极强的“个人色彩”,他同时是音乐爱好者、游戏爱好者甚至养猪爱好者。另一方面,个人好恶似乎也在业绩之外,为业务投入的考量树立了一个新的维度。

得益于此,网易在游戏、音乐两大板块的AI落地相对跑的更远,也更坚定。以音乐为例,在部分友商转投音频生成路线之时,其对符号生成的坚持并未被大模型与Suno的爆火所动摇。游戏业务更甚,毕竟这在爱好之上还叠了一个“养家糊口”的BUFF。

不过,当这样的风格在“上行下效”之下延续到网易AIGC探索的其他方面,故事也不再那么动听。

我们自一位接近网易人士处了解到,网易虽然在AIGC上的布局极广,但其中有不少是源自部门领导的“喜好”的探索型业务。这些业务在公司的核心业务视野之外“闷头发育”,可想而知的是,它们对内需要和“亲儿子”们争资源,对外需要争声量,但现实是两边似乎都讨不着好。

“智能挖机和家用机器人这些都是一些领导的个人喜好,都是探索业务。”

这客观上导致了网易在除了游戏、音乐与教育以外的AIGC实践相对散而不精。更重要的是,坚持的另一面是踟蹰,网易AIGC在内部业务改造之外的商业化落地相对有些“慢热”——去年6月便官宣与小冰合作,补齐生成完整歌曲最后一块拼图的网易云音乐,还是拖到Suno“兵临城下”的时候才开始提速。

有游戏养家,网易自然有慢热的资本,但慢热也意味着网易其他业务或难以脱离“小打小闹”的范畴,养家还得看游戏。