Suno v3推出降低音乐创作门槛,关注文生音频

发布于: 雪球转发:0回复:0喜欢:0

Sunov3可在几秒钟内创作完整的两分钟歌曲。

1)具备文生音频能力:用户可以通过输入简短的文本描述来生成歌曲,公司认为Sunov3是他们第一个能够制作广播质量音乐的模型。

2)支持多风格音乐创作:Suno模型能够处理多种音乐风格,包括但不限于蓝调(Blues)、民谣(Folk)、流行(Pop)等。3)相比之前版本有较大改进:V3能够提供更好的音频质量、更多风格和流派、并提升了对提示词的依从(如减少幻觉、优化结尾)。 Suno能力侧重于音频生产,在歌词与标题生成角度与OpenAI有合作。在模型运行时,Suno模型创作了所有音乐,同时调用OpenAI的ChatGPT生成歌词,甚至可以生成标题。 创始团队音频AI经验丰富且有部分音乐家、公司表示尊重艺术家知识产权、可能拥有潜在社交功能。

1)4位联合创始人共12名员工。迄今为止Suno成立还未超过2年时间,联合创始人Shulman、Freyberg、GeorgKucsko和MartinCamacho都为机器学习专家,之前就职于KenshoTechnologies(致力于开发转录技术用于捕捉上市公司财报电话会)。其中Shulman和卡马乔Camacho还都是音乐家。目前团队在计划扩大规模。

2)Suno考虑了艺术家和知识产权尊重。不允许用户请求特定艺术家的风格,并且不使用真实艺术家的声音,同时V3开发了专有无声水印技术,可检测歌曲是否为Suno创建。

3)目前未透露模型训练数据细节。只透露数据除了音乐之外,还包括语音录音。

4)Suno的模型生成的音乐可以被用户分享给朋友,我们预计未来有可能具备潜在社交功能属性。 投资建议 文生音频可能潜在替代广告、电视、影视部分音乐创作,重视文生音频投资机会。推荐关注:1)万兴科技:天幕音视频多媒体大模型已发布,具备通用解决方案及垂类解决方案,能够一条龙从模型端到音视频应用场景满足客户需求。2)科大讯飞:作为AI语音领域龙头公司,讯飞拥有丰富的中文语料,有望拓宽音乐生成场景。3)海天瑞声:中国领先训练数据专业提供商,具备丰富语音语料,AI文生音频应用落地有望带动大量训练数据需求。 风险提示 底层大模型迭代发展不及预期的风险;算力不足的风险;行业竞争加剧的风险。