作者丨博雯
编辑丨海腰
题图丨Midjourney
引发音乐圈地震的Suno发布不过20天,4月10日,一个名叫Udio的X账号正式发布了它的第一个音频。
不过两天,其一并推出的试玩网址已经几度被挤爆,排在趋势榜前排的是这样一首歌。
AI投资人Mckay Wrigley的评价很直接:“Udio的效果比Suno好两倍!AI音乐很快就将席卷全球。”
可见,AI音乐圈已经肉眼可见地卷起来了。
暂且不论生成音乐在旋律编曲部分的专业与否,仅就流畅抓耳来说已经足够让人吃惊。
更不用说,比起Suno的每天免费生成5首歌,每首歌限2分钟,Udio允许每个账号每月创作1200首歌。
而时限方面,社区趋势榜里3分钟以上的歌曲比比皆是,创作时也可以基于母样无限扩展,似乎上不封顶……
CEO名为Ding Fengning(David Ding),直到去年10月还待在谷歌Deepmind团队。
现在,这家成立满打满算也才6个月,官方X账号甚至是4月9日刚刚注册的团队,已经获得了1000万美金的种子轮投资,阵容包括a16z、Instagram联合创始人、Google Gemini AI负责人,以及一众音乐制作人。
一、每月免费1200首,最长6分钟目前公开的网址为Udio beta版,页面布局很像是Spotify。
最上方有红色按钮的地方是创作音乐的起点,下方则是各类别下点赞数较高的音乐,一个总的趋势榜,以及一个可以看到社区用户们发布的AI音乐的大曲库。
点击最上方的搜索框,就会出现创作AI音乐的界面。
就像所有的AI生成工具一样,搜索框里用以键入要创作的歌曲的描述,包括自由描述和一些特定标签。
下方给出了“建议标签”,初始推荐标签有20种,包括摇滚、电子流行乐、爵士乐、古典音乐、流行音乐、流行摇滚、独立摇滚、另类摇滚、民谣、朋克、蓝调、实验摇滚、电子(embient)、合成流行乐(synth-pop)、硬摇滚、慢摇(downtempo)、浩室音乐(HOUSE)、电音、灵魂乐、乡村、民谣、旋律、拉丁。
底部则是歌词,可以选择左侧的“Custom”贴入指定歌词,也可以选择中间的“Instrumental”纯音乐版,或是右侧的 “Auto-generated”让歌词也自动生成。
让我们来尝试创造一首歌。
首先输入prompt,包含自由文本和特定标签,这里我们选择:
Fields,stars,soothing,harmonicas,Nature,Love,in the style of Taylor Swift(田野,星星,舒缓的,口琴,自然,爱,泰勒斯威夫特风格)。
在指定特定的艺术家风格时,如果没有取得这位艺术家的授权,平台会自动将这位艺术家替换为相似的标签。
视网络情况和线路拥堵情况而定,生成时长为10-30秒。
最终会生成两首歌以供选择,一首歌的时长为32秒,同时也自动生成了5-6段歌词。
生成一首音乐后,就来到了Udio的两个核心功能——“混音”和“拓展”。
点击“Remix”按钮进行混音,这时的创作面板会多出一个组件。
当滑块向左,意味着要尽量保留原始音频风格,向右则相反。
点击“Extend”选择拓展,创作面板会多出四个控制组件。
从左到右依次为:增加前奏、向前增加片段、向后增加片段、增加尾奏。
也就是说,基于已有的这段原始音频,你可以向前向后续写,也可以增加开头和结尾,使其更像是一首完整的歌。
拓展以32秒为单位,目前最多增加10个片段,也就是说整首歌的时长最高为5-6分钟。
不过,原始音频越长,做二次拓展时的生成时长也就越长。在作者把初始32秒的音频拓展到3分钟再继续拓展时,生成时长就已经需要1分钟。
这时也可以更改prompt描述,使得歌曲的不同段落呈现出完全不一样的风格。
除了英文之外,Udio也可以生成中文歌曲和日文歌曲。其中,中文歌曲生成的两首分别为普通话和粤语。
作者在这里指定了歌词,重制了著名的科目三和火影忍者主题曲青鸟。
目前,有两位两位著名音乐人与udio合作:美国嘻哈音乐团体黑眼豆豆的创办者之一、美国饶舌歌手威廉 (will.i.am),以及获得过3次格莱美和1次奥斯卡最佳原创歌曲奖的Lonnie Rashid Lynn(艺名Common)。
或许由于这两位歌手都是摇滚说唱风格,目前社区里所产生的歌曲也都是类似风格的。
二、创立6个月,核心成员不过10人目前,这家崭新的团队信息不多,也并没有放出官网。
从X上的账号互动来看,团队核心成员不超过10人。
Ding Fengning(David Ding)为创始人兼CEO,在2011年进入MIT学术项目PRIMES(全称麻省理工学院数学、工程和科学研究项目),进行表示论的研究。
在此期间,他获得了素有小诺贝尔奖之称的英特尔少年科学天才奖(Intel Science Talent Search)第4名,同时还在AMS Representation Theory上发表了一篇数学论文。
结束这一项目后,他在2012年进入哈佛大学,获取了数学学士学位和计算机科学硕士学位。
2018年,Ding Fengning进入了谷歌DeepMind团队,担任一个30人团队的负责人,从事强化学习和多模态建模工作。
在任职的5年间,他还参与过Lyria模型的开发。
这一音乐生成模型由谷歌和YouTube合作开发,能够给予生成声音的长序列,保持音乐在听感上的连续性。
Lyria在2023年11月16日正式发布,而在当月,Ding Fengning已从谷歌离职,并创建了他的Udio。
目前udio团队有4位联合创始人。
联合创始人兼COO Andrew V. Sanchez,在哈佛和牛津大学分别取得了学士和博士学位,此前是搜索引擎Yext AI团队的负责人。
另外3位则是Charlie Nash、Conor Durkan和Yaroslav Ganin,都曾任职于谷歌DeepMind团队。
工程师团队则有Justin K. Chen、Anthony C.、Bernhard F. 5/6三位。
其中Justin K. Chen毕业于斯坦福大学,曾就职于旅行房屋租赁社区Airbnb以及Web3平台HEIR,今年4月才刚刚离职加入Udio团队。
三、“一夜之间,有些行业就没了”作为当前AI音乐圈最火的两大炸子鸡,Udio难免被拿来与Suno比较。
从当前各大平台的专业音乐人评论来看,大家普遍认为,Udio在人声方面更加亮眼,没有Suno那么重的电音音色比较清晰,延长细节也更丰富。
但在生成旋律的完整度和速度上,以及对于中文语音的支持方面,Udio还有待提高。
但无论如何,这个刚刚出台的AI音乐创作工具正在吸引着越来越多的人得目光。
用Instagram联合创始人Mike Krieger的话来说。Udio虽然现在还处于早期阶段,但或许能像Instagram将摄影分享带给大众一样,也将AI音乐创作带给大众。
事实上,虽然音乐圈似乎在今年3月才刚刚因为Suno的发布来了一波大地震,但AI作曲其实在2017年前后就已经有过产品了。
目前,国外有OpenAI的MuseNet、谷歌的MusicLM、Lyria以及Meta的MusicGen。
国内有网易云音乐联合小冰开发的网易云音乐·X Studio,最新的则是昆仑万维在4月2日推出的天工SkyMusic。
从已有产品来看,AI作曲有两种方向,一种是让AI去写MIDI(一种用音符的数字控制信号来记录音乐的“计算机能理解的乐谱”),另一种则是直接出成品。
有专业技术人员表示,由于和声、旋律类似于绘画中的人体骨架,所以现在的suno和udio应该都是先把和声框架搭好,再慢慢填补其他元素的。
现在,当一个又一个“音乐版ChatGPT”到来,整个AI圈又透着一股风雨欲来的技术浪潮气息时,音乐圈也坐不住了。
4月2日,包括Billie Eilish、Katy Perry、Nick Minaj等在内的246名国际乐坛知名音乐人联署公开信,呼吁AI开发者、科技公司、平台和数字音乐服务商停止使用AI侵犯及贬低人类艺术家的权利,要求他们承诺不开发与之相关的AI音乐生成技术等,也不能拒绝向艺术家提供合理报酬。
其实,当前音乐市场产出的音乐数量本来就是远超过听众的消化能力的,AI的出现必然会抢占原有的音乐空间。
比如“网络神曲”“短视频神曲”的创作,在AI音乐成熟之前也有一大帮作曲者在不间断地写歌,这种创作没有什么艺术性科研,属于音乐创作中的“体力活”。
但从去年开始,就有一批游戏公司和广告公司开始尝试AI代替,也确实实现了减员增效。
国内社交平台上的一位音乐人透露,圈里本来有一个小行业:把一些过了版权期的音乐照着原声重新用电子音合成,做完之后是可以署名原创作者,且一条曲目也可以达到上千元。
“但一夜之间,这个行业就没了。”在3月22日Suno V3发布当天,这位音乐人感叹道。
机器处理声音一直都比其他形式的信息发展要快一步,TTS是上世纪的miku都成年了siri也是十多年前的东西,19年德国电信就宣布AI补完贝多芬第十交响曲后来公演被疫情延迟到了21年(不过古典乐专家们对此的评价不怎么样)