宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Suno大危機,Udio更新v1.5版本,是認真想做音樂

2024年07月27日 首頁 » 其他
Suno 要有危機感了,Udio 發布新版本 v1.5,可謂是正面硬剛。
Suno大危機,Udio更新v1.5版本,是認真想做音樂
昨晚 Udio 發布大更新,包含多項新增功能和性能增強。
Udio 於今年 4 月發布,投資方為 a16z,一面世就被稱為 Suno 最大的競品,還受到了職業音樂人的認可。
生成式音樂應用很多,而 Udio 格外擅長理解和駕馭不同風格和音樂體裁,可以說是「音樂特長生」
一次指令可以獲得兩支成品。Prompt 的寫法豐儉由人,考慮到它的特長生屬性,在 prompt 里輸入自己想要的音樂風格時越明確,效果越驚艷。

Suno大危機,Udio更新v1.5版本,是認真想做音樂

但也不用太有壓力,首頁推薦里很多作品,一看 prompt,簡單到嚇人。比如這支以交響曲形式的歌,prompt 只是「貝多芬 交響曲」。

Suno大危機,Udio更新v1.5版本,是認真想做音樂

默認長度為 30 秒,可以再選擇延長,延長的方式是用戶來選擇加頭段、尾段,或者是中間的銜接段落,對音樂小白也很友好。

Suno大危機,Udio更新v1.5版本,是認真想做音樂

我們先從這次更新里的一大亮點出發:多語言支持。在官方演示里,給出了一支普通話的 demo。
歌詞內容是怪怪的😂 不少生成式音樂的 demo 都喜歡用「人機情感」的主題,一種奇奇怪怪的執念。
不過編曲很完整,普通話的演唱也很順滑,沒有「外國人唱中文」的蹩腳感。
Udio 對於人聲的處理可圈可點,在官方提供的 v1 和 v1.5 對比里,能夠明顯聽得出來,「AI 味兒」已經降低到了前所未有的水平(雖然也聽得出調了很多混響來掩護)。
此外,音質提升是這次所有更新里最驚人的,48kHz 的立體聲音軌,低音尤其出彩,非常紮實,是扛得住 hifi 耳機的音質。
要知道,音質提升隨之帶來的,是賦予音樂更多層次的可能性。
Suno 也能做到不錯的立體聲,比如複雜管弦樂編制的音樂,也是能做出立體效果。
但是 Udio 這次的更新,有了更豐富而清晰的層次,不同的樂器的位置能夠更加清晰能辨,同時保持了合奏時的和諧,不會有互相衝突或者糊成一團的情況。
新版本還引入了調性控制,對有專業音樂知識的用戶來說,提高了可控性。另外還支持音頻生成音頻(付費),跟圖生圖一樣的道理。
用一段音樂作為墊底,再讓模型生成。不管是專業(但貧窮)的音樂人,還是普通用戶,都可以讓 Udio 幫你做編曲了。
影片來自 Udio 用戶@maxbarzel
如果你是普通用戶,Udio 的生成有一個特點。
在對音樂體裁沒有那麼熟悉,無法在 prompt 里寫的特別明確的情況下,Udio 經常會從一種很「迪士尼」的風格出發。
比如以管弦樂為主的配器,音樂劇般的唱腔,更重要的是,會呈現一種在迪士尼電影音樂里特別常見的轉調方式。
這支音樂拿去做《灰姑娘》或者《白雪公主》里,用作女主角的 solo 片段,也不會違和。
只能說畢竟是迪士尼,流行文化巨頭,而且也是個穩妥的選擇,算得上是用戶音樂審美里的「最大公約數」,
迪士尼的法務也很強,Udio 此前已經跟 Suno 一起,被三大音樂廠牌聯合起訴,控告自己旗下藝人的音樂作品被採集、作為訓練模型的數據,是侵權行為。
如果Udio不想再多一樁官司,還是多加小心吧。
Udio 在爵士樂上的表現算是中規中矩,爵士樂以靈動多變的節奏為特點,如果是現場表演的話,甚至有很多的臨場改動和發揮。所以模型很難把爵士學明白,也可以理解。
在其它節奏更鮮明的流行樂里,基本沒什麼大問題。
Udio 是真把自己當成一個音樂 app 了。相比於 Suno 官網首頁以關鍵詞、熱度為標準來呈現歌曲的方式,Udio 是以音樂體裁、風格為主。

Suno大危機,Udio更新v1.5版本,是認真想做音樂

怎麼,這是真心想做音樂啊?
Udio 官方沒有透露技術細節,但是用大語言模型生成音樂,從來都不簡單。
音樂語言是很難被文字描述的,它包含大量資訊——可能只是一秒,所包含的是對每一個節拍、音符、聲樂、和聲的有機整合。
在生成長序列的聲音時,AI 模型很難在樂句、歌詞或擴展段落中保持音樂的連續性。另外,由於音樂包括聲樂和樂器,因此生成起來比語音困難得多。
而在推給用戶的時候,卻必須是簡單的、直接的。用戶只需要使用自然語言,而不是要求每個用戶都掌握專業樂理知識。
Udio 的 CEO David Ding,聯席創始人 Charlie Nash 都曾效力於 Deepmind,參與開發了音樂模型 Lyria,發布於去年 11 月,在當時被稱為世界上最複雜的音樂模型。

Suno大危機,Udio更新v1.5版本,是認真想做音樂


後來 David Ding 就把同事拉出來一起創業了,這才有了 Udio。
不過,還是那句話,儘管 Udio 的能力很強,仍然到不了可以取代真人的程度。
比如在音程關係、旋律走向方面,還是很彆扭,這和大模型不具備真正的「理解」能力有關。
人聲就更不用說了,多聽幾支歌就能發現,基本沒有「演唱」方面的呈現。想要實現職業歌手那樣靈巧的聲區轉換、顫音、氣聲等等,就有點強模型所難了。
在「生成式音樂」這條賽道上,Udio 更側重「音樂」二字,生成只是它的工具。
在寫這篇測評的過程中,我一直讓它自動續播,等到需要暫停的時候,我下意識地切到了網易雲想按暫停,猛然發現在播音樂的其實是 Udio。
這讓我想到一種可能的使用場景:日常工作、家務時的背景音樂,這種只是需要「聽個響」的場景。
以目前的品質,用 Udio 的歌單取代現有的日推、隨機播放,完全可行。儘管,很難有哪首歌會讓我印象深刻到標個紅心。
真正令人期待的,是和「流量」綁定的隨機推送,因此而逐漸式微,從而讓音樂人們走出被點擊、播放量綁架的怪圈,回到用音樂做表達的原點,那將會是生成式音樂創新的貢獻。

文 | Selina
宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新