怎麼,這是真心想做音樂啊?Udio 官方沒有透露技術細節,但是用大語言模型生成音樂,從來都不簡單。音樂語言是很難被文字描述的,它包含大量資訊——可能只是一秒,所包含的是對每一個節拍、音符、聲樂、和聲的有機整合。在生成長序列的聲音時,AI 模型很難在樂句、歌詞或擴展段落中保持音樂的連續性。另外,由於音樂包括聲樂和樂器,因此生成起來比語音困難得多。而在推給用戶的時候,卻必須是簡單的、直接的。用戶只需要使用自然語言,而不是要求每個用戶都掌握專業樂理知識。Udio 的 CEO David Ding,聯席創始人 Charlie Nash 都曾效力於 Deepmind,參與開發了音樂模型 Lyria,發布於去年 11 月,在當時被稱為世界上最複雜的音樂模型。