我们最近看到人工智能(AI)被用来生成图像和帮助人们写内容。而现在,谷歌有一个新的人工智能系统,可以按照文字描述来生成音乐。
在1月26日发表的一篇学术论文中,谷歌研究人员将MusicLM描述为 "一个从文本描述中生成高保真音乐的模型,例如'平静的小提琴旋律伴着扭曲的吉他旋律'。"
"我们证明MusicLM可以以文本和旋律为条件,因为它可以根据文本标题中描述的风格来转换口哨和哼唱的旋律,"论文写道。
根据该研究论文,MusicLM可以从用户生成的描述中获取线索,如 "带有令人难忘的萨克斯独奏和独唱的迷人爵士乐 "或 "带有低沉低音和强劲踢腿的柏林90年代电子乐",并收到相应的结果。
你可以在这里听一些由MusicLM生成的曲目。
谷歌开发MusicLM是在OpenAI的ChatGPT迅速崛起之后进行的,ChatGPT是一个由人工智能驱动的自然语言处理工具。据《纽约时报》报道,ChatGPT如此受欢迎,以至于谷歌的管理层宣布 "红色代码"。因此,据称该公司今年将推出20多个人工智能相关项目,包括人工智能驱动的谷歌搜索版本。
MusicLM并不是第一个人工智能音乐发生器。正如TechCrunch所指出的,Riffusion、Dance Diffusion、谷歌自己的AudioLM和OpenAI的Jukebox都在这个问题上进行了实验。
不过,不要指望MusicLM在不久的将来会向公众开放。根据谷歌的研究人员,人们担心编程偏见可能会导致技术故障,缺乏代表性,以及 "创意内容的潜在盗用"。事实上,在一次实验中,谷歌的研究人员发现,MusicLM生成的音乐中约有1%是直接抄袭它所训练的歌曲。