微软将允许企业和个人创建自己的自定义人工智能语音,可用于其他语言配音、游戏等。今天,作为公司 Ignite 2023 开发者大会的一部分,Azure AI 服务部门宣布了这项名为 "个人语音"(Personal Voice)的新功能。
在一篇博文中,微软称这是对其目前在 Azure AI Speech 中的自定义神经语音功能的扩展。个人语音的不同之处在于,顾名思义,它使用一个人自己的声音来创建基于人工智能的音频,然后可以用来制作 100 多种语言的语音。
博客中写道:
为创建人工智能语音准备训练样本既困难又昂贵。有了个人语音技术,用户只需提供一个语音样本,就能创建与自己相似的声音,最短只需 60 秒。
个人语音Demo视频(需魔法):https://youtu.be/Aj_Jb2moFNQ
这项功能可以用来创建一个语音助手,听起来就像使用 "个人语音" 制作人工智能聊天机器人的人一样。游戏玩家也可以用它为自己的角色配音,还可以用其他语言为演员配音等等。
很显然,这项技术可以被用来伪造真人的声音,用于不光彩的行为。微软表示,任何使用该功能制作人工智能语音的人都必须发表录音声明,说明用户知道 "客户将创建并使用他们的声音"。
此外,该功能至少目前只能在某些情况下使用。微软表示:
- 在语音输出受到限制、由符合有限访问资格标准的客户定义、语音不读取用户生成或开放式内容的应用程序中。语音模型的使用必须保持在应用程序内,输出不得从应用程序发布或共享。符合这一要求的应用实例包括智能设备中的语音助手和游戏中的角色语音定制。
- 为电影、电视、视频和音频配音,仅限于娱乐场景,符合有限访问资格标准的客户可以全权控制语音模型及其输出的创建、访问和使用。
用户还必须遵守微软的技术使用指南和行为准则。目前,该功能仅在西欧、美国东部和东南亚地区提供。公开预览版将于 12 月 1 日上线。