微软发布四种新的人工智能文本到语音技术,可与 Azure OpenAI 配合使用

微信扫一扫,分享到朋友圈

微软发布四种新的人工智能文本到语音技术,可与 Azure OpenAI 配合使用

微软宣布为文本到语音(TTS)应用推出四种新的人工智能驱动神经语音,从即日起可在 Azure OpenAI GPT 中使用,帮助创建基于语音的聊天机器人、语音助手或对话代理。

这四种语音被命名为 en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNeural(均为美式英语)和 zh-CH-YunjieNeural(中文),它们"针对对话场景进行了优化",现已在美国东部、东南亚和欧洲西部三个地区进行公开预览。

微软展示了新语音的一些样本,并与目前可用的其他神经语音进行了对比,以展示在使语音更自然流畅方面所做的改进。

这些语音本身可以通过使用 Azure Speech SDK 或 REST API 集成到使用 Azure OpenAI 的现有应用程序中,也可以使用 Azure Bot Framework 开发能够使用新的神经 TTS 语音的智能机器人。

微软还表示:

我们首先将每个声音的形象塑造成一个真实的人,他友好、对生活乐观,总是热心帮助他人,分享有趣或实用的知识。语音的说话风格就像与熟人喝茶聊天,保持自然而不夸张的语调。

此外,我们还不断改进文本到语音(TTS)建模技术,以提高人工智能语音的质量。我们最近的项目,如 DelightfulTTS 2 和 MuLanTTS,大大缩小了人工智能语音与专业人工录音之间的质量差距,产生的语音比以往任何时候都更加自然逼真。这些技术进步是构建新人工智能语音的基础。

这四种新语音将与现有的 400 多种神经语音一起,覆盖 140 多种语言和地区。

上一篇

Microsoft 365 Copilot 将于11月1日正式向企业用户推出

下一篇

苹果在iPhone 15包装盒上使用隐藏水印验证真伪

你也可能喜欢

评论已经被关闭。

插入图片

公众号

公众号
关注我们

排行榜

返回顶部