微软发布四种新的人工智能文本到语音技术，可与 Azure OpenAI 配合使用-电脑志

微软宣布为文本到语音（TTS）应用推出四种新的人工智能驱动神经语音，从即日起可在 Azure OpenAI GPT 中使用，帮助创建基于语音的聊天机器人、语音助手或对话代理。

这四种语音被命名为 en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNeural（均为美式英语）和 zh-CH-YunjieNeural（中文），它们"针对对话场景进行了优化"，现已在美国东部、东南亚和欧洲西部三个地区进行公开预览。

微软展示了新语音的一些样本，并与目前可用的其他神经语音进行了对比，以展示在使语音更自然流畅方面所做的改进。

这些语音本身可以通过使用 Azure Speech SDK 或 REST API 集成到使用 Azure OpenAI 的现有应用程序中，也可以使用 Azure Bot Framework 开发能够使用新的神经 TTS 语音的智能机器人。

微软公布 Windows 11 24H2 面向所有 PC 的发布日期

微软还表示：

我们首先将每个声音的形象塑造成一个真实的人，他友好、对生活乐观，总是热心帮助他人，分享有趣或实用的知识。语音的说话风格就像与熟人喝茶聊天，保持自然而不夸张的语调。

此外，我们还不断改进文本到语音（TTS）建模技术，以提高人工智能语音的质量。我们最近的项目，如 DelightfulTTS 2 和 MuLanTTS，大大缩小了人工智能语音与专业人工录音之间的质量差距，产生的语音比以往任何时候都更加自然逼真。这些技术进步是构建新人工智能语音的基础。

这四种新语音将与现有的 400 多种神经语音一起，覆盖 140 多种语言和地区。

微软官方文档显示：Windows 10 的内容正在迅速消逝

本文由 King 发布在电脑志，转载此文请保持文章完整性，并请附上文章来源（电脑志）及本页链接。
原文链接：https://www.pcsofter.com/news/78448.html