人工智能公司 ElevenLabs 发布了 Turbo 2.5,这是一款低延迟的文本到语音语言,目前可支持 32 种语言。此次更新增加了对越南语、匈牙利语和挪威语的支持,这些语言的使用人数分别为 8500 万、1300 万和 530 万。
有了新的 Turbo 2.5,第三方就可以建立由大型语言模型驱动的对话代理,将其集成到可以阅读文本的智能眼镜等硬件中,或将其用于视频游戏,让角色栩栩如生。
使用 Turbo 2.5,印地语、法语、西班牙语、普通话和其他 27 种语言的速度提高了三倍,而英语的速度提高了 25%。要开始在产品和服务中使用 Turbo 2.5 API,开发人员应访问 ElevenLabs API 页面,企业可通过联系销售人员批量获取访问权限。
本月早些时候,ElevenLab 推出了语音隔离器 API,供第三方开发者使用。从名字就能猜到,这款工具利用人工智能去除音频片段中的背景噪音,为你留下清晰的对话。
在 Voice Isolator 的演示中,我们使用 Anthropic 的 Claude 制作了一个网站,让用户提供一个 YouTube 链接,然后调用 Voice Isolator API 来去除背景噪音。然后,演示应用程序会将音频放到页面上的一个文件中,用户可以在浏览器中直接收听。
当然,该应用程序接口将被第三方开发者采用,并以多种创造性的方式加以利用,就像 Turbo 2.5 模型应用程序接口一样,它也将被用于一系列应用中。
最近几天,ElevenLabs 宣布了几项合作。其中一项是与 AMGI Studios 合作创建互动角色,另一项是与 Thoughtly 合作,后者将利用 ElevenLabs 技术创建人工智能呼叫中心。此外,ElevenLabs 还宣布对其配音/配音工作室进行新的改进。