OpenAI 正在为其 ChatGPT 聊天机器人添加更多功能。今天,该公司宣布已开始在其移动应用程序上推出新的语音功能,以及上传图片供 ChatGPT 分析的方法。
OpenAI 在一篇博文中宣布,ChatGPT 用户很快就能与聊天机器人对话了。该功能在 iOS 和 Android 应用程序上推出后,用户可以进入"设置"菜单,然后点击"新功能"选项。然后,他们可以点击选择进入应用程序的语音对话。最后,他们可以点击耳机图标,从五个语音选项中选择一个。
OpenAI 表示:
新的语音功能由一个新的文本到语音模型提供支持,能够仅通过文本和几秒钟的语音样本生成类似人类的音频。我们与专业配音演员合作,为每个人配音。我们还使用我们的开源语音识别系统 Whisper 将您说的话转录成文本。
移动 ChatGPT 应用程序很快就能使用照片按钮拍照或选择已创建的照片。然后,ChatGPT 就可以查看照片并执行一系列不同的任务,例如分析工作图表、在设备无法工作时排除故障等等。
OpenAI 表示:
图像理解由多模态 GPT-3.5 和 GPT-4 支持。这些模型将语言推理技能应用于各种图像,如照片、截图以及包含文本和图像的文档。
新功能将在未来几周内推出,并首先提供给 ChatGPT Plus 和企业版用户。在不久的将来,这些功能将扩展到开发者和其他 ChatGPT 用户。
上周,OpenAI 发布了 DALL-E 3,这是其人工智能图像生成器的下一个版本,将与 ChatGPT 集成。该版本将于 10 月份正式发布。