OpenAI 近期宣布,将推迟其备受瞩目的 ChatGPT 语音助手功能的发布,以确保其在面对数百万用户请求时的安全性和有效性。这一决定是在该公司5月份的 GPT-4o 产品发布会上首次公开语音功能之后作出的。GPT-4o 是 GPT-4 模型的升级版,它能够更高效地实时处理文本、音频和图像数据。
原本,OpenAI 计划在6月底向一部分付费的 ChatGPT Plus 用户推出这项语音功能,但为了满足更高的发布标准,公司决定将发布时间推迟一个月。在一份声明中,OpenAI 解释称,他们正在加强模型对某些内容的检测和拒绝能力,并致力于改善用户体验,同时准备扩展基础设施以支持数百万用户,以及保持实时响应的能力。
尽管这一推迟可能会对 OpenAI 在竞争激烈的 AI 领域中的领先地位造成一定的影响,但公司表示,他们正在不断努力,以确保新功能的质量和可靠性。去年,OpenAI 为 ChatGPT 引入了一项有限的回复功能,而新功能则承诺将提供更快的响应速度,并结合强大的图像识别技术,使聊天机器人成为一个更加有用和生动的对话伙伴。
在产品发布会的演示中,OpenAI 的员工展示了 ChatGPT 的即时响应能力,例如在研究人员智能手机摄像头前解答数学题。一些观众将这一工具与2013年电影《她》中的人工智能虚拟助手相提并论,该角色由斯嘉丽·约翰逊配音。不过,由于其中一个 ChatGPT 声音过于相似,斯嘉丽·约翰逊后来要求删除该声音。
OpenAI 表示,他们计划在秋季向所有付费用户推出语音功能,并表示公司还在努力开发5月活动中展示的视频和屏幕共享功能。公司承诺,将在未来向用户公布这些功能的更多细节。
因此,当语音选项在下个月向部分付费用户开放时,其功能可能会比发布会上演示的版本有所限制。例如,聊天机器人可能无法使用计算机视觉功能,这项功能原本可以让它仅通过智能手机摄像头就能对用户的舞蹈动作提供语音反馈。尽管如此,OpenAI 对于提升用户体验和确保功能的安全性的承诺,表明公司致力于为用户提供高质量和可靠的服务。