5月中旬,也就是谷歌以AI为中心的I/O2024活动的前一天,OpenAI用ChatGPT演示震惊了世界。OpenAI推出了GPT-4o模型,这是一个可以处理音频、视频、文本和图像提示的多模式聊天机器人。更有趣的是OpenAI为GPT-4o开发的新语音模式。
ChatGPT现在支持更自然的对话。GPT-4o允许用户在语音聊天过程中随时停止聊天机器人,以稍微调整对话,就像他们在与另一个人讨论时一样。ChatGPT不会失去思路,并将继续处理来自用户的更新语音提示。
与此同时,新的语音模式升级似乎能够表现出情绪,并检测人类的感受。这就是她般的个性,后来OpenAI因斯嘉丽·约翰逊而陷入麻烦。
所有这些都使得OpenAI的ChatGPT演示取得了巨大的成功。
然而,由于OpenAI不断调整,ChatGPT语音升级的推出被推迟了。快进到7月底,OpenAI已准备好向订阅ChatGPTPlus套餐的用户提供新的语音模式。
ChatGPTPlus订阅者通常会在免费套餐之前获得新的ChatGPT功能。新的语音模式不会同时提供给所有Plus用户。OpenAI在X上解释说,它正在向一小部分Plus用户推出语音模式功能。
该公司正在对此限量版进行alpha测试。ChatGPTPlus用户将收到一封包含说明的电子邮件,如果选择,则会在移动应用程序中收到一条消息。目前尚不清楚OpenAI将如何选择语音模式的早期用户。
我使用的是Plus套餐,但没有收到邀请。这可能与我身处欧盟有关,由于该地区对技术监管的法律各异,这里的新技术功能发布时间比其他地方晚。
不过,OpenAI表示,今年秋季所有Plus用户都可以使用语音模式。视频和屏幕共享功能将在稍后推出。
至于发布延迟的原因,OpenAI表示,在准备将这项前沿技术带给数百万人之前,它一直在努力“加强语音对话的安全性和质量”。OpenAI还制定了多项保护措施来保护用户隐私并加强安全性:
我们与45种语言的100多名外部红队成员一起测试了GPT-4o的语音功能。为了保护人们的隐私,我们训练模型只用四种预设的声音说话,并构建了系统来屏蔽与这些声音不同的输出。我们还实施了防护措施来屏蔽对暴力或版权内容的请求。
该公司还表示,将在“8月初分享有关GPT-4o的功能、局限性和安全评估的详细报告”,其中包括ChatGPT的语音模式重大升级。