北京时间9月25日,OpenAI宣布,正在向ChatGPT的更多付费用户推出“高级语音模式”(AVM)。该语音功能将使ChatGPT的对话更加自然,最初将向ChatGPT Plus和Teams用户推出,而企业和教育用户将于下周开始获得访问权限。
作为新功能推出的一部分,AVM的设计也得到了改善。该功能现在由蓝色动画球体来代表,而不是OpenAI在五月份展示该技术时展示的动画黑点。
当向用户提供AVM时,ChatGPT应用程序中的语音图标旁边将收到一个弹出窗口。ChatGPT还推出了五种新声音供用户尝试:Arbor、Maple、Sol、Spruce和Vale。这使得ChatGPT的声音总数达到九个,几乎与Google的Gemini Live一样多。
需要指出的是,之前展示的酷似斯嘉丽·约翰逊(Scarlett Johansson)声音的“Sky”却消失不见。包括之前的四种声音:Breeze、Juniper、Cove和Ember,所有这些名称的灵感都来自大自然,这可能是因为AVM的目的就是让使用ChatGPT感觉更自然。
OpenAI表示,ChatGPT的语音功能现在更擅长理解口音,其对话也更流畅、更迅速。OpenAI表示,AVM支持用50多种语言说“对不起,我迟到了”。在OpenAI给出的一段视频演示中,AVM可以使用普通话流利、自然地向他人道歉。
OpenAI还将ChatGPT的一些自定义功能扩展到AVM:自定义指令(允许用户个性化ChatGPT响应的方式)和内存(允许ChatGPT记住对话以供稍后参考)。
OpenAI发言人表示,AVM尚未在多个地区提供,包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登。
OpenAI于今年5月宣布了这一新功能,并在过去的数月中进行了完善和优化。OpenAI联合创始人兼CEO萨姆·奥特曼(Sam Altman)周二在社交平台X上称:“希望大家能感觉到等待是值得的。”
分析人士称,AVM的这一新进展标志着在改善对话式AI的语音交互方面迈出了重要的一步。这一新进展表明,OpenAI继续为更流畅的交互铺平道路。