OpenAI全面发布类人ChatGPT语音助手,会说中文等50种语言
OpenAI 首次公开发布四个月后,ChatGPT 的类人高级人工智能 (AI) 语音助手功能终于向广大付费用户开放。
美国东部时间 9 月 24 日星期二,OpenAI 宣布所有付费订阅 OpenAI ChatGPT Plus 和 Team 计划的用户将能够使用新的 ChatGPT 高级语音模式 Advanced Voice。该功能将在未来几天内逐步推出,并首先在美国市场上线。下周,该功能将向 OpenAI Edu 和 Enterprise 计划的订阅者开放。
这意味着本周OpenAI全面发布类人ChatGPT语音助手,会说中文等50种语言,无论是ChatGPT Plus版的个人用户还是Teams版的小型企业团队用户,都可以通过简单的说话来启用新的语音功能听英语的软件,而无需手动输入提示词和GPT对话。当在App上访问高级语音模式时,用户会通过弹窗知道自己已进入高级语音助手,并且用户会收到来自App的通知。
OpenAI赋予了ChatGPT新语音版本两项功能。一是为语音助手存储“自定义指令”的功能,二是记住用户希望语音助手执行什么行为的“记忆”功能,类似于今年4月OpenAI为ChatGPT提供的功能。记忆功能以文字版介绍。用户可以利用这些功能来确保语音模式是个性化的,让人工智能助手能够根据用户对所有对话的偏好做出响应。
OpenAI 周二推出了五种不同风格的新语音,分别名为 Arbor、Maple、Sol、Spruce 和 Vale,加上之前在旧版语音模式中推出的四种语音:Breeze、Juniper、Cove 和 Ember,可选语音实现了九种类型。 OpenAI 还提高了一些外语的对话速度、流畅度和口音。
OpenAI介绍听英语的软件,高级语音助手可以用50种语言说“对不起,我迟到了”,并在社交媒体帖子中附上视频,以演示用户可以要求语音助手表达他们让奶奶等了许久。道歉。视频显示,AI助手首先总结了用户想要表达的内容,并按照要求用英语说出来。然后,在用户提示AI奶奶只说普通话后听英语的软件,AI助手又用标准普通话说了一遍。
新的语音功能适用于 OpenAI 的 AI 模型 GPT-4o,但不适用于最近发布的预览模型 o1。
新的语音功能早就该推出了。华尔街日报提到,今年5月,OpenAI在推出新旗舰型号GPT-4o时展示了语音模式Voice Mode。当时 GPT-4o 支持的 ChatGPT 语音听起来就像美国成年女性,可以立即响应请求。当它听到演示的 OpenAI 研究总监 Mark Chen 过度呼气时,它似乎察觉到了他的紧张,然后说他说:“Mark,你不是吸尘器”,告诉 Chen 放松并呼吸。
OpenAI 原计划在 6 月底向一小部分 Plus 套餐用户推出语音模式,但在 6 月份宣布推迟一个月发布,以确保该功能能够安全有效地处理数百万用户的请求。当时听英语的软件,OpenAI 表示计划在今年秋天向所有 Plus 用户提供该功能,具体时间表取决于是否满足安全性和可靠性的高内部标准。
7月底,OpenAI针对有限数量的付费Plus用户推出了高级语音模式的ChatGPT,称语音模式无法模仿他人说话的方式,并添加了新的过滤器以确保软件能够发现并拒绝某些生成的音乐或其他形式。请求受版权保护的音频。然而,新的语音模式缺乏 OpenAI 在 5 月份展示的许多功能,例如计算机视觉功能。此功能使 GPT 只需使用智能手机的摄像头即可提供有关用户舞蹈动作的语音反馈。
猜你喜欢
发表评论
评论列表