当前位置:城市新闻网icitynews > 微信版 > 正文

ChatGPT 语音模式大升级!真人语音对话来袭,或将颠覆虚拟助手市场

OpenAI 在今年早些时候展示了 ChatGPT 最新版本的升级语音模式,令用户感到震惊。与人们通常将 Alexa 或 Siri 等数字助理联系在一起的机械声音不同,ChatGPT 的高级语音模式听起来非常逼真。它能够实时反应,适应被打断的情况,甚至在用户开玩笑时发出咯咯笑声,并根据说话者的语调判断其情绪状态。

从7月30日(周二)开始,适用于最强大的 ChatGPT-4o 的高级语音模式将开始向付费用户推出。初期,这一模式将在应用的“Plus”模式下,面向一小部分订阅用户推出,计划在秋季让所有 Plus 用户都能使用。

虽然 ChatGPT 目前已经具备了基础的语音模式,但高级语音模式的推出可能标志着 OpenAI 的一个重大转折点。这一进步将把这个已经显著的 AI 聊天机器人转变为更像虚拟个人助理的工具,使用户能够以类似于与朋友聊天的自然语音方式进行对话。高级语音模式的易用性可能会鼓励用户更频繁地使用这一工具,并对苹果和亚马逊等虚拟助手现有市场形成挑战。然而,引入更高级的语音模式也带来了重大问题:该工具是否能够可靠地理解用户的表达,即使用户有语音差异?用户是否会更倾向于盲目相信一个听起来像人类的 AI 助理,即使它出现错误?

OpenAI 起初计划在六月开始推出高级语音模式,但表示需要“多一个月的时间来达到发布标准”,以确保工具的安全性,并在保持实时响应的同时能够支持数百万人使用。根据7月30日(周二)的一份声明,公司透露,近年来它与超过100名测试者试用了这一 AI 模型的语音功能,这些测试者讲述了45种不同语言,来自29个不同地区。

在其安全措施中,该公司表示,高级语音模式将限制用户使用不超过四种预设语音,这些语音是与配音演员合作创建的,以防止被模仿。此外,该模式还将阻止生成音乐或其他受版权保护音频的请求。OpenAI 还表示,该工具将具备与 ChatGPT 文本模式相同的保护措施,以防止产生非法或“有害”的内容。

高级语音模式将与 OpenAI 在 5 月展示的演示有一个主要区别:用户将不再能够使用被认为类似于演员约翰逊声音的选项。尽管 OpenAI 坚称该声音从未意图模仿约翰逊,而是在另一位演员的帮助下创造的,但在演员抱怨后,公司决定“出于尊重”暂停使用该声音。在 ChatGPT 推出先进的语音模式之前,OpenAI 上周宣布正在测试一款基于其人工智能技术的搜索引擎,该公司正持续扩展其面向消费者的人工智能工具组合。OpenAI 的搜索引擎最终可能对谷歌在在线搜索领域的主导地位构成重大竞争威胁。

(图片源于CNN)

未经允许不得转载:城市新闻网icitynews » ChatGPT 语音模式大升级!真人语音对话来袭,或将颠覆虚拟助手市场

赞 (41)
分享到:更多 ()