来源:量子号
OpenAI 正在推出一款可以与之交谈的先进人工智能聊天机器人。这款机器人现已上市,至少对某些人来说是这样。
新的聊天机器人代表着 OpenAI 向新一代人工智能语音助手迈进,该助手类似于 Siri 和 Alexa,但功能更强大,可以实现更自然、更流畅的对话。这是向更全面的人工智能代理迈出的一步。新的 ChatGPT 语音机器人可以分辨出不同语调所传达的信息,对中断做出反应,并实时回答查询。它还经过训练,声音听起来更自然,可以用声音传达各种不同的情绪。
其语音模式由 OpenAI 的新 GPT-4o 模型所驱动,该模型结合了语音、文本和视觉能力。为了收集反馈意见,该公司最初向“一小部分”ChatGPT Plus 的付费用户推出了该聊天机器人,但该公司表示将在今年秋天向所有 ChatGPT Plus 订阅用户提供。ChatGPT Plus 订阅费用为每月 20 美元(约 144 元人民币)。OpenAI 表示,它将在 ChatGPT 应用程序中通知第一批推出的用户,并提供有关如何使用新模型的说明。
这项新语音功能于 5 月份宣布,但比原计划晚了一个月才推出,因为该公司表示需要更多时间来改进安全功能,例如模型检测和拒绝不良内容的能力。该公司还表示,正在准备其基础设施,以便为数百万用户提供实时响应。
OpenAI 表示,它已经与 100 多名外部红队成员一起测试了该模型的语音功能,他们的任务是探测该模型是否存在缺陷。据 OpenAI 称,这些测试人员总共会说 45 种语言,来自 29 个国家。
该公司表示,已实施了多项安全机制。例如,为了防止该模型被用于制作音频深度伪造,该公司与配音演员合作创建了四种预设声音。GPT-4o 不会模仿或生成他人的声音。
OpenAI 首次推出 GPT-4o 时,该公司因使用一种名为“Sky”的声音而遭到强烈反对,该声音听起来很像女演员斯嘉丽·约翰逊。约翰逊发表声明称,该公司已与她取得联系,希望允许在模型中使用她的声音,但她拒绝了。她说,在模型演示中听到一个与她“惊人地相似”的声音让她感到震惊。OpenAI 否认该声音是约翰逊的,但已暂停使用 Sky。
该公司还卷入了多起涉嫌侵犯版权的诉讼。OpenAI 表示,它已采用过滤器来识别和阻止生成音乐或其他受版权保护的音频的请求。OpenAI 还表示,它已将其在基于文本的模型中使用的相同安全机制应用于 GPT-4o,以防止其违反法律并生成有害内容。
OpenAI 计划在未来加入更多高级功能,例如视频和屏幕共享,这些功能可能会让该助手更加有用。在 5 月份的一次演示中,员工将手机摄像头对准一张纸,并要求人工智能模型帮助他们解决数学方程式。他们还共享电脑屏幕,并要求模型帮助他们解决编程问题。OpenAI 表示,这些功能现在不会推出,但会在稍后某个未指定的日期推出。
Leave a Reply