直击OpenAI夏日发布会:GPT-5或登场 IT之家 7 月 18 日消息,OpenAI 本日破晓公布将在 ChatGPT 中推出一款通用型 AI 智能体,该公司表现该智能体可以资助用户完成各种基于盘算机的使命。
OpenAI 先容称,该智能体可以主动天生可编辑的演示文稿和幻灯片、检察用户的日向来扼要先容即将到来的客户集会、筹划并购买制作家庭早餐的食材,以及运行代码等。 该工具名为 ChatGPT agent,联合了 OpenAI 之前多种智能体工具的功能,包罗 Operator 点击网站的本领,以及 Deep Research 从数十个网站中综合信息天生简便研究陈诉的本领。OpenAI 表现用户只需通过天然语言提示 ChatGPT 即可与该智能体举行交互。 为了开辟这个新工具,OpenAI 将其背后的 Operator 和 Deep Research 团队归并为一个同一的团队。外媒 The Verge 报道称,这个新团队由产物和研究部分共 20~35 人构成。 OpenAI 本日起将向 Pro、Plus 和 Team 筹划的订阅用户推出 ChatGPT 智能体,本年夏末向 ChatGPT 企业和教诲用户开放。要激该死工具,用户可以在 ChatGPT 的工具下拉菜单中选择“智能体模式(agent mode)”。
OpenAI 表现 ChatGPT 智能体比其之前的任何产物都要强盛得多,可以访问 ChatGPT 毗连器,答应用户毗连像 Gmail 和 GitHub 如许的应用,智能体可以根据用户的提示找到相干信息。别的,OpenAI 表现 ChatGPT 智能体可以访问终端,并可以利用 API 来访问某些应用。
根据 OpenAI 的说法,ChatGPT 智能体的底层模子在多个基准测试中提供了最先辈的性能。ChatGPT 智能体模子在 Humanity's Last Exam(pass@1)中得分率为 41.6%,这是一项由数千个题目构成的、涵盖凌驾一百个学科的困难测试。这个分数约莫是 OpenAI o3 和 o4-mini 得分的两倍。 在已知最难的数学基准测试之一 FrontierMath 中,OpenAI 表现,当 ChatGPT 智能体可以访问工具(IT之家注:如用于代码实行的终端)时,其得分为 27.4%,之前的最佳分数来自 o4-mini(得分仅为 6.3%)。 |