GPT-5来了,还免费,打工人真有救了

来自版块 问答
951
0
这是 OpenAI 模子发布时间线。本日破晓,昨们终于比及了 GPT-5,这款从客岁就被反复“预报”,不停“剧透”的模子。
发布会用“平凡人能看懂的方式,展示了最强 AI 的本领”,从写发布会文案,到现场天生网站、做游戏、学语言,再到 AI 帮忙问诊和“传统艺能”比拼 benchmark。
假如说 GPT-3 是“能自主语言”的语言模子,GPT-4 是“听懂人话”的多模态大脑,GPT-5 更像是一个万能的个人助手。
用 Sam Altman 一句话总结:“GPT-5 将让你第一次真正感觉到,仿佛与任何范畴的博士级专家攀谈的感觉。”
那么,这个被冠以“地表最强”title 的大模子,体现怎样?
步伐员又又又伤害了
编程,是 GPT-5 发布会的一大亮点,也是最能直观感受到 GPT-5 进化之处。
OpenAI 团队在现场写出了好几个网页,好比“给朋友做一个能让英语利用者学法语的网页,功能要有进度跟随、单词卡、单词小游戏等”。
300 词左右的 Prompt,3 分钟不到,GPT-5 就拿出了一个极其完备的可用网页,并“私自”定名为《半夜巴黎》(还致敬了伍迪·艾伦的影戏),网页即创即用,单词卡、进度跟踪、快捷键、影象曲线、开辟者要求的贪吃蛇小游戏,这些功能全部满意且运行正常。
关键是网页计划的还很有美学,网页间距、排版、配色、视觉感都被思量进去,乃至做出了暗中/白天的双主题。
OpenAI 又让 GPT-5 写了一个“动态 SVG 可视化可以模仿翼型的举动”,几分钟内,GPT-5 搓出了几百行代码后,交付出一个完全符合需求,雅观且可交互的网页,而且全部的参数变革都会根据物理规律及时调解,整个网页到达了讲授演示级别的专业水准。
根据 OpenAI 本身的内部测试,70% 的环境下,GPT-5 在前端网络开辟方面击败了本年 4 月才上线,号称“OpenAI 最强盛的推理模子”的 OpenAI o3。
而后 GPT-5 又展示了它作为编程 Agent 的强盛,同样在几分钟内,就做出了一个带有 3D 场景、可控脚色与多器重角的网页游戏,从物理引擎调用到脚色对话体系构建,全程险些无需人类干预。
几大 AI 编程软件也给了 GPT-5 编程本领极大好评,Cursor 首创人称 GPT‑5 是“昨们用过最智慧的模子”,代码调试本领尤为突出;Windsurf 优评其工具调用错误率甩前代几条街;Vercel 则说它不但写对,还“写得像专业网页计划师”。
和 Cursor IDE 集成后,GPT-5 还能在几分钟内明白上百万行代码,可以本身“debug”输出效果并回溯方案,不再陷入“提示死循环”。在 SWE-bench 这个真实软件工程使命测试里,GPT-5 不但能明白 bug 陈诉,还能精准修改代码,正确率最高靠近 75%,远超 GPT-4 的 30%。
以是“编程”是整场发布会里,GPT-5 最具说服力的展示场景之一。
GPT-5 不再只是“能写代码”,而是具备了步伐员的开辟路径:明白需求、计划布局、撰写代码、优化交互、美化界面,乃至还会在需求之外“适度创作”。
又当步伐员,又做计划师,还会搞交互,各类编程语言也都特长,GPT-5 已经靠近一名及格的全栈工程师了。
写作、沟通、打工、就诊
写作堪称 GPT 的“根本功”,在 GPT-5 上,写作变得更有人味儿、也更专业。
好比一位用笑剧通报科普内容的博主,她用 GPT-5 写脚本、写段子、测试脚色逻辑和感情动机、出分镜,乃至用语音和 GPT-5“对戏”。
在发布会上的写作演示中,同样的 Prompt 下,GPT-5 也显着比 GPT-4o 天生的文案更有“人味儿”,用词精粹且有节奏感。
在端庄的科研场景中,GPT-5 体现得也如 Sam Altman 所言像一位“跨学科博士后”。免疫学传授用 GPT-5 解读实行数据,模子不但能表明效果,还会猜测将来实行趋势,并自动提出下一步实行方案,大大压缩了科研迭代周期。在专业本领上,据 OpenAI 披露的数据,GPT-5 在约莫一半的案例中和行业专家程度相称或更好。
对于天天在工位上与噜苏信息屠杀的打工人来说,GPT-5 这次真能做你的助手,OpenAI 都自封为“打工人最好用的模子(Our best model for work)”。
你只必要把向导给你的资料往 GPT-5 那一拖,它就能做出了 Excel 表格,再根据表格做出数据可视化的看板,还给你写好资料要点和总结。
同时,GPT-5 还能帮你理清一整套方案,给出落地页布局和转化发起,精准而不敷衍。浮夸点儿说,老板开口说“我有个想法”,几分钟后,GPT-5 项目企划书已经做好了。
OpenAI 还展示了如许一个真实且感人的案例:一位名为 Carolina 的用户在短短一周内被诊断出三种差别情势的癌症,但她不停在列队期待陈诉解读,于是她将医院陈诉截图上传给 GPT‑5,模子敏捷将复杂的医学术语转化为易于明白的语言。
在后续治疗过程中,GPT‑5 不但连续资助她解读术语,还帮忙她评估治疗选项、预备就诊题目,乃至在是否担当放射治疗的决议上给予 Carolina 情绪支持。
只管 Sam Altman 也夸大了,OpenAI 并不把 GPT‑5 定位为医疗装备,它也不能替换专业医疗脚色,但他们想做的是让 AI 成为“康健素养支持工具”(health literacy support tool)能让患者在忙乱和未知里,不再完全仰赖大夫,而是成为有预备、有信息支持、能相识身材环境的患者。
GPT-5 的语音模式也有了显着提拔,增长了冷嘲型、理性型、谛听型、学霸型四种差别的语音预设,除了语气更天然外,情绪感知本领也有提拔,用户还可以自选语音风格和语速。在发布会的演示中,OpenAI 还特意展示了 GPT-5 的语音可以作为“学外语的口语利器”。
根据此前 GPT-4o“过分奉承”的题目,GPT‑5 在答复用户时会更克制、理性,较少出现过分附和,也不会再乱用 emoji 了。
从刷榜到实战
这次 GPT-5 没有再堆长篇 benchmark 榜单,而是挑了一些更贴近实战的场景:写代码、跟指令、多轮使命推理,尤其在“推理模式”下,GPT-5 相较旧模子“幻觉”更少,答复更审慎。
据 OpenAI 的安全研究负责人 Alex Beutel 表现“GPT-5 的诱骗率大大低落。”比 GPT-4o 模子的幻觉率低 45%,与 o3 相比,低落了 80%。
而在 AIME 2025 数学比赛数据集上,GPT-5 在启用“thinking”模式后到达了近乎满分的体现(100%)。这意味着它不再只是靠模板和影象去“做题”,而是真的能按步调推理、演算,再下判定。在多语言代码编辑使命 Aider Polyglot 中,GPT-5 也到达了 88% 的正确率。
另有一大进步在 Prompt 实行本领上,无论是写作、复杂多轮指令,照旧内部 API 利用使命,GPT-5 的体现都比前代高出 10 到 30 个百分点。这意味着它能更稳地实行使命、连续上下文。
而且 GPT-5 引入了一个名为“Safe Completions”的机制,面临敏感题目,不再像旧模子一样拒绝答复大概打哈哈,而是会实验引导用户,资助你衡量利弊,表明限定,并在界限内给出可操纵的发起,让用户在复杂议题中做出更清楚理性的判定。
详细到模子利用上,GPT-5 同样也做了型号分类:GPT-5、GPT-5 Pro、GPT-5-mini 和 GPT-5-nano,主打一个“按需选择、分级订价”:
GPT-5 Pro:是现在 GPT-5 系列中体现最强的版本,在 GPQA 等高难度科学评测中体现精彩,人类专家也更附和它的答复,正确率更高,尤其在康健、数学、科学和编程范畴。下周起,Pro 用户还可以将 ChatGPT 接入 Gmail、Google 日历和接洽人。
GPT-5 mini:轻量但强盛,得当高频、低推理使命。
GPT-5 nano:极致压缩版,本钱低,可与 Gemini Flash-Lite 对标,仅通过 API 提供。
免费用户默认利用 GPT-5 和 GPT-5 mini(访问频率有限);Plus 用户拥有更高额度;Pro 用户(月费 200 美元)可解锁 GPT-5 Pro 和 Thinking 模式。
用户也不必要本身选模子,体系会根据使命复杂度主动调用符合的版本。简朴提问就用 mini 或 nano,复杂对话主动上 Pro。
综合来看,GPT-5 并不是一次技能节点的大超过,更像是一次八面见光的全面升级。
在这场刚竣事的 GPT-5 发布会里,OpenAI 没有把重点放在 GPT-5 参数有多大、跑分有多高、竞技场结果怎样,也很少夸大 Agent 与多模态,PPT 也没几张,OpenAI 选择用更多的篇幅去出现用户怎样利用 GPT-5。
岂论是专业人士、有创意但没技能的创作者,照旧面对逆境的患者、渴望发展的求知者……昨们看到 GPT-5 被嵌入到了一个个详细而真实的场景中,实现了“能用,快用,好用”。
这种克制与务实,大概才是 OpenAI 最大的野心:让 AI 大模子成为数字天下的底子办法,就像昨们曾经利用 Office 365、Google 和百度等那些产物。
作者:糕级冻雾
编辑:沈知涵
配图全部来自 OpenAI
阅读原文

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

使用道具 举报

全部评论 0

热文

所属版块

您需要登录后才可以回帖 立即登录
说说你的想法......
0
0
0
返回顶部