GPT-5来了，还免费，打工人真有救了

登录

这是 OpenAI 模子发布时间线。本日破晓，昨们终于比及了 GPT-5，这款从客岁就被反复“预报”，不停“剧透”的模子。
发布会用“平凡人能看懂的方式，展示了最强 AI 的本领”，从写发布会文案，到现场天生网站、做游戏、学语言，再到 AI 帮忙问诊和“传统艺能”比拼 benchmark。
假如说 GPT-3 是“能自主语言”的语言模子，GPT-4 是“听懂人话”的多模态大脑，GPT-5 更像是一个万能的个人助手。
用 Sam Altman 一句话总结：“GPT-5 将让你第一次真正感觉到，仿佛与任何范畴的博士级专家攀谈的感觉。”
那么，这个被冠以“地表最强”title 的大模子，体现怎样？
步伐员又又又伤害了
编程，是 GPT-5 发布会的一大亮点，也是最能直观感受到 GPT-5 进化之处。
OpenAI 团队在现场写出了好几个网页，好比“给朋友做一个能让英语利用者学法语的网页，功能要有进度跟随、单词卡、单词小游戏等”。
300 词左右的 Prompt，3 分钟不到，GPT-5 就拿出了一个极其完备的可用网页，并“私自”定名为《半夜巴黎》（还致敬了伍迪·艾伦的影戏），网页即创即用，单词卡、进度跟踪、快捷键、影象曲线、开辟者要求的贪吃蛇小游戏，这些功能全部满意且运行正常。
关键是网页计划的还很有美学，网页间距、排版、配色、视觉感都被思量进去，乃至做出了暗中/白天的双主题。
OpenAI 又让 GPT-5 写了一个“动态 SVG 可视化可以模仿翼型的举动”，几分钟内，GPT-5 搓出了几百行代码后，交付出一个完全符合需求，雅观且可交互的网页，而且全部的参数变革都会根据物理规律及时调解，整个网页到达了讲授演示级别的专业水准。
根据 OpenAI 本身的内部测试，70% 的环境下，GPT-5 在前端网络开辟方面击败了本年 4 月才上线，号称“OpenAI 最强盛的推理模子”的 OpenAI o3。
而后 GPT-5 又展示了它作为编程 Agent 的强盛，同样在几分钟内，就做出了一个带有 3D 场景、可控脚色与多器重角的网页游戏，从物理引擎调用到脚色对话体系构建，全程险些无需人类干预。
几大 AI 编程软件也给了 GPT-5 编程本领极大好评，Cursor 首创人称 GPT‑5 是“昨们用过最智慧的模子”，代码调试本领尤为突出；Windsurf 优评其工具调用错误率甩前代几条街；Vercel 则说它不但写对，还“写得像专业网页计划师”。
和 Cursor IDE 集成后，GPT-5 还能在几分钟内明白上百万行代码，可以本身“debug”输出效果并回溯方案，不再陷入“提示死循环”。在 SWE-bench 这个真实软件工程使命测试里，GPT-5 不但能明白 bug 陈诉，还能精准修改代码，正确率最高靠近 75%，远超 GPT-4 的 30%。
以是“编程”是整场发布会里，GPT-5 最具说服力的展示场景之一。
GPT-5 不再只是“能写代码”，而是具备了步伐员的开辟路径：明白需求、计划布局、撰写代码、优化交互、美化界面，乃至还会在需求之外“适度创作”。
又当步伐员，又做计划师，还会搞交互，各类编程语言也都特长，GPT-5 已经靠近一名及格的全栈工程师了。
写作、沟通、打工、就诊
写作堪称 GPT 的“根本功”，在 GPT-5 上，写作变得更有人味儿、也更专业。
好比一位用笑剧通报科普内容的博主，她用 GPT-5 写脚本、写段子、测试脚色逻辑和感情动机、出分镜，乃至用语音和 GPT-5“对戏”。
在发布会上的写作演示中，同样的 Prompt 下，GPT-5 也显着比 GPT-4o 天生的文案更有“人味儿”，用词精粹且有节奏感。
在端庄的科研场景中，GPT-5 体现得也如 Sam Altman 所言像一位“跨学科博士后”。免疫学传授用 GPT-5 解读实行数据，模子不但能表明效果，还会猜测将来实行趋势，并自动提出下一步实行方案，大大压缩了科研迭代周期。在专业本领上，据 OpenAI 披露的数据，GPT-5 在约莫一半的案例中和行业专家程度相称或更好。
对于天天在工位上与噜苏信息屠杀的打工人来说，GPT-5 这次真能做你的助手，OpenAI 都自封为“打工人最好用的模子（Our best model for work）”。
你只必要把向导给你的资料往 GPT-5 那一拖，它就能做出了 Excel 表格，再根据表格做出数据可视化的看板，还给你写好资料要点和总结。
同时，GPT-5 还能帮你理清一整套方案，给出落地页布局和转化发起，精准而不敷衍。浮夸点儿说，老板开口说“我有个想法”，几分钟后，GPT-5 项目企划书已经做好了。
OpenAI 还展示了如许一个真实且感人的案例：一位名为 Carolina 的用户在短短一周内被诊断出三种差别情势的癌症，但她不停在列队期待陈诉解读，于是她将医院陈诉截图上传给 GPT‑5，模子敏捷将复杂的医学术语转化为易于明白的语言。
在后续治疗过程中，GPT‑5 不但连续资助她解读术语，还帮忙她评估治疗选项、预备就诊题目，乃至在是否担当放射治疗的决议上给予 Carolina 情绪支持。
只管 Sam Altman 也夸大了，OpenAI 并不把 GPT‑5 定位为医疗装备，它也不能替换专业医疗脚色，但他们想做的是让 AI 成为“康健素养支持工具”（health literacy support tool）能让患者在忙乱和未知里，不再完全仰赖大夫，而是成为有预备、有信息支持、能相识身材环境的患者。
GPT-5 的语音模式也有了显着提拔，增长了冷嘲型、理性型、谛听型、学霸型四种差别的语音预设，除了语气更天然外，情绪感知本领也有提拔，用户还可以自选语音风格和语速。在发布会的演示中，OpenAI 还特意展示了 GPT-5 的语音可以作为“学外语的口语利器”。
根据此前 GPT-4o“过分奉承”的题目，GPT‑5 在答复用户时会更克制、理性，较少出现过分附和，也不会再乱用 emoji 了。
从刷榜到实战
这次 GPT-5 没有再堆长篇 benchmark 榜单，而是挑了一些更贴近实战的场景：写代码、跟指令、多轮使命推理，尤其在“推理模式”下，GPT-5 相较旧模子“幻觉”更少，答复更审慎。
据 OpenAI 的安全研究负责人 Alex Beutel 表现“GPT-5 的诱骗率大大低落。”比 GPT-4o 模子的幻觉率低 45%，与 o3 相比，低落了 80%。
而在 AIME 2025 数学比赛数据集上，GPT-5 在启用“thinking”模式后到达了近乎满分的体现（100%）。这意味着它不再只是靠模板和影象去“做题”，而是真的能按步调推理、演算，再下判定。在多语言代码编辑使命 Aider Polyglot 中，GPT-5 也到达了 88% 的正确率。
另有一大进步在 Prompt 实行本领上，无论是写作、复杂多轮指令，照旧内部 API 利用使命，GPT-5 的体现都比前代高出 10 到 30 个百分点。这意味着它能更稳地实行使命、连续上下文。
而且 GPT-5 引入了一个名为“Safe Completions”的机制，面临敏感题目，不再像旧模子一样拒绝答复大概打哈哈，而是会实验引导用户，资助你衡量利弊，表明限定，并在界限内给出可操纵的发起，让用户在复杂议题中做出更清楚理性的判定。
详细到模子利用上，GPT-5 同样也做了型号分类：GPT-5、GPT-5 Pro、GPT-5-mini 和 GPT-5-nano，主打一个“按需选择、分级订价”：
GPT-5 Pro：是现在 GPT-5 系列中体现最强的版本，在 GPQA 等高难度科学评测中体现精彩，人类专家也更附和它的答复，正确率更高，尤其在康健、数学、科学和编程范畴。下周起，Pro 用户还可以将 ChatGPT 接入 Gmail、Google 日历和接洽人。
GPT-5 mini：轻量但强盛，得当高频、低推理使命。
GPT-5 nano：极致压缩版，本钱低，可与 Gemini Flash-Lite 对标，仅通过 API 提供。
免费用户默认利用 GPT-5 和 GPT-5 mini（访问频率有限）；Plus 用户拥有更高额度；Pro 用户（月费 200 美元）可解锁 GPT-5 Pro 和 Thinking 模式。
用户也不必要本身选模子，体系会根据使命复杂度主动调用符合的版本。简朴提问就用 mini 或 nano，复杂对话主动上 Pro。
综合来看，GPT-5 并不是一次技能节点的大超过，更像是一次八面见光的全面升级。
在这场刚竣事的 GPT-5 发布会里，OpenAI 没有把重点放在 GPT-5 参数有多大、跑分有多高、竞技场结果怎样，也很少夸大 Agent 与多模态，PPT 也没几张，OpenAI 选择用更多的篇幅去出现用户怎样利用 GPT-5。
岂论是专业人士、有创意但没技能的创作者，照旧面对逆境的患者、渴望发展的求知者……昨们看到 GPT-5 被嵌入到了一个个详细而真实的场景中，实现了“能用，快用，好用”。
这种克制与务实，大概才是 OpenAI 最大的野心：让 AI 大模子成为数字天下的底子办法，就像昨们曾经利用 Office 365、Google 和百度等那些产物。
作者：糕级冻雾
编辑：沈知涵
配图全部来自 OpenAI
阅读原文

		自动登录	找回密码
密码			立即注册

GPT-5来了，还免费，打工人真有救了

本帖子中包含更多资源

全部评论 0

热文

摩根大通分析师警告称美股出现互联网泡沫式的市场集中前10大股4951热度

重庆：到2025年底建成逾2000座超充站4400热度

不再掉队？阿森纳英超强势8连胜，去年同期4胜2平2负4366热度

互联网大厂重回春晚4343热度

千亿元巨头业绩新高！洛阳钼业最新年度业绩再度刷新历史纪录 ..4292热度

中欧班列（西安）新年开门红4147热度

以优良文风提升宣传质量和水平4067热度

1月游戏版号发放再破百，机构：或推动产业繁荣发展，中概互联ETF4024热度

吴清再度提及量化交易监管如何理解最新提出的“趋利避害、突出4007热度

抖音做不好互联网医疗？3924热度

无人不网未成年人网络保护面临新风险3891热度

大厂员工再无巨额年终奖3887热度

再提“派兵” 马克龙敦促盟友力挺乌克兰3883热度

售33.98万元起新款腾势D9正式上市3868热度

被AI淘汰的专业，出现了3857热度

威马成“危马”：创始人行踪成谜车主困在“售后中” ...3795热度

国网数科控股公司荣获工信部工业互联网平台贯标认证 ...3735热度

AI进讲堂、AI数字底盘……一文感受数字新生活3733热度

售23.58万起新款冒险家及混动版上市3732热度

互联网平台提现限制重重，是合理规定还是霸王条款？ ...3677热度

所属版块