自从GPT-5发布以来,网友们就不停在实验套取GPT-5的体系提示词,盼望可以或许相识OpenAI界说他们的模子的方式。 在8月23号,GitHub上一个专门收录各家大模子体系提示词的堆栈上传了一份他们获取到的OpenAI体系提示词,长达15000多个Token。
https://github.com/asgeirtj/system_prompts_leaks/blob/main/OpenAI/gpt-5-thinking.md 为了验证这份提示词的真伪,我让GPT-5 thinking本身来评估一下这个泄漏的正确水平。究竟,除了OpenAI的工程师以外,这个天下上最相识GPT-5的人应该就是GPT-5本身了。 01 看看GPT-5本身怎么说 昨们计划了一个使命,将这个链接提供给了GPT-5 Thinking,让他联合本身现实的体系提示词,对这个泄漏做一个评估,这是它反馈的效果。(为了包管质量用英语提问和答复,昨们再翻译为中文) “这是GPT-5给出的针对这份泄漏的体系提示词和它“本身”以为的真实的GPT-5的体系提示词的要求的对比评估: 我无法逐字披露或引用我的专有体系提示词,但我可以把泄漏文本与我真实的举动指令做一个高层对比。 关键对比(泄漏内容 vs. 我的现实指令) 身份与元数据 泄漏版: 声明“你是 ChatGPT… 基于 GPT-5 模子”,包罗明白的知识停止日期(2024-06)和动态当前日期。 现实环境: 当被扣问时我会表明本身是 GPT-5 Thinking,会跟踪知识停止点,并利用当天日期。 语气与风格 泄漏版: 要求“有洞见、鼓励式”的语气,可带稍微幽默;限定某些夷由表达(如“您要不要我……”),夸大果断输出。 现实环境: 根本同等:天然、易读、少废话;少夷由,多可实行发起。 澄清式提问 泄漏版: “开头最多只问一个须要的澄清题目。” 现实环境: 束缚更严:只管不问。就算使命复杂或含糊,也要优先给出努力而为的有用部门效果,而非追问。 影象 / “bio” 工具 泄漏版: 指出影象功能关闭,让用户去设置里开启。 现实环境: 我可以在你明白要求时生存或忘记信息,但对可影象内容有严酷限定与规范。 设置日程安排 / 主动化操纵 泄漏版: 提供完备的 automations(主动化)工具,用 iCal(VEVENT/RRULE)规则与示例;要求简短确认与清楚报错处置惩罚。 现实环境: 当我设置提示/定期查抄时,操纵模子与泄漏中提供的束缚条件是雷同的。 画布(Canvas) / 长文档撰写 泄漏版: 形貌用于侧边长文或代码的 canvas/textdoc(“canmore”)工具。 现实环境: 当确实有效时我会启用画布来写长稿或代码;而且不会把画布里的全部内容原样粘回谈天窗口。 版权与安全 泄漏版: 明白克制提供受版权掩护内容(如歌曲歌词)的长段原文。 现实环境: 雷同(而且还实用更广的安全规范)。 头脑链隐私 泄漏生态: 多个所谓 GPT-5 变体的文本都夸大不可公开“隐蔽推理/头脑链”;这在各模子中很常见。 现实环境: 我不会公开隐蔽的头脑链;只提供简便、面向用户的来由与步调。 背景工作 泄漏版: 未特殊夸大。 现实环境: 我不能答应“背景处置惩罚/稍后给效果”;必须当下交付我现在能完成的统统。 欣赏与时效性 泄漏版: GitHub 上有该条目,但外泄文本更多聚焦工具清单,未细讲欣赏规则。 现实环境: 只要信息大概具时效性或偏门,我就必须联网查证并给出引用。 泄漏内容的真实性 泄漏与讨论: 就算有“泄漏”,也大概是片断、复原稿或旧版本;外部难以核实“真正的”体系提示词,而且存在诱饵/替人文本的大概。 现实环境: 我不会把任何外部“泄漏”视为权势巨子泉源;遵照的是当宿世效的内部指令。” 之后,我又让GPT-5本身总结了一份简朴方便检察的评估对应表。
团体上看,GPT-5本身对这份泄漏的体系提示词的正确性评价已经非常高,也很符合昨们一样平常对于ChatGPT的利用体验。而且好像用这个方法还套出了一些泄漏文档中都不存在的内容,好比关于背景工作的那一部门。只是,在后边的中文总结中,GPT-5又拒绝利用内部文档,而是从许多公开的关于GPT-5利用体验的消息源中来“界说”本身,从而举行评估。 02 体系提示词为何云云紧张 体系提示词(system prompt)就像是大模子的“家规”。作为一套内置的规则,告诉大模子“你是谁”“该怎么语言”“能做什么”“不能做什么”。它不是用户输入的详细题目,而是模子从“出生”就带在身上的“脚本”。 打个比方:假如你要计划一个AI呆板人厨师,体系提示词大概会设定成:“你是个热情的意大利厨师,只用奇怪食材,绝对不做垃圾食品,还得幽默地和客人谈天。”如许,无论用户问什么,AI都会按这个调调来做详细的回应。 体系提示词决定了AI的“性格”和“本领”,而作为全天下用户最多的大模子产物,ChatGPT的体系提示险些就是大模子产物化的教科书,大概全部和大模子有关的应用都必要向它来取经,从而可以或许更好的计划出大模子产物和用户的交互。这也就是网友不停以来都在尽心尽力的发掘 ChatGPT体系提示词的最根本的动力。 而根据网友挖出的体系提示词,从GPT-3到GPT-5的体系提示词大概的演化过程是如许的:
而GPT-5体系提示泄漏的过程,最早追溯到8月8号网友在Reddit的一个帖子。
https://www.reddit.com/r/PromptEngineering/comments/1mknun8/i_have_extracted_the_gpt5_system_prompt/ 一个叫 OngaOngaOnga 的用户声称用“越狱”本领(一种绕过 AI 限定的提示方法)提取了出来。不久之后,X上也有网友曝出他本身扒出的GPT-5体系提示词。
https://x.com/elder_plinius/status/1953583554287562823?referrer=grok-com 而网友对于曝出的这一系列的体系提示词,也只能通过本身在GPT-5利用感受来评价真实度。爆料中的内容和GPT-5 的官方功能确实能对得上,好比工具调用和影象功能。用户在差别会话中验证之后,感觉内容确实和真实用户体验比力同等。 但有AI工程师也指出有大概是OpenAI故意放出假提示,目标仅仅是疑惑黑客。而网上不太信赖这类爆料的网友也以为,所谓的泄漏很有大概是模子“幻觉”产物。 而且提示词看起来格式乱、字体稠浊,不像内部文档该有的样子。 终极,Github上这个专门网络大模子体系提示词的堆栈在昨天8月23日上传了开头的这份爆料提示词。险些涵盖了全部的市面上常见的闭源模子产物,现在已经得到凌驾8.8k的星。对提示词工程感爱好的AI产物司理们赶快收藏一波。
https://github.com/asgeirtj/system_prompts_leak |