OpenAI 预览 GPT-5.6:Sol/Terra/Luna 三档齐发,主攻网络安全——却被政府按住了发行

6 月 26 日,OpenAI 启动 GPT-5.6 系列的「限量预览」,一次推出三款新模型:旗舰 Sol、面向日常工作的均衡款 Terra、快速低价的 Luna。它们构成一套全新命名体系——数字 5.6 代表「代际」,Sol/Terra/Luna 代表可各自迭代的「能力档位」(智能 / 速度 / 成本)。旗舰 Sol 主打长程网络安全,在命令行任务基准 Terminal-Bench 2.1 刷到 88.8%(ultra 模式 91.9%),超过 Anthropic 旗舰 Claude Mythos 5 的 88% 和自家上一代 GPT-5.5 的 83.4%,被定位为「迄今最强的网络安全模型」——但 OpenAI 同时强调它「未跨越」Preparedness Framework 的 Cyber Critical 阈值。然而这次发布最不寻常的地方不在跑分:GPT-5.6 是应美国政府要求限量发行的,预览期只对「参与名单已向政府报备」的少数受信任伙伴开放,而 OpenAI 公开表态——这种政府准入流程「不该成为长期默认」。

发生了什么

预览期内,Sol、Terra、Luna 先通过 OpenAI API 和 Codex 向一小批受信任伙伴与机构开放(据 MarkTechPost 估算约 20 家),未来数周才扩展到 ChatGPT / Codex / API 的更广用户。OpenAI 称已就模型能力向美国政府预先通报,并配合一项关于网络安全的行政命令(executive order)框架推进。

三款模型对应三档能力定位:

Sol——前沿旗舰,主攻长程网络安全(漏洞研究与利用)、编程、生物分析等高难度 agentic 任务;
Terra——均衡款,性能对标上一代 GPT-5.5,但价格便宜一半(2x cheaper),定位日常高效工作;
Luna——高速低价款,以最低成本提供强能力,面向高并发场景。

配套两项新推理能力:max reasoning effort——让 Sol 获得最长的深度推理时间,把单条推理链拉到最深;ultra mode——调用 subagents(子智能体)并行拆解复杂任务,突破单一 agent 的能力上限。在 Terminal-Bench 2.1 上,正是 ultra 模式把 Sol 从 max 模式的 88.8% 推到了 91.9%。

OpenAI 把 Sol 称作「迄今最强的网络安全模型」,理由是它在「漏洞研究与利用」这类长程安全任务上推进了「性能-效率前沿」——既更准,也更省 token。为加固安全,OpenAI 在发布前投入了超过 70 万(700,000+)A100 等效 GPU 小时做自动化红队测试,专攻可跨多 prompt / 多场景复用的「通用越狱」,并配合第三方人工专家红队。

关键数据 / 技术细节

Benchmark 表现(命令行 / 网络安全 / 生物三条线,多源交叉)。需注意:据 kingy.ai 核查,OpenAI 在公告里并未完整公开每一项机器可读的原始跑分包,部分数字来自媒体对发布材料的整理,引用时已注明来源。

基准	模型 / 模式	得分	备注
Terminal-Bench 2.1(命令行工作流)	GPT-5.6 Sol(ultra)	91.9%	刷新 SOTA
Terminal-Bench 2.1	GPT-5.6 Sol(max)	88.8%
Terminal-Bench 2.1	Claude Mythos 5	88%	Anthropic 旗舰
Terminal-Bench 2.1	GPT-5.5	83.4%	上一代
Agent’s Last Exam(code)	GPT-5.6 Sol	50.9%	据 MarkTechPost
GeneBench v1(长程基因组学)	GPT-5.6 Sol	30%	据 The Decoder
GeneBench v1	GPT-5.5	22%	Sol 用更少 token 超越
ExploitBench(漏洞利用)	GPT-5.6 Sol	与 Mythos Preview 持平	仅用约 1/3 输出 token
ExploitGym(UC Berkeley 等共建)	Sol / Terra / Luna	随推理量增加显著提升	暗示算力可扩展性

定价(每百万 token)——三档拉开,Terra 性能对标 GPT-5.5 而价格腰斩:

模型	输入	输出	定位
GPT-5.6 Sol	$5	$30	前沿旗舰
GPT-5.6 Terra	$2.50	$15	均衡(约为 GPT-5.5 一半价)
GPT-5.6 Luna	$1	$6	高速低价

其它技术细节:

Prompt 缓存更可预测——支持显式缓存断点(explicit breakpoint),30 分钟最短缓存寿命;缓存写入按未缓存输入价的 1.25x 计费,缓存读取仍享 90% 折扣。
Cerebras 部署——7 月将在 Cerebras 上线 GPT-5.6 Sol,速度最高 750 tokens/秒,初期限部分客户。
安全栈——分层设计:模型内训练拒答 + 实时 cyber/biology 滥用分类器 + 账户级审查 + 差异化访问 + 监控执行。实时分类器检测到潜在违规会暂停生成、交更大推理模型复核;据 kingy.ai,激活分类器(activation classifiers)目前仅部署在 Sol 和 Terra 上。

展开:Preparedness Framework 分级与「未跨阈值」的具体含义

OpenAI 的 Preparedness Framework 把前沿能力按风险分级,关键档是 High(高)与 Critical(临界)。据多家媒体整理的系统卡(system card),GPT-5.6 Sol、Terra、Luna 在网络安全与生物 / 化学两个维度都被列为 High capability,但未达到 Critical。

在网络安全维度,「未跨 Cyber Critical 阈值」的具体证据是:在对 Chromium 与 Firefox 的实测中,Sol 能找到 bug 和「漏洞利用原语」(exploitation primitives,即构成完整 exploit 的零件),但在测试条件下未能自主产出完整、可用的全链 exploit(full-chain exploit)。OpenAI 据此把它定位为「更擅长帮人发现并修复漏洞,而非端到端攻击」——即偏防御、非进攻。

换句话说:Sol 强到足以被列为「高能力」并触发额外管控,但 OpenAI 坚持它还没强到「能独立打穿一条完整攻击链」的「临界」级别。这条措辞上的分界线,正是它能以「限量」而非「不发」形式问世的依据。

政府门:这次发布真正的分水岭

跑分之外,GPT-5.6 真正改写剧本的是发行方式。据 Washington Post 与 TechCrunch 报道,这次限量预览是应美国政府要求收紧的:Trump 政府以安全为由,对 AI 公司施加了限制最先进系统对外开放的新压力。预览只对「参与名单已向政府分享」的伙伴开放,OpenAI 把这称为一个「短期步骤」,称正与政府合作制定新的网络安全行政命令框架、并为未来模型发布建立「可重复的流程」。

OpenAI 罕见地公开表达了不满。其表态被多家媒体引述:

「我们不认为这种政府准入流程应当成为长期默认。它会把最好的工具挡在用户、开发者、企业、网络防御者和全球伙伴之外,而这些人恰恰需要它。」

这不是孤例。就在同一周,Anthropic 也披露,自 6 月 12 日起一直在与美国政府密切合作以恢复其 Claude Mythos 5、Fable 5 的访问:政府已通知 Anthropic,其最强网络安全模型 Mythos 5 可重新部署给一批运营和防护关键基础设施的美国机构。而据 TechCrunch,此前 Trump 政府曾要求 Anthropic 移除 Fable 5 的所有外国国民访问,Anthropic 干脆把该模型整个下架。前白宫 AI 顾问 Dean Ball 评价,这套行政命令实际上为前沿 AI 创造了一种「事实上的非自愿许可制」(de facto involuntary licensing regime),却缺乏清晰界定的安全标准。

把这两条线并起来看,本周的真正头条不是「OpenAI 又出了个更强的模型」,而是:前沿 AI 的网络安全能力,已经强到让美国政府开始对『谁能用、用什么版本』直接划线——OpenAI 和 Anthropic 两家旗舰 cyber 模型,在同一周都进入了政府准入的管控范围。

为何重要

第一,命名体系的重构,是 OpenAI 对「能力轴」的重新定价。把「代际」(5.6)和「档位」(Sol/Terra/Luna)拆开,意味着 OpenAI 不再用一个线性的版本号同时承载「更聪明」和「更便宜」两件事,而是显式地把智能、速度、成本做成可独立迭代的三条轴。这对开发者是好事:Terra 用 GPT-5.5 的能力、一半的价格,等于把上一代旗舰的性价比直接打下来;Luna 把「强能力 + 最低成本」推到 $1/$6,瞄准高并发铺量场景。命名清晰度的提升,本质是产品线货架的重新摆放。

第二,Sol 把「网络安全」抬成了旗舰模型的主打卖点,这是一个信号。过去旗舰模型的叙事中心是数学、编程、推理;这次 OpenAI 直接把「漏洞研究与利用」这类长程安全任务放到 C 位,并以「比 Claude Mythos 5 更准、还省 2/3 token」来证明前沿。这说明 cyber 已经从「安全部门关心的边角」变成「前沿实验室角力的主战场」——既因为它商业价值高(防御者愿意付费),也因为它是衡量「长程 agentic 能力」最硬的试金石之一:能不能端到端打穿一条攻击链,比能不能解一道竞赛题更能暴露模型的规划与工具协调能力。

第三,「未跨 Critical 阈值」是一句需要拆开看的安全叙事。OpenAI 一边说 Sol 是「迄今最强网络安全模型」,一边说它「未能自主产出完整全链 exploit」。这两句并不矛盾,但拼在一起是精心校准的措辞:它既要让市场相信能力领先,又要让监管相信风险可控。问题在于,「在测试条件下未能」和「不能」之间有距离——子智能体(ultra mode)恰恰是用来突破单 agent 上限的,而 ExploitGym 上「推理越多、能力越强」的曲线,意味着这条阈值是会随推理预算移动的。今天的「High」与明天的「Critical」之间,可能只隔着一次推理量的加码。

接下来看什么

政府准入会不会成为「新常态」:OpenAI 嘴上说「不该是长期默认」,但它仍接受了。关键看那份「可重复的流程」和网络安全行政命令最终长什么样——是一次性的、还是制度化的前沿模型许可制。Dean Ball 说的「事实上的非自愿许可」会不会坐实,是本年度 AI 治理最值得盯的一条线。
原始跑分包何时补齐:kingy.ai 已指出 OpenAI 没完整公开机器可读的 benchmark 细节。等系统卡 / 模型卡的完整数据和第三方独立复现出来,再回看 Terminal-Bench 2.1 的 88.8% / 91.9% 和对 Mythos 5 的领先是否站得住。
Cyber 阈值会不会被推过:盯 ExploitGym / ExploitBench 的后续版本,以及 ultra mode 在更高推理预算下能否产出「全链 exploit」。一旦某次评估显示跨过 Critical,整个发行与管控框架都会重写。
Terra 的性价比冲击:用 GPT-5.5 的能力、一半的价,Terra 会不会成为开发者迁移的默认款,从而把上一代旗舰快速边缘化。这是判断「档位化命名」是否成功的最直接指标。
Cerebras 的 750 tok/s 兑现度:7 月上线后,这个速度是给少数客户的样板、还是能规模化压低长程 agentic 任务的延迟与成本——关系到 Sol「长程网络安全」叙事能否真正落地到生产环境。

日报观点

我们的判断:GPT-5.6 这次发布,产品层面是一次稳健的「档位化」迭代,但真正的历史意义在治理层面——这是前沿 AI 第一次因为『太强』而在发行环节被政府直接按住,而且 OpenAI 和 Anthropic 在同一周都中招。跑分谁高谁低会随下一个版本翻篇,但「政府决定谁能用最强模型」这件事一旦开了头,就很难收回去。

先说能力。Sol 在 Terminal-Bench 2.1 上 88.8%(ultra 91.9%)对 Mythos 5 的 88%,差距其实很小,媒体也用「slightly outperforms」来形容——真正有杀伤力的不是这一两个百分点,而是「ExploitBench 上用 1/3 token 打平」这种效率指标。在 agentic 场景里,token 效率直接等于成本和延迟,省 2/3 的 token 意味着同样的预算能做三倍的长程任务。这才是 Sol 作为「网络安全旗舰」的真护城河,而不是某个基准的小数点。

但能力越强,叙事越拧巴。OpenAI 必须同时讲两个故事:对客户讲「我最强」,对监管讲「我可控」。「未跨 Cyber Critical 阈值」这句话就是这种拧巴的产物——它把「在测试条件下没打穿全链」当成「安全」的证据,可 ultra mode 的设计初衷正是突破单 agent 上限,ExploitGym 上「推理越多越强」的曲线也明明白白告诉你:这条阈值不是物理常数,是预算函数。把「现在没越过」当「不会越过」,是这套安全叙事里最该被追问的地方。

再说政府门,这里要给一个反面 caveat:别急着把「政府管控」一律读成坏事。前沿 cyber 模型确实有双刃属性,真要被滥用打关键基础设施,后果是实打实的;政府想在「谁能拿到最强攻击-防御能力」上有发言权,逻辑上不是没有道理。但问题在 Dean Ball 点破的那句——缺乏清晰界定的安全标准。没有标准的许可,等于把「谁配用」的裁量权交给行政意志;今天因为安全限外国国民,明天可能因为别的理由限别的人。OpenAI 接受了限制、又公开喊「这不该是默认」,这种「身体很诚实、嘴上很反对」的姿态,恰恰暴露了行业的真实处境:在「合规」和「开放」之间,头部公司已经没有完全的选择权了。

最后一个被忽视的点:这件事对开源 / 开放权重阵营是个不祥之兆。当闭源旗舰都要政府点头才能发,围绕开放权重模型的监管口径只会更紧——同一天 Ethan Mollick 就在说,美国政府完全有能力让「没有美国公司愿意托管 / 使用」某个开放权重模型。GPT-5.6 的「政府门」不是一次孤立的合规事件,它是前沿 AI 进入「准许可时代」的一个路标。