Topic Timeline

#Terminal-Bench

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

头条 2026-06-28 · 周日 重要度 5/5 深度报告 →

OpenAI 放出 GPT-5.6 三档预览 Sol/Terra/Luna:换了命名体系,Terra 性价比翻倍,但先报备了美国政府

OpenAI 启动 GPT-5.6『有限预览』(6-26 发布,本期为余热),用 Sol(旗舰)/Terra(均衡)/Luna(低价)三档替代旧命名——数字代表『代数』、名字代表可独立迭代的『能力档』。三档定价(每百万 token,输入/输出):Sol $5/$30、Terra $2.50/$15、Luna $1/$6;官方称 Terra 性能对标上代 GPT-5.5 但便宜 2 倍。Sol 在 Terminal-Bench 2.1 自报 SOTA、在 ExploitBench 上以约 1/3 输出 tokens 与 Mythos Preview 竞争(benchmark 多为自报)。最反常的是流程:应美国政府要求先做小范围预览、参与方已报备,广泛开放要『未来数周』;7 月将在 Cerebras 上线 Sol,最高 750 tokens/秒。