把昨天的 AI 世界,讲清楚。
不搬运新闻标题。从官方动态与从业者讨论中,深度调研、去伪存真,给出有判断力的解读——事实可溯源,观点分开标注。
GPT-5.6 三档齐发首由政府审查放行,开源侧 DSpark 与 GLM-5.2 逼近前沿
OpenAI 发布 GPT-5.6 Sol/Terra/Luna 三档模型,Sol 为迄今最强但首次由美国政府审查用户名单后限量放行;同期 Anthropic Mythos 5 恢复向美国可信机构部署,出口管制空档催生亚洲厂商推 Mythos-like 模型。开源侧两记重拳:DeepSeek DSpark 投机解码无损提速 60-85% 并全栈开源,智谱 GLM-5.2(7440 亿参数/MIT)登顶 Code Arena、距 Claude Opus 4.8 不到 1%。三方真实落地数据——OpenAI 内部 Codex token 占比 10 个月升至 99.8%、Anthropic 调查显示三分之一人认为初级岗位高概率被替代、字节 TRAE 90% 代码 AI 生成但人均吞吐仅 1.6 倍——共同指向同一结论:智能体已渗进专业岗位,但工程化交付仍是瓶颈。
- GPT-5.6 三档定价:Sol $5/$30、Terra $2.50/$15、Luna $1/$6(OpenAI 史上最低),7 月 Cerebras 上最高 750 tokens/秒
- 美国政府首次审查前沿模型用户名单:GPT-5.6 限量预览 + Mythos 5 恢复向可信机构部署,亚洲厂商借出口管制空档推 Mythos-like
- DeepSeek DSpark 投机解码无损提速 60-85%,DeepSpec 全栈开源,已部署 V4 线上
- 智谱 GLM-5.2 开源(7440 亿参数/1M 上下文/MIT)登顶 Code Arena,距 Claude Opus 4.8 不到 1%、API 便宜 85%
GPT-5.6 三档齐发,前沿 AI 进入"政府审批"时代
OpenAI 预览 GPT-5.6——旗舰 Sol、均衡 Terra、低价 Luna 三档齐发,主攻网络安全与长程推理。但与模型同样抢眼的是治理:美国政府要审查谁能用 GPT-5.6 并要求延期,Anthropic 的 Mythos 5/Fable 5 也在政府指令下暂停又部分恢复,前沿 AI 正被纳入国家安全框架。同日 Anthropic 指控阿里非法蒸馏 Claude 能力,DeepSeek 用 DSpark 把推理再提速 80%,Qwen 开源世界模型宣称超 Opus 4.8——开源与闭源、东方与西方的张力全面浮现。
Claude Tag 把 AI 嵌进工作流,交互范式开始第三次迁移
这一天,Anthropic 发布 Claude Tag,让 Claude 以团队成员身份加入团队既有的协作工具。一位资深研究者把它称为大模型交互设计的「第三次重构」——从「你要去访问的网站」,到「电脑里的应用」,再到「融入人类活动的持续实体」。同周,另一家头部厂商也在把 AI 往工作流深处推,但路径不同:一家讲「智能体替你做事」,一家讲「它伴你做事」。两条路线的分歧,正在显形。