今天 AI 圈真正值得你知道的事。
AI 早报把过去 24 小时的模型、产品、研究、政策与从业者讨论压缩成一份可追踪的中文情报简报:先给判断,再给证据。
本期信号
美国政府决定谁能用前沿模型:GPT-5.6 审查放行 + Mythos 5 恢复可信部署
华盛顿邮报报道 OpenAI 称将由美国政府审查 GPT-5.6 用户名单(限量预览),该议题 HN 热度 1148 居当日之首;同期 Semafor 报道美国已允许 Anthropic 将最强网络安全模型 Mythos 5 重新部署给运营关键基础设施的部分美国机构。Anthropic 自 6 月 12 日起与政府协作恢复访问,出口管制延宕催生 TechCrunch 所述亚洲厂商推出 Mythos-like 模型填补空档。两件事共同标志:前沿最强模型的获取首次被政府纳入审批流程。
DeepSeek DSpark 投机解码无损提速 60-85%,DeepSpec 全栈开源
DeepSeek 联合北大发布投机采样加速框架 DSpark 并开源全栈代码库 DeepSpec,已部署于 DeepSeek-V4 线上业务。无损前提下 Flash 版单用户生成提速 60-85%、Pro 版 57-78%,超越原 MTP-1 基线;DSpark 用 DFlash 并行主干网生成隐藏状态+轻量马尔可夫头注入相邻词关联,置信度预测头与后验校准避免高并发下吞吐崩溃。DeepSpec 内置支持 Qwen3、Gemma 等,提供从训练草稿模型到基准评估的完整 Python 工具链。HN 热度 714、293 评论。
智谱 GLM-5.2 开源登顶 Code Arena,距 Claude Opus 4.8 不到 1%
智谱 AI 开源 GLM-5.2(Max),7440 亿参数、100 万 token 上下文、MIT 协议,在 Code Arena 前端赛道排第 2、仅次 Fable 5,击败全部 Claude Opus 变体(含 4.8/4.7 Thinking),距 Claude Opus 4.8 不到 1%、软件工程基准击败 GPT-5.5,API 比同等性能美国模型便宜 85%。All In 节目估计中国模型技术落后约 9 个月、芯片落后约 24 个月,但已用华为昇腾完成 GLM5 家族训练。
智能体渗透工作:OpenAI Codex 99.8% + Anthropic 经济影响 + 字节 TRAE 三方数据
OpenAI 内部报告,2025 年 8 月至 2026 年 6 月各部门输出 token 中 Codex 占比从不足 10% 升至 99.8%,80.6% 员工曾发起等效人类超 30 分钟的请求、25.6% 超 8 小时,非开发者用量个体 +137 倍/组织 +189 倍,法务、财务、招聘 4 月前后跨过使用过半拐点。Anthropic 经济影响研究(逐小时采样)显示近半受访者预期 12 个月内职责显著变化,不到 10% 认为自己会失业、但超三分之一估计初级同事失业概率高于 60%。字节洪定坤分享 TRAE 团队过去半年超 90% 代码由 AI 生成,但人均需求吞吐仅提升约 1.6 倍——引入 Harness(上下文工程/架构约束/团队知识沉淀)后可交付性从 40-60 分升至约 80 分。
Apple 跳过高端 M6,转向 AI 专属 M7 芯片线
Bloomberg 报道 Apple 将跳过高端 M6 Mac 芯片,转而推出 AI 专属的 M7 Pro/Max/Ultra 产品线。
Apple 罕见地牺牲一代高端通用算力、把晶体管预算显式押向 AI,印证端侧推理已成为消费芯片主战场而非附属功能。这对依赖 Apple silicon 的端侧 AI 应用是利好,但也意味着苹果在云端训练上仍靠外购、与全栈自研的 Nvidia 路线分化加剧——M7 强不强将直接决定 Apple Intelligence 能否摆脱"演示优于体验"的口碑。
往期
GPT-5.6 三档齐发,前沿 AI 进入"政府审批"时代
OpenAI 预览 GPT-5.6——旗舰 Sol、均衡 Terra、低价 Luna 三档齐发,主攻网络安全与长程推理。但与模型同样抢眼的是治理:美国政府要审查谁能用 GPT-5.6 并要求延期,Anthropic 的 Mythos 5/Fable 5 也在政府指令下暂停又部分恢复,前沿 AI 正被纳入国家安全框架。同日 Anthropic 指控阿里非法蒸馏 Claude 能力,DeepSeek 用 DSpark 把推理再提速 80%,Qwen 开源世界模型宣称超 Opus 4.8——开源与闭源、东方与西方的张力全面浮现。
Claude Tag 把 AI 嵌进工作流,交互范式开始第三次迁移
这一天,Anthropic 发布 Claude Tag,让 Claude 以团队成员身份加入团队既有的协作工具。一位资深研究者把它称为大模型交互设计的「第三次重构」——从「你要去访问的网站」,到「电脑里的应用」,再到「融入人类活动的持续实体」。同周,另一家头部厂商也在把 AI 往工作流深处推,但路径不同:一家讲「智能体替你做事」,一家讲「它伴你做事」。两条路线的分歧,正在显形。