AI 日报
2026年6月26日 · 周五

GPT-5.6 三档齐发,前沿模型发布步入政府审批时代

OpenAI 发布新一代 GPT-5.6 系列,分 Sol/Terra/Luna 三档,Sol Ultra 在 Terminal-Bench 2.1 达 91.9%,但应美国政府要求仅向约 20 家审批伙伴有限预览。几乎同时,Anthropic 旗下 Mythos 5 获准向关键基础设施机构重新部署、Fable 5 仍未恢复——两大前沿模型的发布节奏首次被政府逐客户审批拿捏。开源一侧,GLM 5.2 以 318 token/s 推理与 ARC-AGI 佳绩持续领跑,与闭源封锁形成对照。

17 则新闻 3 篇深度调研
今日要点
  • GPT-5.6 三档齐发:旗舰 Sol、均衡 Terra、低价 Luna,Sol Ultra 在 Terminal-Bench 2.1 达 91.9%,仅向约 20 家政府审批伙伴有限预览
  • 前沿模型发布前审查成惯例:Anthropic Mythos 5 获准重部署给关键基础设施机构、Fable 5 仍未恢复,GPT-5.6 同走逐客户审批路径
  • Anthropic 指控阿里 Qwen 发动迄今最大规模蒸馏攻击:2.5 万虚假账号、2880 万次交互,两党拟提制裁修正案
  • GLM 5.2 领跑开源:推理 318 token/s、ARC-AGI-2 达 22.8%,登陆 Cloudflare 免费可用、入选 Devin
  • DeepSeek 完成首轮外部融资 74 亿美元,此前完全由 CEO 梁文峰个人资金支撑
  • OpenAI 内部报告:Codex 占各部门输出 token 从不足 10% 升至 99.8%,代理 AI 渗透法务、财务、招聘岗
总览
产品上新 4
产品上新

OpenAI 自研芯片 Jalapeño 与 Broadcom 量产

OpenAI 发布首款自研 AI 芯片 Jalapeño,与 Broadcom 合作量产,专为 ChatGPT/Codex/API 及未来代理产品的 LLM 负载设计,补全从产品到模型到基础设施的全栈平台。

#Jalapeño#Broadcom#自研芯片#OpenAI
产品上新

GPT-5.5 Instant 推出新版本

GPT-5.5 Instant 推出新版本,更好理解提问意图并自适应回复,复杂约束更可靠,购物和本地推荐更连贯;当天向付费用户推送,次日向免费用户。

#GPT-5.5 Instant#OpenAI
产品上新

Codex 登录 ChatGPT 移动端正式可用

Codex 在 ChatGPT 移动端正式可用(GA),支持一对一设备配对安全连接,新增通知、目标、侧边聊天、文件预览和内联 review 评论。

#Codex#ChatGPT 移动端#OpenAI
产品上新

Nous Hermes Agent 推出 MoA 混合代理预设

Nous Research 的 Hermes Agent 推出 MoA(混合代理)预设,可将多供应商模型组合为虚拟模型,在即将发布的 HermesBench 上比 Opus 4.8 高 8%、比 GPT-5.5 高 11%。

#Nous#Hermes#MoA#多模型
融资动态 2
融资动态

DeepSeek 完成首轮外部融资 74 亿美元

DeepSeek 完成新一轮 74 亿美元融资,预计用于锁定算力与人力投入;此前完全依靠 CEO 梁文峰个人资金支撑、从未接受外部融资。

#DeepSeek#融资#梁文峰
融资动态

世界模型数据采集项目 Pim DeWitte 融资 3.2 亿美元

Pim DeWitte 的世界模型数据采集项目宣布 3.2 亿美元 A 轮、估值 23 亿美元,Khosla 领投,贝索斯、Eric Schmidt 等参投;项目采集全球最大可训练(视频,动作)对数据集。

#世界模型#融资#数据集
研究论文 2
研究论文

DeepSeek 开源 DeepSpec 投机解码全栈代码库

DeepSeek 开源 DeepSpec 投机解码全栈代码库(MIT 可商用),含数据准备、训练、评估及新作 DSpark 算法;在 DeepSeek-V4 真实流量中相比 MTP-1 基线,V4-Flash 生成速度提升 60%-85%。

#DeepSeek#DeepSpec#投机解码#开源
研究论文

翁荔发布《Scaling Laws, Carefully》博文

前 OpenAI 高管、现 Thinking Machines Lab 联合创始人翁荔发布技术博文《Scaling Laws, Carefully》,系统梳理规模定律的预测能力、计算最优分配、Kaplan 与 Chinchilla 分歧及数据限制对外推的影响。

#翁荔#Scaling Laws#Thinking Machines
行业动态 4
行业动态 深度调研 →

前沿模型成"战略资产":发布前政府审查机制成形

Anthropic Mythos 5 获准重新部署给一批运营关键基础设施的美国机构、Fable 5 仍未恢复;同期 GPT-5.6 也走政府逐客户审批路径,前沿模型发布节奏首次由政府拿名单逐一放行。

#出口管制#Fable 5#Mythos 5#战略资产
行业动态

Anthropic 指控阿里 Qwen 发动最大规模蒸馏攻击

Anthropic 致信美参议院银行委员会与白宫,指控阿里通义千问对 Claude 发动迄今最大规模蒸馏攻击:4/22-6/5 期间约 2.5 万虚假账号产生 2880 万次交互,规模接近此前 DeepSeek 等三家之和两倍,两党拟在国防授权法案提制裁修正案。

#蒸馏#Qwen#Anthropic#出口管制
行业动态

OpenAI Codex 内部报告:代理 AI 渗透非技术岗

OpenAI 内部报告:2025 年 8 月至 2026 年 6 月,Codex 占各部门输出 token 从不足 10% 升至 99.8%,80.6% 员工发起过等效人类工作超 30 分钟的请求,法务、财务、招聘等非技术岗今春跨过使用过半拐点。

#Codex#代理 AI#OpenAI#企业落地
行业动态

MiniMax 遭大规模 DDoS 攻击服务中断

MiniMax 服务遭遇大规模 DDoS 攻击导致中断,官网一度无法登录,为本月初大幅降价后 M3 性价比走高之际的运营波折。

#MiniMax#DDoS#安全
观点观察 3
观点观察

传 Karpathy 加入 Anthropic,开源贡献受阻引讨论

业内观察:越来越多核心开源贡献者加入大公司后受雇佣关系约束无法继续公开贡献,传 Andrej Karpathy 已加入 Anthropic 而暂停 GitHub 开源工作,引发对 AI 人才集中与开源生态的讨论。

#Karpathy#Anthropic#开源#人才流动
观点观察

Ethan Mollick:Opus 4.7 14 小时构建人类数周软件

Ethan Mollick 分享端到端编码实验:Opus 4.7 用 14 小时、花费 251 美元构建了一个需要人类 2-17 周工程工作量的软件包,模型仍不完美但进步很快。

#Opus 4.7#端到端编码#Ethan Mollick
观点观察

大 AI 实验室争聘哲学家,对齐进入深层问题

《经济学人》报道越来越多大 AI 实验室招聘哲学家,有些甚至在毕业前抛出橄榄枝——模型越来越多碰到「该诚实还是更有帮助」「该顺从还是关键时刻拒绝」等深层问题。

#AI 对齐#哲学家#经济学人
X Feed 流

来自关注列表的从业者讨论 · 算法推荐

0xAA_Science @0xAA_Science 71

OpenAI 发布 GPT-5.6 系列,含三款模型:Sol(对标 Claude Mythos 的前沿模型)、Terra(对标 Claude Fable 的高效日常模型)、Luna(性能接近 GPT-5.5 的低价高频模型)。命名疑似致敬 Web3 项目 Solana 与已归零的 Luna。

@OpenAI: OpenAI 官方介绍 GPT-5.6 Sol 为下一代前沿模型的限量预览,Terra 为面向高效日常工作的均衡模型,Luna 为面向高频任务的快速低价模型。
原帖 ↗
Amank1412 @Amank1412 1038

GLM 5.2 现已在 Cloudflare 上免费开放使用,可零门槛调用。

原帖 ↗
tuolaji2024 @tuolaji2024 42

DeepSeek 完成新一轮 74 亿美元融资,预计用于锁定算力与人力投入。引人关注的是,DeepSeek 此前完全依靠 CEO 梁文峰个人资金支撑,从未接受过外部融资。

原帖 ↗
Xudong07452910 @Xudong07452910 21

OpenAI 发布内部报告,记录 Codex 在过去 10 个月如何改变员工工作方式。从 2025 年 8 月到 2026 年 6 月,各部门输出 token 中 Codex 占比从不足 10% 升至 99.8%;80.6% 员工发起过等效人类工作超 30 分钟的请求,25.6% 超过 8 小时。更值得关注的是非开发者:个体用户增长 137 倍,组织用户增长 189 倍,Legal、Finance、Recruiting 部门今年 4 月前后跨过使用过半拐点。Agentic AI 正从工程师专属工具渗透进律师、财务、HR 等专业岗位。

原帖 ↗
MaxForAI @MaxForAI 43

MiniMax 服务数小时前遭遇大规模中断,官方称系大规模 DDoS 攻击所致,官网一度无法登录。上一次发生类似规模攻击的是 2025 年初的 DeepSeek。MiniMax 本月初大幅降价后,M3 在性价比上成为国产模型中较有优势的选择(优于 DeepSeek-V4-flash)。

原帖 ↗
PierceZhang34 @PierceZhang34 16

前 OpenAI 大佬、现 Thinking Machines Lab 联合创始人翁荔(Lilian Weng)发布技术博文《Scaling Laws, Carefully》,一篇迟来三年的规模定律文章。内容涵盖规模定律的预测能力、计算最优分配原理、Kaplan 与 Chinchilla 为何存在分歧,以及数据限制与拟合细节如何让外推变得棘手。

原帖 ↗
FeitengLi @FeitengLi 22

DeepSeek 开源 DeepSpec:投机解码(speculative decoding)draft model 全栈代码库,含数据准备、训练、评估,MIT 可商用。提供三种 draft 算法:新作 DSpark、并行的 DFlash、基线 Eagle3。DSpark 采用半自回归 + 按服务器负载动态调度验证长度,相比 Eagle3 平均接受长度提升 27%-31%;在 DeepSeek-V4 真实流量中,相比 MTP-1 生产基线单用户生成速度提升 60%-85%(V4-Flash)、57%-78%(V4-Pro)。

原帖 ↗
alpha101xyz @alpha101xyz 12

AI 推理与降低 token 单位成本叙事下,定制 ASIC 芯片将逐步替代 GPU 承担 Agentic AI 推理任务,未来 ASIC 与 GPU 出货量比有望达 1:1。参与方包括 OpenAI 自研芯片 Jalapeño、谷歌 TPU、亚马逊 Trainium、微软 Maia;谷歌 TPU ironwood 相比英伟达 Blackwell 降低 37% 单位 token 成本,v6 可节省超 70%。作者认为该赛道卖方(如博通)才是估值受益方,而作为买方的 Hyperscaler 因 ROE 压力估值反受拖累。

@OpenAI: OpenAI 宣布自研首款 AI 芯片 Jalapeño,与博通合作量产,专为支撑 ChatGPT、Codex、API 及未来 agentic 产品的 LLM 工作负载设计,自建芯片将扩展其从产品到模型到基础设施的全栈平台。
原帖 ↗
_FORAB @_FORAB 421

据《金融时报》爆料,苹果正游说美国政府,希望获准从中国长鑫存储(CXMT)采购内存芯片。CXMT 因涉军工曾被五角大楼列入黑名单,但苹果正面临前所未有的内存成本上升压力,并已将成本转嫁给消费者。

原帖 ↗
0xLogicrw @0xLogicrw 5

阿里通义千问团队正式上线千问输入法官网,并开放 macOS 独立客户端下载,是继微信输入法、豆包输入法后大厂在独立 AI 输入法赛道的又一布局。主打智能语音输入(最快 300 字/分)、AI 自动润色、中英混合识别与 9 种方言,承诺纯净无广告。安装包解析显示其基于 Rime 框架开发,集成语音与 AI 启动桥接组件,支持本地与云端协同处理。iOS/Android/Windows 版即将发布。

原帖 ↗
Voxyz_ai @Voxyz_ai 2378

提醒别再让 Claude Code/Codex 反复 "read this file" "grep the whole repo"。推荐安装 codebase-memory:3 分钟即可索引 Linux 内核(2800 万行),把整个仓库索引成一张涵盖每个函数、文件与依赖的图,一次查询替代数十次 grep/read 循环。在 31 个真实仓库基准测试中,结构化查询 token 减少 10 倍,复杂任务回答质量达 83%,工具调用减少 2.1 倍。

原帖 ↗
yanhua1010 @yanhua1010 805

感叹"上班真是毒药":连 Andrej Karpathy 也因加入 Anthropic 而无法继续在 GitHub 做开源贡献。

原帖 ↗
wey_gu @wey_gu 43

Hermes 给出一种较为 opinionated 但实用的多模型 agent 范式尝试:不让主 loop 模型破坏最大量 prefix cache,也不像 Cursor、Claude Code 那样在 delegate subagent 时允许选择其他模型;而是让非主模型(reference 模型)只做类似 completion 的非 agentic 调用,由主 loop 决定和调用。reference 模型可因擅长某事或更便宜/更贵而引入,也可给出不同角度。这种模式把多模型调用收敛掌控在主模型 loop 上,很有启发。

@Teknium: Teknium 发布 Hermes Agent 的 Mixture of Agents 2.0,可将任意供应商模型组合成自己的混合模型,并像普通模型一样访问预设;在即将发布的 HermesBench 上,用 Opus 与 GPT 组合的 MoA 表现优于 Opus 和 GPT-5.5。
原帖 ↗
Xudong07452910 @Xudong07452910 356

《经济学人》报道一个有趣现象:越来越多大 AI 实验室开始招聘哲学家,有些甚至在毕业前就抛出橄榄枝,因为模型越来越多碰到哲学问题。例如让 AI 少讨好用户、多追问真相(苏格拉底式提问),让 AI 承认自己不知道(苏格拉底式无知)。Anthropic 给 Claude 设计 constitution 时参考了康德、Apple 服务条款和《世界人权宣言》;IBM 的 Granite 模型允许企业按自身价值观调整输出。AI 对齐已不只是"别胡说",而涉及 AI 该更诚实还是更有帮助、该顺从用户还是关键时刻提醒甚至拒绝等更深层问题。

原帖 ↗
yihui_indie @yihui_indie 2023

给新手 Vibe Coding 复杂功能的一个小技巧:在提示词末尾加一句"如果 GitHub / npm 上有成熟的开源方案,直接复用,不要自己实现"。

原帖 ↗