平台条款战 + 物理供给战 + agent 方法论战:HBM 涨价、HP Frontier 全企业上线、贾扬清离开英伟达
过去 24 小时,真正的当日主线不是又出一个模型,而是同时砌起的三道墙:Google 据 FT 报道限制 Meta 使用 Gemini,平台方首次把模型访问条款做成对竞争对手的武器;OpenAI 把 Frontier 战略合作的第一个全企业客户交给 HP,验证 Frontier 作为'运营操作系统'的端到端落地;Coinbase 一口气把默认模型换到 GLM 5.2 与 Kimi 2.7 等开源权重,AI 支出砍近半,LibreChat 缓存命中率从 5% 拉到 60%。同时,Meta 在 Nature 上发表 Brain2Qwerty v2 端到端脑机接口、贾扬清离开被收购仅一年的英伟达、DeepSeek V4 官宣 7 月中旬发布并引入高峰 2 倍定价。每一条都指向同一个判断:模型发布期暂缓后,AI 产业竞争的重心正从'谁的模型更强'下沉到'模型之外'——谁能用条款卡住对手的供给、谁先把企业内部 agent 当成操作系统、谁能让基础设施继续扩张。
今天真正改变的不是又出了一个新模型——当模型迭代本身进入平台期,竞争重心正从'谁的模型更强'下沉到'模型之外'的三层:平台条款战(Google 限 Meta 用 Gemini 是第一款被实锤的'API 条款武器')、企业运营操作系统战(HP Frontier 第一个全企业上线、Coinbase 把默认模型换开源 + 支出砍近半,验证'开源权重 + LLM 网关 + 缓存'是企业 LLM 的成本公式)、物理供给战与人事墙(HBM/内存涨价逼近天花板 + 贾扬清离开英伟达,提示明星收购整合模式有上限)。三道墙叠在一起,头部厂商的下一阶段较量,不再是参数数字,而是供给生态、企业落地能力、关键人物与团队的去向。
本期重点 · 深度报告
6 篇深度调研,点进去看完整分析与多源交叉验证
快讯 · 看标题就懂
7 条次要信号,附早报判断与原始链接
腾讯被曝与长鑫存储签 200 亿+ 服务器 DRAM 供货合同,国产替代加速
据 _FORAB 6-29 转行业消息:腾讯与长鑫存储签署超 200 亿元服务器 DRAM 供货合同,字节跳动、阿里云、小米、联想也在与长鑫洽谈更多芯片采购。长鑫是中国规模最大 DRAM 存储芯片厂商,被视为中国版 SK 海力士 / 美光,正在加速扩产。
这是国产 AI 硬件供应链 2026 H2 的标志性订单——200 亿元规模意味着长鑫的良率与产能已被一线互联网大厂接受为合格供应;在 HBM 涨价逼近算力天花板(JEFFERIES 预警 Q3 +50% / Q4 +40%)的语境下,长鑫的服务器 DRAM + 长江存储 3D NAND 共同构成中国 AI 数据中心的'内存墙国产替代路线'。但腾讯的真实采购量、是否含 HBM 等高规格料、是否仍保留 SK 海力士备货,都未官方确认,需以厂商财报 / 海关数据为准。
接下来看:长鑫 Q3/Q4 出货与良率数据是否公开 / 是否仍同步进口 SK 海力士 / 美光的高规格 HBM(国产替代是'替换 + 增量'双轨,可能并非完全替代)
Cursor 600 亿美元被 SpaceX 收购,levelsio 等早期投资人退出
据 LinearUncle 6-29 转引:全球最知名独立开发者 levelsio 是 Cursor 早期投资人,B 轮投了 10 万美金。Cursor 刚被 SpaceX 以 600 亿美元收购,他成功退出,投资组合价值已达 1000 万美金。同日 cysilxuq 进一步分析 Musk 把 xAI 塞进 SpaceX 的财技。
Cursor 600 亿美元收购价是 AI coding 工具赛道的天花板信号——Anysphere/Cursor 4 年估值从 0 到 600 亿美元,远超 GitHub 2018 年被微软 75 亿美元收购的量级;Musk 把 xAI 装进 SpaceX 的'Muskonomy'结构进一步抬升 AI 公司估值锚。但 SpaceX 在 600 亿美元估值的接盘是否会持续支撑 AI coding 估值,以及 Cursor 产品后续是否被收编进 SpaceX Stargate / 内部 codegen,值得跟踪。
接下来看:Cursor 是否继续作为独立产品运营、还是逐步收编进 SpaceX 内部 codegen / AI coding 赛道其他玩家(Windsurf / Replit / Cody)估值锚是否上调
BINEVAL:LLM-as-Judge 新方法,把每条评估拆成原子级是非题,无训练即匹配 UniEval / G-Eval
omarsar0 6-27 转引 BINEVAL 论文(1845 赞):把 LLM-as-Judge 每个评估维度拆解成原子级是非题,逐项独立回答后聚合为多维分数,可逐题追溯失分原因并直接反馈给 prompt 改进。在 SummEval / Topical-Chat / QAGS 上无需训练即匹配或超过 UniEval 和 G-Eval,在事实一致性上尤其强。
把 NLG 评估变成'可解释列表题'是 LLM-as-Judge 工程化的关键进展——传统 G-Eval / UniEval 用连续分数,失败时无法定位是事实性、流畅性、相关性还是其他维度出问题;BINEVAL 拆解后,prompt 调试可逐项对症,且无需训练即达 SOTA 水平,对企业内部 LLM 评测管线是低成本工具。但论文尚未在更大模型 / 更广指标上复现,实际生产环境适配仍待评估。
接下来看:论文 arXiv ID 与开源代码是否被独立团队复现 / 是否被纳入 HuggingFace Evaluate / LangSmith 等主流 LLM 评测平台
Google AI Studio 官方免费开放 100 万 token/分钟,登录即用,无需信用卡
据 EngMoElgaraihy 6-28 22:12 UTC 推文(823 赞)转述:Google AI Studio 官方免费开放每分钟 100 万 token、零限制,无需信用卡、无需订阅,登录即可使用——原本价值数千美元/月的开发者算力被零门槛免费送出。
这是 Google 在开发者侧的极端压力测试。同期 Gemini API 商业化定价、Anthropic Claude / OpenAI ChatGPT 都还在按 token / 包月收费,'免费 + 100 万 token / 分钟'对独立开发者、学生、初创团队几乎等于全量免费——会快速侵蚀 Gemini API 在 coding 类工作流的份额。但 Google 的算力边际成本与反滥用风控是否能撑住 24/7 高负载仍是关键变量,若被薅羊毛过度,'免费'窗口随时可能收紧。
接下来看:Google 算力供给是否能撑住独立开发者大幅涌入(薅羊毛场景) / Gemini API 商业化定价是否相应调整或继续高位
百度已成 AI 全栈玩家:自研芯片 + 文心 + 云 + Apollo Go,All in AI
Bloomberg Odd Lots 播客(@business 转引,2026-06-29 11:00 UTC):百度已成 AI 行业全栈玩家——自研芯片、文心一言模型、云系统、Apollo Go 自动驾驶业务四条腿并行。Baidu CFO Henry He 在播客讨论如何用 AI 改造组织架构并吸引新人才。
百度是中国厂商里少数同时跑通'自研 AI 芯片 + 自研 LLM + 公有云 + 自动驾驶业务'四条腿的全栈玩家——其他要么只跑芯片(寒武纪 / 燧原),要么只跑模型(GLM / Kimi / 深度求索),要么只跑云(阿里云 / 腾讯云);百度全栈的关键问题是内部资源怎么在四条腿之间分配,以及 Apollo Go / 文心模型能不能撑住资本市场对'百度 AI'的估值锚。
接下来看:百度下一代 AI 芯片(昆仑?)与文心模型升级节奏 / Apollo Go 自动驾驶商业化进展
GLM 下一版本社区调研:评论区几乎被 vision 和 token efficiency 占满
智谱 GLM 团队 ZixuanLi_ 6-29 转发 jietang 调研:下一代 GLM 必须有什么新特性?评论区几乎被'vision'(视觉/多模态)和'token efficiency'(token 利用率/上下文效率)两类反馈占据。
智谱 GLM 与月之暗面 Kimi / DeepSeek / Qwen 的下一版竞争焦点集中在两点:多模态(vision / 视频)和 token efficiency(长上下文压缩 / 缓存命中);Coinbase(同日)把 GLM 5.2 / Kimi 2.7 设为默认,意味着开源权重派已经被压到'必须把 vision + efficiency 做扎实'才能保住企业级客户。下半年国产开源权重迭代节奏会比 2025 年更快,但产品质量是否同步跟上仍是观察点。
接下来看:GLM 5.3 / 6.x 是否在 vision 与 token efficiency 维度给出对应更新 / Kimi 2.8 / DeepSeek V5 是否跟 vision,长上下文(>1M token)是否进入主流
OpenFugu 305★:开源复现 Sakana AI Fugu LLM orchestrator,4 周从读 → 训练 → 服务
trotsky1997/OpenFugu(GitHub,305★):Sakana AI Fugu LLM orchestrator 开源复现,覆盖读 → 运行 → 训练 → 服务全流程。
Sakana Fugu 是日本 Sakana AI 在 2026 上半年重点推进的 LLM orchestrator(多模型协同调度),OpenFugu 在 4 周内把核心流程做到开源复现,是开源社区对日本前沿 AI 实验室的快速跟读;间接说明 Sakana 的技术护城河主要在训练数据与评测,orchestrator 架构本身可被复现。但 Sakana 后续若把 Fugu 关键能力(LLM 协同下的质量提升幅度)做出更强论文,OpenFugu 的工程复现版本是否跟得上仍是变量。
接下来看:OpenFugu 是否在 4-6 周内完成 v1 发布并复现 Fugu benchmark / Sakana AI 是否公开论文或新版本 Fugu
推特上在讨论什么
精选 10 条从业者发言,点"原帖"看一手出处
Meta 发布非侵入式脑机接口研究重大进展 Brain2Qwerty v2,登 Nature。基于 v1 升级,首个能实时从原始脑信号解码整句的端到端流水线,从字符级跃迁到词与语义级。9 名志愿者 MEG 打字 10 小时共约 22,000 句,平均词准确率 61%,最佳受试者 78%,>50% 句子解码错误 ≤1 词,性能随数据量对数线性扩展。
AIatMeta:为加速神经科学突破,Meta 开源 Brain2Qwerty v1 与 v2 的完整训练代码,合作方 @bcbl_ 同时发布 v1 数据集。原帖 ↗
DeepSeek V4 正式版将于 7 月中旬发布,不再是 2 个月的预览版。预期需求旺盛,因此引入高峰时段定价机制:高峰期价格为现行 2 倍,基础价格保持不变。这是国产开源权重派首次主动做供给侧时段分层。
原帖 ↗Coinbase 通过 LLM 网关将智谱 GLM 5.2、月之暗面 Kimi 2.7 等开源权重模型设为默认选项,结合路由和缓存优化,在 token 用量持续增长的同时将 AI 支出削减近半。LibreChat 缓存命中率从 5% 升至 60%。91% 员工从未触及用量上限,因此选择'更好的默认值'而非降速。代码 review 使用多种模型互相校验。
Brian Armstrong:如何让 AI 支出保持平稳而 token 用量指数级增长:不是靠摩擦和限额,而是靠更好的默认值、路由和缓存。原帖 ↗
前 Facebook/阿里副总裁、LeptonAI 创始人兼 CEO、英伟达系统软件副总裁贾扬清已从英伟达离职。距离黄仁勋 7 亿美元收购这家仅 20 人的团队才过去约一年。SemiAnalysis 称 DGX Lepton 运营效果不及黄仁勋预期,更深层原因涉及开源承诺分歧与产品落地执行力,黄仁勋可能推翻了 DGX Lepton 的开源决定。贾扬清已出任 GPU 创业公司 Hyperbolic 顾问。
SemiAnalysis:突发:LeptonAI 创始人/CEO 在被收购仅一年后离职。Jensen 据报花费 7 亿美元收购 LeptonAI,令人震惊。DGX Lepton 表现不佳,远未达到 Jensen 预期。原帖 ↗
谷歌向开发者敞开大门:Google AI Studio 官方免费开放每分钟 100 万 token、零限制,无需信用卡、无需订阅,登录即可使用——原本价值数千美元/月的算力免费开放。
原帖 ↗百度已成 AI 行业全栈玩家:自研芯片、文心一言模型、云系统、Apollo Go 自动驾驶业务。Baidu CFO Henry He 在 Odd Lots 播客讨论如何用 AI 改造组织架构并吸引新人才。
原帖 ↗BINEVAL 论文介绍 LLM-as-Judge 新方法:把每个评估维度拆解成原子级是非题,逐项独立回答后聚合为多维分数,可逐题追溯失分原因并直接反馈给 prompt 改进。在 SummEval/Topical-Chat/QAGS 上无需训练即匹配或超过 UniEval 和 G-Eval,在事实一致性上尤其强。
原帖 ↗GLM 下一版本社区调研:评论区几乎被 vision 和 token efficiency 相关反馈占据。jietang 发起提问'下一代 GLM 必须有什么新特性',呼吁讨论专门能力。
jietang:下一代 GLM 必须有什么新特性?原帖 ↗
腾讯被曝与长鑫存储签署超 200 亿元服务器 DRAM 供货合同,字节跳动、阿里云、小米、联想也在与长鑫洽谈更多芯片采购。长鑫是中国规模最大 DRAM 存储芯片厂商,被视为中国版 SK 海力士/美光,正在加速扩产。
原帖 ↗Musk 财技一流:把 xAI 塞进 SpaceX,OpenAI 和 Anthropic 融资将变难、上市更难、流动性被抽干只能延期。趁此时搞定 TSLA 老股东,把 TSLA 合并进 SpaceX 换股,SpaceX 营收增 900 亿美元,PS 从 110 降到 30 多(只比 NVDA 高一点)再叠加太空叙事,星链与火箭政府订单上去后 PS 可降至 20 以下,几万亿市值合理。
原帖 ↗