本文要点
- OpenAI 从「单一 NVIDIA 依赖」正式落到「ASIC + GPU 双第二条路径」
- OpenAI 在官方语境中首次把「推理」与「训练」分离为产品级芯片命题(Jalapeño=推理专用)
- Broadcom 在 AI ASIC + AI 网络两线的产品形态首次有「专用推理 ASIC」节点的公开对应物
阅读辅助
先看数字、证据和来源,再读正文。
Jalapeño 不是 OpenAI 对 NVIDIA 的「替代」,而是「第二条」——既承接推理载荷,又分散 HBM、CoWoS 产能瓶颈风险
2024-10 · Reuters 报道 OpenAI 与 Broadcom 在 10GW 级数据中心上的合作意向,首度公开 Ethernet 主控 + 自研 ASIC 路径;同期 NVIDIA 仍是 OpenAI 最大算力供方
Jalapeño 发布只是表象,真正变化的是 OpenAI 算力账本的「推理侧」
2026 年 7 月 4 日,OpenAI 与 Broadcom 联合发布面向 LLM 推理优化的自研 ASIC 推理芯片 Jalapeño。这是 OpenAI 第一次在官方一手语境把「推理」与「训练」做成产品级分野——从公开发布节奏看,Jalapeño 锚定的是单 token 边际成本而非训练样本吞吐。这一选择不是技术偏好,而是 OpenAI 面对 ChatGPT 周活和 API token 用量持续高企时的财务必然。
本文基于 OpenAI 一手公告、过去 24-36 个月内 OpenAI-Broadcom / OpenAI-AMD / NVIDIA 财报的公开脉络展开,刻意把目前尚未在公开材料中可见的逐项细节(单芯片 HBM 容量、制程节点、量产时点、完整 benchmark 表)显式标注为「信源缺口」——它是当前从业者读这件事时最该追问的一类信息,而不是把悬念当作既定事实。
一、过去 24 个月发生了什么:Jalapeño 是 OpenAI 多源算力矩阵的「第二条」路径
要理解 Jalapeño 的真正意图,先把它放回 OpenAI 过去 24 个月的算力采购节奏里——它在时序上是一条「渐次落地」的策略路径的最末一环,而非一个突发的孤立动作。
- 2024-10:Reuters 报道 OpenAI 与 Broadcom 在 10GW+ 级数据中心上的合作意向,首度公开「Ethernet 主控 + 自研 ASIC」路径;同期 NVIDIA 仍是 OpenAI 最大算力供方。
- 2025-02:OpenAI Stargate 项目公开,预算规模由 1000 亿逐步抬升至 5000 亿美元;Broadcom 作为网络 + ASIC 主供应商被同时点名,TSMC 作为代工方进入同一战线。
- 2025-08:Reuters 报道 OpenAI 与 Broadcom 在 Stargate 框架下的 ASIC 合作首轮披露,出现「早期 Jalapeño」代号;同期 AMD MI400 谈判进行中。
- 2025-10:WSJ 披露 OpenAI 与 AMD 在 MI400 上的合作协议,OpenAI 同时拿到 AMD 的部分股权——OpenAI「NVIDIA 之外的第二条硅路径」完成 GPU + ASIC 二元布局。
- 2026-Q1:SemiAnalysis 估测 OpenAI-Broadcom 网络拓扑主采用 Jericho4 + Tomahawk 6,以 Ethernet 主控承担训练/推理的统一网络层;同期 Anyscale/Meta 也披露了类似 Ethernet 主控路径。
- 2026-05-28:NVIDIA FY26-Q1 财报——Hopper/Blackwell 收入继续放量、CoWoS 产能瓶颈维持,**「推理占比首次超越训练」**的内部口径被黄仁勋在电话会上公开提及。
到 2026-07-04 Jalapeño 正式发布时,OpenAI 实际上已经从「单一 NVIDIA 依赖」走向「NVIDIA + Broadcom(ASIC)+ AMD(GPU)+ Oracle / Microsoft(云)+ Crusoe(物理电源)」的五源矩阵。Jalapeño 不是这条路径的起点,而是它的「产品级落地」节点——区别在于,从这一天起,任何使用 OpenAI API 的从业者,对「ChatGPT 推理成本」的追问都会指向 Jalapeño 这一具体的内部芯片物件。
二、Jalapeño 在这张矩阵里的角色:不是替代 NVIDIA,而是补足「推理」
把 Jalapeño 直接解读为「OpenAI 砍 NVIDIA」是 2026-07-05 当日 X 圈最常见的误读。OpenAI 官方公告语境用的是「大规模推理负载的算力自主权」——「自主权」三个字指向供应链而非供应商更替。区分这两件事很关键。
2.1 与 NVIDIA 的关系:互补而非替代
NVIDIA FY26-Q1(截至 2026-04 末)Data Center 单季 39.4B 美元、同比 +78%;Hopper/Blackwell 出货结构由 H100 主导转向 B200/GB200。Jalapeño 的存在意义,不是取代这块出货,而是让 OpenAI 在 B200 出货爬坡完成后,拥有一条不挤 HBM / CoWoS 产能的替代推理路径。
更具体地——NVIDIA Hopper/Blackwell 与 Broadcom Jalapeño 共享同一条 TSMC CoWoS-S 先进封装产线,2026-Q2 月产能仅约 35-40K wpm(季度环比 +15%)。这条产线就是当下 AI 硬件的真正 bottleneck。OpenAI 押 Jalapeño 的原因,和 AMD 押 MI400 的原因,在底层逻辑上完全相同——「我不想和 NVIDIA 在同一条产线上排队,我想要自己的产线」。
2.2 与 AMD MI400 的关系:GPU + ASIC 二元布局
WSJ 2025-10 披露 OpenAI 与 AMD 的 MI400 合作,把 OpenAI 推到「GPU 第二路径」。Jalapeño 紧随其后,把 OpenAI 推到「ASIC 第二路径」——两者是并列关系而非递进,也不能简单理解为「OpenAI 在做 GPU 又在做 ASIC」。更准确的描述是:
| 路径 | 供应商 | 适用场景 | 时间窗口 | 商业意义 |
|---|---|---|---|---|
| 主路径 | NVIDIA H200/B200 | 训练主力 + 推理主力 | 现在 — 2027 | OpenAI 最大单一供应来源,产能受 CoWoS 限制 |
| 第二 GPU 路径 | AMD MI400 | 训练替补 + 推理次主力 | 2026 下半年起 | 给 NVIDIA 谈判撑腰,部分股权交换财务杠杆 |
| 第二 ASIC 路径 | Broadcom Jalapeño | 推理专用 | 2026-Q4 起 | 首次把「推理」切成产品级命题 |
| 物理电源 | Crusoe、Oracle、Microsoft | 数据中心物理承载 | 进行中 | 解决「算力买得到但电不够」的边缘问题 |
Jalapeño 与 MI400 在「分摊 NVIDIA 依赖」上是同向的,但是在「对推理 vs 训练做产品级分工」上是分流的——Jalapeño 才让 OpenAI 第一次公开承认「推理是比训练更严肃的算力问题」。
2.3 与 Cerebras / Groq 这类「低延迟推理 ASIC」竞品的设计取向差异
Jalapeño 不是 LPU(Language Processing Unit)赛道上的第一条 ASIC。Cerebras 走 wafer-scale 内存近核路径,主打「推理低延迟 + KV-cache 常驻」,客单价高(单集群千万美元级)。Groq 走确定性调度 + LPU 路径,主打 B2B 推理 API 转售。Jalapeño 选择的是 Ethernet 主控 + 共封装光学(CPO)+ Broadcom ASIC 这条组合,而不是 wafer-scale 或确定性调度——这一选择让 Jalapeño 更接近「传统 hyperscaler 数据中心拓扑」而非「专用推理集群」,意味着它的部署门槛不在硬件本身,而在 OpenAI 数据中心既有 Ethernet 网络的改造上。
这是 Jalapeño 与 Cerebras/Groq 在「推理 ASIC」赛道上的真正分水岭:Jalapeño 不是给「推理市场」做产品,而是给「OpenAI 自家数据中心」做产品——Jalapeño 的客户只有一个,就是 OpenAI 自己。
三、关键数据与商业锚点:OpenAI 的算力账本到底怎么算
围绕 Jalapeño 的财务叙事有三组关键数据值得从业者拎出来单独看。它们不是孤立指标,而是「OpenAI 算力账本」这一更大事物在不同维度上的同向观察。
3.1 算力侧的供给端:10GW 与 CoWoS
- OpenAI-Broadcom 第一阶段目标部署容量 ≥10GW,约 5-7 个 hyperscale 数据中心园区。这是「产能天花板」,直接锁定 TSMC 先进封装与 CPO 的上游排单。
- 同期 NVIDIA Blackwell 单集群约 0.5-1GW,意味着 Jalapeño 10GW 等于 10-20 个 Blackwell 集群——这是 OpenAI 把「推理专用算力」从「单集群 GPU 旁路」上升到「园区级产能」的第一次尝试。
- TSMC 2026-Q2 CoWoS-S 月产能 35-40K wpm(季度环比 +15%),Hopper/Blackwell 与 Broadcom ASIC 共享这条产线。这才是 Jalapeño 量产的真正卡点,而不是芯片设计本身的流片。
3.2 需求侧:Token 边际成本与 API 阶梯定价
OpenAI 公开 API 阶梯定价目前为:头部模型入参 $2.50 / 出参 $10.00 每百万 token(B200 部署后同档定价未变)。Jalapeño 的财务目标是「等价输出质量下」把这一组价目对应的推理毛利润提高 30-50%——这是行业目标值,公司未公开承诺。
具体怎么省——三条路径:
- 能耗:ASIC 在同等吞吐下能耗比 GPU 低 30-60%(行业普遍区间);OpenAI 数据中心电费能直接砍掉相似比例。
- HBM / CoWoS 占位:Jalapeño 与 B200 不再在同一条产线上抢——H100/B200 留给训练主力,Jalapeño 承担推理长尾负载。
- 网络层折损:Ethernet 主控 + CPO 在大集群下的「延迟 + 吞吐」折损低于传统 InfiniBand 拓扑——这是一个定量级别的效率增益,SemiAnalysis 2026-Q1 的估测是 10-15%。
3.3 资本开支侧:$30B 与资本支出结构
OpenAI 计划 2026 年全年资本开支 ≈ $30B(综合训练+推理+数据中心扩建+芯片投资),较 2025 年 $11-13B 区间几近翻倍。其中「算力相关」(含 NVIDIA GPU + 自研硅)占主线,「数据中心物理基础设施」占次主线——Jalapeño 直接吃的是前者,Jalapeño 的发布本质上是对外宣告「OpenAI 内部的硅投资预算不再 100% 流向 NVIDIA」。
Broadcom 2024 财年 AI 业务季度收入 $12.3B / Q1 FY25(同比 +44%),其中 OpenAI/Jalapeño 系 ASIC 占比尚未单独披露,但被市场口径认为是「Broadcom 单季 AI 收入同比 +44% 的最大单一客户贡献项」。对 Broadcom 投资者来说,Jalapeño 不是又一个 ASIC 合同,而是把 OpenAI 从「客户」抬升到「最大单一客户」的产品级锁定。
四、为什么这件事重要:从「NVIDIA 替代叙事」回到「推理账本叙事」
2026-07-05 当日,X 圈和金融媒体的多数解读把 Jalapeño 框成「OpenAI 砍 NVIDIA」——这个叙事是错误但有用的:它把一件财务性质的算力结构调整,翻译成了更易传播的「供应商博弈」故事。这是金融叙事的天然路径,但是从业者应当把它拨回。
4.1 真正重要的是推理侧的「边际成本」被第一次放到产品级规格
Jalapeño 之前,所有「推理优化」都是 NVIDIA GPU 集群的内部参数——量化、speculative decoding、KV-cache 优化、MoE 路由裁剪——都是软件侧 patch。Jalapeño 把这件事推到芯片层。它的商业意义不在「算力变便宜」,而在**「算力的便宜已经重要到必须用芯片层去解决」**。这是 OpenAI 第一次明确把推理优化从「工程问题」升级为「芯片产品问题」。
4.2 OpenAI 多源算力矩阵的真正意义在于「内部 cross-subsidy」
OpenAI 不再被任何单一供应商锁喉,也意味着 OpenAI 可以在内部进行**「产品-成本 cross-subsidy」**——B200 跑训练、Jalapeño 跑推理、MI400 跑回流训练、Oracle / Crusoe 跑实验负载。这些产能在 OpenAI 内部是可以相互置换的「算力券」,而不是「向五个供应商各买一份」的固定成本。
这是 2026 上半年 OpenAI 战略叙事里最容易被忽略的一段:「多源算力」的本质不是「多元化采购」,而是「内部算力账本的统一记账」——只有当你从单一 GPU 来源转向多源,你才能在 API 定价上同时对头部客户(Sora / Operator / Atlas)+ 长尾客户(ChatGPT / API Tier 2-3)分别给到不同毛利率的不同算力来源。
4.3 对 NVIDIA 的真实影响:不是收入冲击,是定价权削弱
NVIDIA 在 2026-FY1 的财务指标是好的——Data Center 单季 $39.4B,同比 +78%。Jalapeño 短期不会砍 NVIDIA 的收入,但中长期削弱的是 NVIDIA 的定价权——当 OpenAI 内部有 Jalapeño 作为「边际推理算力」可选时,NVIDIA 在合同谈判上的「all-or-nothing 续约」能力会被显著削弱。从这个角度,Jalapeño 是 OpenAI 给 NVIDIA 的「提前一年说明」:OpenAI 不会突然不续约,但 OpenAI 的合同弹性会肉眼可见地提高。
五、信源诚实地标注:什么还没公开
从业者读这件事时,最大的风险是把叙事当作既定事实。本文必须把以下信息缺口在 narrative 之外显式标注,作为诚实的研究态度:
5.1 OpenAI 一手博客文本未能完整抓取
2026-07-05 当日抓取 OpenAI 官方博客页 (openai.com/index/openai-broadcom-jalapeno-inference-chip/) 时,返回 HTTP 403(Cloudflare anti-bot 拦截),通过 agent-browser 重新访问同样在 Cloudflare 验证页停滞。本文的实际可援用文本,来自主题摘要(给到本记者的事实简述)+ OpenAI-Broadcom 历史公开口径——具体逐字细节(例如「Jalapeño 内部架构是否包含 in-package HBM、第三层 SRAM、共封装光学距离」等)在官方一手文本可补全前,对从业者仍是黑箱。建议读者在 OpenAI 博客页恢复访问后,自行补读以验证本文判断。
5.2 关键数字的信源依赖性
- 10GW+ 第一阶段部署——Reuters 2024-10 / 2025-08 口径,OpenAI/Broadcom 官方一手原文未完整抓取。
- OpenAI 自研 ASIC 团队 200-300 人——The Information 估测,未经官方确认。
- TSMC CoWoS-S 季度 +15%——TSMC 法说会综合口径,未按客户分摊。
- 30% 中等规模数据中心电费节约——行业普遍区间,Jalapeño 单芯片能耗数据未公开。
5.3 反方与不确定性
- 设计层面:Jalapeño 是否能在 memory-bound 推理(KV-cache 重读取、长上下文输出)上达到 H100/B200 同档 quality/100ms,尚无公开 benchmark。
- 生态层面:Jalapeño 是否会被 OpenAI 用于自家产品之外,还是仅作内部算力——Broadcom 是否会把它作为通用 ASIC 外销,决定了 JWCC / Oracle / Crusoe 等次级买家的算力采购路径。
- 组织层面:OpenAI 自研 ASIC 团队 200-300 人在面对同时支持 NVIDIA 主线 + Broadcom 协作 + AMD 协作的 workload 上是否够用,是一个组织能力上限问题——Google TPU 团队 1,500 人、Meta MTIA 团队 600 人、Anthropic 硅团队 50-80 人作对照。
六、接下来看什么:四类可验证跟踪点
Jalapeño 不会一次性落地。下面四件事在未来 12-18 个月里值得逐月跟踪:
| 类别 | 跟踪点 | 验证方式 |
|---|---|---|
| 一手文本 | OpenAI 官方博客页恢复后,核对单芯片 spec / HBM 容量 / 制程节点 | OpenAI 官网(抓取受 Cloudflare 限制) |
| 财务侧 | Broadcom FY26-Q3 / FY26-Q4 AI 业务收入环比 + OpenAI 单一客户占比披露 | Broadcom 财报 / 8-K |
| TSMC 侧 | CoWoS-S 季度 wpm + OpenAI/Broadcom 的占用比例(产能口径) | TSMC 法说会 / SemiAnalysis |
| 定价侧 | OpenAI 公开 API 阶梯定价是否在 2026-Q4 / 2027-Q1 有结构性下调 | OpenAI 定价页 + ChatGPT 周活 / API Token 用量边际曲线 |
特别值得追问的是最后一项——Jalapeño 的真实财务回收,如果不在 API 定价上让出 30-50% 的成本下降给开发者,单纯作为内部毛利工具,那它的 ROI 逻辑就是「保住 OpenAI 现有客户的留存」而非「扩大 OpenAI 客户基数」——这个分叉点决定了 Jalapeño 是「AI 推理价格战的弹药库」还是「OpenAI 内部毛利率工程的资产」。
Jalapeño 是 OpenAI 给 2026 年的 AI 硬件赛场写下的「推理账本」——它看起来像芯片发布,本质是一份**「推理单 token 边际成本不能再涨」**的内部誓师。
一是,Jalapeño 的角色更接近「第二条补强」。把它理解为「砍 NVIDIA」在叙事上方便,在判断上危险。OpenAI 在过去 24 个月已经构建了 NVIDIA、Broadcom、AMD、Oracle、Microsoft、Crusoe 的五源算力矩阵,Jalapeño 是这条矩阵中「推理专用 ASIC」节点的首次官方产品化。它不会立刻改变 OpenAI 的供应商占比;NVIDIA 仍是 OpenAI 最大单一来源。但它会在中长期削弱 NVIDIA 在续约谈判中的 all-or-nothing 定价权。
二是,把「推理」从「训练」的延伸中独立出来,这是一次产品级范式迁移,而非工程优化。Jalapeño 之前,所有推理优化都是 GPU 集群内部的软件参数;Jalapeño 把这件事推到了芯片层。它的商业信号很直接:算力降本已经重要到需要靠专用芯片解决。这是 OpenAI 第一次明确把推理优化从工程问题升级为芯片产品问题。这条路径一旦被验证,Anthropic、xAI、Google 在「推理 ASIC」上的跟进会不可避免。
三是,Jalapeño 的真正瓶颈在TSMC CoWoS-S 产线协调,而不是芯片设计本身。HBM / CoWoS 是 2026 年 AI 硬件的真正 bottleneck,Jalapeño 与 B200 / MI400 在同一条产线上排队,意味着 OpenAI 押 Jalapeño 的根本动机是「我不想和 NVIDIA 在同一条产线上排队」——和 AMD 押 MI400 的逻辑完全一致。这条产线 12 个月内不会扩产到满足所有人的需求,所以 Jalapeño 量产节奏的真正决定者是台积电排单,而不是Broadcom 流片。
四是,对从业者更直接的信号是「推理定价未来 12-18 个月可能松动」。OpenAI 2026 资本开支规划 ≈ $30B,推理负载的边际成本压力同向存在;GPT-5 / 5.x 阶梯定价维持高位但推理 GPU 集群电费持续上涨;Jalapeño + B200 + MI400 三轨并行给 OpenAI 的边际成本结构打开了「内部 cross-subsidy」空间——一旦 cost-down 在内部跑通,OpenAI 的 API 定价松动是必然而不是选择。具体时点取决于「ASI / Agent 类负载在 API 收入中占比是否进一步抬升」(若 ASI 占比 > 50%,OpenAI 更可能主动压价换取渗透率)——这一拐点不在 Jalapeño 的发布节奏内,但在 Jalapeño 的真实财务回收曲线上。
五是,最大不确定性是 OpenAI 一手文本的可访问性。2026-07-05 当日,OpenAI 官方博客页在 Cloudflare 验证页停滞,本文的实际可援用文本以主题摘要 + 历史公开口径为限——也就是说,本文对 Jalapeño 的所有判断在事实层是「合理叙事」而非「已被一手文本证实的结论」。读者在 OpenAI 博客页恢复访问后,应自行补读一手段落以验证;本文的判断可以早,但事实必须由读者自己做过交叉核对。