行业动态

Jalapeño 是 OpenAI 的第二条硅路径:Broadcom 系 ASIC 想从 NVIDIA 嘴里抢下「推理」这块更大的蛋糕

OpenAI 把「推理」当成比「训练」更严肃的算力问题——Jalapeño 是这条财务逻辑的产品级落地。

2026年7月5日 · 周日深度报告低置信重要度 5/5

#OpenAI #Broadcom #Jalapeño #推理芯片 #ASIC #NVIDIA #Stargate #推理成本

本文要点

OpenAI 从「单一 NVIDIA 依赖」正式落到「ASIC + GPU 双第二条路径」
OpenAI 在官方语境中首次把「推理」与「训练」分离为产品级芯片命题(Jalapeño=推理专用)
Broadcom 在 AI ASIC + AI 网络两线的产品形态首次有「专用推理 ASIC」节点的公开对应物

阅读辅助

先看数字、证据和来源，再读正文。

10 吉瓦以上 OpenAI-Broadcom 第一阶段算力部署规模

≈ $30B OpenAI 计划 2026 年全年资本开支指引(综合口径)

5 条 Claim Audit

Jalapeño 不是 OpenAI 对 NVIDIA 的「替代」,而是「第二条」——既承接推理载荷,又分散 HBM、CoWoS 产能瓶颈风险

8 个时间点

2024-10 · Reuters 报道 OpenAI 与 Broadcom 在 10GW 级数据中心上的合作意向,首度公开 Ethernet 主控 + 自研 ASIC 路径;同期 NVIDIA 仍是 OpenAI 最大算力供方

7 个来源 7 个非 X 来源

Jalapeño 发布只是表象,真正变化的是 OpenAI 算力账本的「推理侧」

2026 年 7 月 4 日,OpenAI 与 Broadcom 联合发布面向 LLM 推理优化的自研 ASIC 推理芯片 Jalapeño。这是 OpenAI 第一次在官方一手语境把「推理」与「训练」做成产品级分野——从公开发布节奏看,Jalapeño 锚定的是单 token 边际成本而非训练样本吞吐。这一选择不是技术偏好,而是 OpenAI 面对 ChatGPT 周活和 API token 用量持续高企时的财务必然。

本文基于 OpenAI 一手公告、过去 24-36 个月内 OpenAI-Broadcom / OpenAI-AMD / NVIDIA 财报的公开脉络展开,刻意把目前尚未在公开材料中可见的逐项细节(单芯片 HBM 容量、制程节点、量产时点、完整 benchmark 表)显式标注为「信源缺口」——它是当前从业者读这件事时最该追问的一类信息,而不是把悬念当作既定事实。

一、过去 24 个月发生了什么:Jalapeño 是 OpenAI 多源算力矩阵的「第二条」路径

要理解 Jalapeño 的真正意图,先把它放回 OpenAI 过去 24 个月的算力采购节奏里——它在时序上是一条「渐次落地」的策略路径的最末一环,而非一个突发的孤立动作。

2024-10:Reuters 报道 OpenAI 与 Broadcom 在 10GW+ 级数据中心上的合作意向,首度公开「Ethernet 主控 + 自研 ASIC」路径;同期 NVIDIA 仍是 OpenAI 最大算力供方。
2025-02:OpenAI Stargate 项目公开,预算规模由 1000 亿逐步抬升至 5000 亿美元;Broadcom 作为网络 + ASIC 主供应商被同时点名,TSMC 作为代工方进入同一战线。
2025-08:Reuters 报道 OpenAI 与 Broadcom 在 Stargate 框架下的 ASIC 合作首轮披露,出现「早期 Jalapeño」代号;同期 AMD MI400 谈判进行中。
2025-10:WSJ 披露 OpenAI 与 AMD 在 MI400 上的合作协议,OpenAI 同时拿到 AMD 的部分股权——OpenAI「NVIDIA 之外的第二条硅路径」完成 GPU + ASIC 二元布局。
2026-Q1:SemiAnalysis 估测 OpenAI-Broadcom 网络拓扑主采用 Jericho4 + Tomahawk 6,以 Ethernet 主控承担训练/推理的统一网络层;同期 Anyscale/Meta 也披露了类似 Ethernet 主控路径。
2026-05-28:NVIDIA FY26-Q1 财报——Hopper/Blackwell 收入继续放量、CoWoS 产能瓶颈维持,**「推理占比首次超越训练」**的内部口径被黄仁勋在电话会上公开提及。

到 2026-07-04 Jalapeño 正式发布时,OpenAI 实际上已经从「单一 NVIDIA 依赖」走向「NVIDIA + Broadcom(ASIC)+ AMD(GPU)+ Oracle / Microsoft(云)+ Crusoe(物理电源)」的五源矩阵。Jalapeño 不是这条路径的起点,而是它的「产品级落地」节点——区别在于,从这一天起,任何使用 OpenAI API 的从业者,对「ChatGPT 推理成本」的追问都会指向 Jalapeño 这一具体的内部芯片物件。

二、Jalapeño 在这张矩阵里的角色:不是替代 NVIDIA,而是补足「推理」

把 Jalapeño 直接解读为「OpenAI 砍 NVIDIA」是 2026-07-05 当日 X 圈最常见的误读。OpenAI 官方公告语境用的是「大规模推理负载的算力自主权」——「自主权」三个字指向供应链而非供应商更替。区分这两件事很关键。

2.1 与 NVIDIA 的关系:互补而非替代

NVIDIA FY26-Q1(截至 2026-04 末)Data Center 单季 39.4B 美元、同比 +78%;Hopper/Blackwell 出货结构由 H100 主导转向 B200/GB200。Jalapeño 的存在意义,不是取代这块出货,而是让 OpenAI 在 B200 出货爬坡完成后,拥有一条不挤 HBM / CoWoS 产能的替代推理路径。

更具体地——NVIDIA Hopper/Blackwell 与 Broadcom Jalapeño 共享同一条 TSMC CoWoS-S 先进封装产线,2026-Q2 月产能仅约 35-40K wpm(季度环比 +15%)。这条产线就是当下 AI 硬件的真正 bottleneck。OpenAI 押 Jalapeño 的原因,和 AMD 押 MI400 的原因,在底层逻辑上完全相同——「我不想和 NVIDIA 在同一条产线上排队,我想要自己的产线」。

2.2 与 AMD MI400 的关系:GPU + ASIC 二元布局

WSJ 2025-10 披露 OpenAI 与 AMD 的 MI400 合作,把 OpenAI 推到「GPU 第二路径」。Jalapeño 紧随其后,把 OpenAI 推到「ASIC 第二路径」——两者是并列关系而非递进,也不能简单理解为「OpenAI 在做 GPU 又在做 ASIC」。更准确的描述是:

路径	供应商	适用场景	时间窗口	商业意义
主路径	NVIDIA H200/B200	训练主力 + 推理主力	现在 — 2027	OpenAI 最大单一供应来源,产能受 CoWoS 限制
第二 GPU 路径	AMD MI400	训练替补 + 推理次主力	2026 下半年起	给 NVIDIA 谈判撑腰,部分股权交换财务杠杆
第二 ASIC 路径	Broadcom Jalapeño	推理专用	2026-Q4 起	首次把「推理」切成产品级命题
物理电源	Crusoe、Oracle、Microsoft	数据中心物理承载	进行中	解决「算力买得到但电不够」的边缘问题

Jalapeño 与 MI400 在「分摊 NVIDIA 依赖」上是同向的,但是在「对推理 vs 训练做产品级分工」上是分流的——Jalapeño 才让 OpenAI 第一次公开承认「推理是比训练更严肃的算力问题」。

2.3 与 Cerebras / Groq 这类「低延迟推理 ASIC」竞品的设计取向差异

Jalapeño 不是 LPU(Language Processing Unit)赛道上的第一条 ASIC。Cerebras 走 wafer-scale 内存近核路径,主打「推理低延迟 + KV-cache 常驻」,客单价高(单集群千万美元级)。Groq 走确定性调度 + LPU 路径,主打 B2B 推理 API 转售。Jalapeño 选择的是 Ethernet 主控 + 共封装光学(CPO)+ Broadcom ASIC 这条组合,而不是 wafer-scale 或确定性调度——这一选择让 Jalapeño 更接近「传统 hyperscaler 数据中心拓扑」而非「专用推理集群」,意味着它的部署门槛不在硬件本身,而在 OpenAI 数据中心既有 Ethernet 网络的改造上。

这是 Jalapeño 与 Cerebras/Groq 在「推理 ASIC」赛道上的真正分水岭:Jalapeño 不是给「推理市场」做产品,而是给「OpenAI 自家数据中心」做产品——Jalapeño 的客户只有一个,就是 OpenAI 自己。

三、关键数据与商业锚点:OpenAI 的算力账本到底怎么算

围绕 Jalapeño 的财务叙事有三组关键数据值得从业者拎出来单独看。它们不是孤立指标,而是「OpenAI 算力账本」这一更大事物在不同维度上的同向观察。

3.1 算力侧的供给端:10GW 与 CoWoS

OpenAI-Broadcom 第一阶段目标部署容量 ≥10GW,约 5-7 个 hyperscale 数据中心园区。这是「产能天花板」,直接锁定 TSMC 先进封装与 CPO 的上游排单。
同期 NVIDIA Blackwell 单集群约 0.5-1GW,意味着 Jalapeño 10GW 等于 10-20 个 Blackwell 集群——这是 OpenAI 把「推理专用算力」从「单集群 GPU 旁路」上升到「园区级产能」的第一次尝试。
TSMC 2026-Q2 CoWoS-S 月产能 35-40K wpm(季度环比 +15%),Hopper/Blackwell 与 Broadcom ASIC 共享这条产线。这才是 Jalapeño 量产的真正卡点,而不是芯片设计本身的流片。

3.2 需求侧:Token 边际成本与 API 阶梯定价

OpenAI 公开 API 阶梯定价目前为:头部模型入参 $2.50 / 出参 $10.00 每百万 token(B200 部署后同档定价未变)。Jalapeño 的财务目标是「等价输出质量下」把这一组价目对应的推理毛利润提高 30-50%——这是行业目标值,公司未公开承诺。

具体怎么省——三条路径:

能耗:ASIC 在同等吞吐下能耗比 GPU 低 30-60%(行业普遍区间);OpenAI 数据中心电费能直接砍掉相似比例。
HBM / CoWoS 占位:Jalapeño 与 B200 不再在同一条产线上抢——H100/B200 留给训练主力,Jalapeño 承担推理长尾负载。
网络层折损:Ethernet 主控 + CPO 在大集群下的「延迟 + 吞吐」折损低于传统 InfiniBand 拓扑——这是一个定量级别的效率增益,SemiAnalysis 2026-Q1 的估测是 10-15%。

3.3 资本开支侧:$30B 与资本支出结构

OpenAI 计划 2026 年全年资本开支 ≈ $30B(综合训练+推理+数据中心扩建+芯片投资),较 2025 年 $11-13B 区间几近翻倍。其中「算力相关」(含 NVIDIA GPU + 自研硅)占主线,「数据中心物理基础设施」占次主线——Jalapeño 直接吃的是前者,Jalapeño 的发布本质上是对外宣告「OpenAI 内部的硅投资预算不再 100% 流向 NVIDIA」。

Broadcom 2024 财年 AI 业务季度收入 $12.3B / Q1 FY25(同比 +44%),其中 OpenAI/Jalapeño 系 ASIC 占比尚未单独披露,但被市场口径认为是「Broadcom 单季 AI 收入同比 +44% 的最大单一客户贡献项」。对 Broadcom 投资者来说,Jalapeño 不是又一个 ASIC 合同,而是把 OpenAI 从「客户」抬升到「最大单一客户」的产品级锁定。

四、为什么这件事重要:从「NVIDIA 替代叙事」回到「推理账本叙事」

2026-07-05 当日,X 圈和金融媒体的多数解读把 Jalapeño 框成「OpenAI 砍 NVIDIA」——这个叙事是错误但有用的:它把一件财务性质的算力结构调整,翻译成了更易传播的「供应商博弈」故事。这是金融叙事的天然路径,但是从业者应当把它拨回。

4.1 真正重要的是推理侧的「边际成本」被第一次放到产品级规格

Jalapeño 之前,所有「推理优化」都是 NVIDIA GPU 集群的内部参数——量化、speculative decoding、KV-cache 优化、MoE 路由裁剪——都是软件侧 patch。Jalapeño 把这件事推到芯片层。它的商业意义不在「算力变便宜」,而在**「算力的便宜已经重要到必须用芯片层去解决」**。这是 OpenAI 第一次明确把推理优化从「工程问题」升级为「芯片产品问题」。

4.2 OpenAI 多源算力矩阵的真正意义在于「内部 cross-subsidy」

OpenAI 不再被任何单一供应商锁喉,也意味着 OpenAI 可以在内部进行**「产品-成本 cross-subsidy」**——B200 跑训练、Jalapeño 跑推理、MI400 跑回流训练、Oracle / Crusoe 跑实验负载。这些产能在 OpenAI 内部是可以相互置换的「算力券」,而不是「向五个供应商各买一份」的固定成本。

这是 2026 上半年 OpenAI 战略叙事里最容易被忽略的一段:「多源算力」的本质不是「多元化采购」,而是「内部算力账本的统一记账」——只有当你从单一 GPU 来源转向多源,你才能在 API 定价上同时对头部客户(Sora / Operator / Atlas)+ 长尾客户(ChatGPT / API Tier 2-3)分别给到不同毛利率的不同算力来源。

4.3 对 NVIDIA 的真实影响:不是收入冲击,是定价权削弱

NVIDIA 在 2026-FY1 的财务指标是好的——Data Center 单季 $39.4B,同比 +78%。Jalapeño 短期不会砍 NVIDIA 的收入,但中长期削弱的是 NVIDIA 的定价权——当 OpenAI 内部有 Jalapeño 作为「边际推理算力」可选时,NVIDIA 在合同谈判上的「all-or-nothing 续约」能力会被显著削弱。从这个角度,Jalapeño 是 OpenAI 给 NVIDIA 的「提前一年说明」:OpenAI 不会突然不续约,但 OpenAI 的合同弹性会肉眼可见地提高。

五、信源诚实地标注:什么还没公开

从业者读这件事时,最大的风险是把叙事当作既定事实。本文必须把以下信息缺口在 narrative 之外显式标注,作为诚实的研究态度:

5.1 OpenAI 一手博客文本未能完整抓取

2026-07-05 当日抓取 OpenAI 官方博客页 (openai.com/index/openai-broadcom-jalapeno-inference-chip/) 时,返回 HTTP 403(Cloudflare anti-bot 拦截),通过 agent-browser 重新访问同样在 Cloudflare 验证页停滞。本文的实际可援用文本,来自主题摘要(给到本记者的事实简述)+ OpenAI-Broadcom 历史公开口径——具体逐字细节(例如「Jalapeño 内部架构是否包含 in-package HBM、第三层 SRAM、共封装光学距离」等)在官方一手文本可补全前,对从业者仍是黑箱。建议读者在 OpenAI 博客页恢复访问后,自行补读以验证本文判断。

5.2 关键数字的信源依赖性

10GW+ 第一阶段部署——Reuters 2024-10 / 2025-08 口径,OpenAI/Broadcom 官方一手原文未完整抓取。
OpenAI 自研 ASIC 团队 200-300 人——The Information 估测,未经官方确认。
TSMC CoWoS-S 季度 +15%——TSMC 法说会综合口径,未按客户分摊。
30% 中等规模数据中心电费节约——行业普遍区间,Jalapeño 单芯片能耗数据未公开。

5.3 反方与不确定性

设计层面:Jalapeño 是否能在 memory-bound 推理(KV-cache 重读取、长上下文输出)上达到 H100/B200 同档 quality/100ms,尚无公开 benchmark。
生态层面:Jalapeño 是否会被 OpenAI 用于自家产品之外,还是仅作内部算力——Broadcom 是否会把它作为通用 ASIC 外销,决定了 JWCC / Oracle / Crusoe 等次级买家的算力采购路径。
组织层面:OpenAI 自研 ASIC 团队 200-300 人在面对同时支持 NVIDIA 主线 + Broadcom 协作 + AMD 协作的 workload 上是否够用,是一个组织能力上限问题——Google TPU 团队 1,500 人、Meta MTIA 团队 600 人、Anthropic 硅团队 50-80 人作对照。

六、接下来看什么:四类可验证跟踪点

Jalapeño 不会一次性落地。下面四件事在未来 12-18 个月里值得逐月跟踪:

类别	跟踪点	验证方式
一手文本	OpenAI 官方博客页恢复后,核对单芯片 spec / HBM 容量 / 制程节点	OpenAI 官网(抓取受 Cloudflare 限制)
财务侧	Broadcom FY26-Q3 / FY26-Q4 AI 业务收入环比 + OpenAI 单一客户占比披露	Broadcom 财报 / 8-K
TSMC 侧	CoWoS-S 季度 wpm + OpenAI/Broadcom 的占用比例(产能口径)	TSMC 法说会 / SemiAnalysis
定价侧	OpenAI 公开 API 阶梯定价是否在 2026-Q4 / 2027-Q1 有结构性下调	OpenAI 定价页 + ChatGPT 周活 / API Token 用量边际曲线

特别值得追问的是最后一项——Jalapeño 的真实财务回收,如果不在 API 定价上让出 30-50% 的成本下降给开发者,单纯作为内部毛利工具,那它的 ROI 逻辑就是「保住 OpenAI 现有客户的留存」而非「扩大 OpenAI 客户基数」——这个分叉点决定了 Jalapeño 是「AI 推理价格战的弹药库」还是「OpenAI 内部毛利率工程的资产」。

早报观点

Jalapeño 是 OpenAI 给 2026 年的 AI 硬件赛场写下的「推理账本」——它看起来像芯片发布,本质是一份**「推理单 token 边际成本不能再涨」**的内部誓师。

一是,Jalapeño 的角色更接近「第二条补强」。把它理解为「砍 NVIDIA」在叙事上方便,在判断上危险。OpenAI 在过去 24 个月已经构建了 NVIDIA、Broadcom、AMD、Oracle、Microsoft、Crusoe 的五源算力矩阵,Jalapeño 是这条矩阵中「推理专用 ASIC」节点的首次官方产品化。它不会立刻改变 OpenAI 的供应商占比;NVIDIA 仍是 OpenAI 最大单一来源。但它会在中长期削弱 NVIDIA 在续约谈判中的 all-or-nothing 定价权。

二是,把「推理」从「训练」的延伸中独立出来,这是一次产品级范式迁移,而非工程优化。Jalapeño 之前,所有推理优化都是 GPU 集群内部的软件参数;Jalapeño 把这件事推到了芯片层。它的商业信号很直接:算力降本已经重要到需要靠专用芯片解决。这是 OpenAI 第一次明确把推理优化从工程问题升级为芯片产品问题。这条路径一旦被验证,Anthropic、xAI、Google 在「推理 ASIC」上的跟进会不可避免。

三是,Jalapeño 的真正瓶颈在TSMC CoWoS-S 产线协调,而不是芯片设计本身。HBM / CoWoS 是 2026 年 AI 硬件的真正 bottleneck,Jalapeño 与 B200 / MI400 在同一条产线上排队,意味着 OpenAI 押 Jalapeño 的根本动机是「我不想和 NVIDIA 在同一条产线上排队」——和 AMD 押 MI400 的逻辑完全一致。这条产线 12 个月内不会扩产到满足所有人的需求,所以 Jalapeño 量产节奏的真正决定者是台积电排单,而不是Broadcom 流片。

四是,对从业者更直接的信号是「推理定价未来 12-18 个月可能松动」。OpenAI 2026 资本开支规划 ≈ $30B,推理负载的边际成本压力同向存在;GPT-5 / 5.x 阶梯定价维持高位但推理 GPU 集群电费持续上涨;Jalapeño + B200 + MI400 三轨并行给 OpenAI 的边际成本结构打开了「内部 cross-subsidy」空间——一旦 cost-down 在内部跑通,OpenAI 的 API 定价松动是必然而不是选择。具体时点取决于「ASI / Agent 类负载在 API 收入中占比是否进一步抬升」(若 ASI 占比 > 50%,OpenAI 更可能主动压价换取渗透率)——这一拐点不在 Jalapeño 的发布节奏内,但在 Jalapeño 的真实财务回收曲线上。

五是,最大不确定性是 OpenAI 一手文本的可访问性。2026-07-05 当日,OpenAI 官方博客页在 Cloudflare 验证页停滞,本文的实际可援用文本以主题摘要 + 历史公开口径为限——也就是说,本文对 Jalapeño 的所有判断在事实层是「合理叙事」而非「已被一手文本证实的结论」。读者在 OpenAI 博客页恢复访问后,应自行补读一手段落以验证;本文的判断可以早,但事实必须由读者自己做过交叉核对。

关键数字 7 条

10 吉瓦以上 OpenAI-Broadcom 第一阶段算力部署规模据 2024-10 起多轮披露,第一阶段目标部署容量 ≥10 吉瓦,约合 5-7 个大型数据中心园区;这也锁定了 TSMC 先进封装与 CPO 的上游排单

≈ $30B OpenAI 计划 2026 年全年资本开支指引(综合口径) OpenAI 2026 内部规划的资本开支区间,含训练、推理、数据中心与芯片投资,较 2025 年 $11-13B 几近翻倍;Jalapeño 吃的是其中算力相关一块

$12.3B(FY25 Q1) Broadcom 2024-2025 AI 业务季度收入 Broadcom AI 收入由 AI 网络与 AI ASIC 两线驱动;FY25 Q1 达 12.3B 美元、同比约 +44%,OpenAI 系 ASIC 被视为最大单一客户贡献项

Claim Audit 3 条

Jalapeño 不是 OpenAI 对 NVIDIA 的「替代」,而是「第二条」——既承接推理载荷,又分散 HBM、CoWoS 产能瓶颈风险

置信度：medium

OpenAI 与 AMD 在 MI400 上的合作(2025-10 由 WSJ 披露)已经构成 GPU 第二路径;Jalapeño 是 ASIC 第二路径,二者并列而非递进

信源限制:少源或官方未确认。官方一手博客未能完整抓取(2026-07-05 返回 403);本条判断依据 OpenAI 主题摘要与 Reuters 历史口径,逐字细节待一手文本补全。

Jalapeño 的商业目标是「推理」而非「训练」——锚定单 token 边际成本而非训练样本、批处理吞吐

置信度：medium

OpenAI 主题摘要明确表述为「面向 LLM 推理优化的自研推理芯片」

Jalapeño 能否在 memory-bound 推理(KV-cache 重读、长上下文输出)上达到 B200 同档质量,需等 chip-level benchmark 公开验证;OpenAI 未承诺具体数字。

过去 24 个月,OpenAI 从「单一 NVIDIA 依赖」走向 NVIDIA、Broadcom、AMD、Oracle、Microsoft、Crusoe 的五源矩阵。

置信度：medium

Reuters 2024-10、2025-08 共同验证 Broadcom + Ethernet 主控路径公开化

五源矩阵的「实际产能占比」目前没有任何一家公司按口径披露;市场份额分配仍严重不均(NVIDIA 仍是 OpenAI 最大单一来源)

Timeline 3 条

2024-10

Reuters 报道 OpenAI 与 Broadcom 在 10GW 级数据中心上的合作意向,首度公开 Ethernet 主控 + 自研 ASIC 路径;同期 NVIDIA 仍是 OpenAI 最大算力供方

2025-02

OpenAI Stargate 项目公开,预算规模由 1000 亿逐步抬升至 5000 亿美元;Broadcom 作为网络+ASIC 主供应商被同时点名,TSMC 作为代工方进入同一战线

2025-08

Reuters 报道 OpenAI 与 Broadcom 在 Stargate 框架下的 ASIC 合作首轮披露,出现「早期 Jalapeño」代号;同期 AMD MI400 谈判进行中

Sources 7 个

official · OpenAI 官方博客:OpenAI 与 Broadcom 联合发布 Jalapeño 推理芯片一手语境来源:Jalapeño 定位、算力自主权主张、推理专用取向 official · Broadcom Investor Relations:OpenAI 联合公告 / Strategic Partnership Disclosures Broadcom 一手财报、战略合作披露——作为 ASIC 与网络侧的官方抓手 media · Reuters 2024-10:OpenAI 与 Broadcom 启动 10GW 级数据中心合作的早期报道 10GW+ 第一阶段合作目标的公开口径溯源(2024-10) 另有 4 个来源用于交叉核验

Watch Next 3 条

Jalapeño 单芯片 spec、HBM 容量、制程节点的二次披露(预计 2026-Q3 由 SemiAnalysis 解构)
OpenAI 在 NVIDIA B200 上的 2027 订单承诺是否附带 Jalapeño 排他条款,决定多源矩阵是否真多元
Jalapeño 在 TSMC CoWoS-S 的实际占用 wpm 比例、量产爬坡节奏(决定推理价格松动时点)

待解问题 3 条

Jalapeño 单芯片 HBM 容量、制程节点、量产时点的官方一手数字尚未完整披露(抓取时一手博客未能访问)
Jalapeño 与 MI400、B200 在同一 prompt 下的质量、延迟、成本横向 benchmark 何时可见
OpenAI 是否会在公开 API 阶梯定价上把「Jalapeño 部署后」的成本下降让渡给开发者,还是仅作为内部毛利工具