- 内存从'AI 算力瓶颈的隐性变量'被 Jefferies(据转述)推成'可能逼停数据中心建设的显性成本冲击'
- 应对路径从'被动加 HBM 产能'转向'主动自研推理专用芯片降低每单位内存依赖'——OpenAI Jalapeño 是首个大型官方样本
- 资本开支叙事从'无脑扩张'出现'可能被迫下调'的拐点讨论,但实据仍缺
- 美光等内存原厂从'被云厂商压价'转向与苹果等大客户公开博弈定价权
过去 24 小时,一条关于 AI 算力「另一条供应链」的预警在 X 上流传:据用户 @Rocky_Bitcoin 转述(Jefferies 原始报告尚未核实),投行 Jefferies 警告 2026 年第三季度内存价格将暴涨 50%、第四季度再涨 40%,2028 年前难见缓解。转述称内存涨价已让苹果都承压,英伟达、AMD「不知道能抗多久」;Jefferies 给出两种可能结局——一是倒逼云厂商减缓 AI 数据中心建设、资本开支下降,二是技术替代(如 MRVL 这类硬件加速方案)「曲线救国」。
把这条预警单独看,分量并不重:它建立在一推文的转述上。但把它放回时间线,价值就出来了——4 天前(6 月 24 日),OpenAI 与 Broadcom 官宣了自研推理芯片 Jalapeño,设计思路「减少数据搬运、平衡算力/内存/网络」,正是 Jefferies 所说「技术替代」路径的现实样本。一边是「内存可能暴涨逼停数据中心」的预警,一边是「换种芯片绕开内存依赖」的对冲牌已经打出,两者在同一个星期里同框,把一个被从业者私下讨论已久的问题推到了台面:AI 的算力瓶颈,是不是正从「算力」转向「内存成本」。本篇要做的事很具体——先把这条传闻的分量称准,再把传闻底下的机制和出路分清楚,因为这三者可信度差别极大,混在一起读最容易跑偏。
这条预警,分量多重
最具冲击力的三个数字——Q3 涨 50%、Q4 涨 40%、2028 年前难缓解——全部来自 @Rocky_Bitcoin 一条推文的转述。该账号带有明显的加密/财经评论属性(使用 $MRVL 计价符号、把大内存电脑戏称为「理财产品」),并非卖方分析师;这条推文截至抓取时阅读量约 8.2 万、点赞 31、收藏 15,属「在圈层内流传但未破圈」的量级。Jefferies 作为一家真实的投行确实存在,覆盖内存/半导体板块也合理,但其研究报告是付费墙内的专有内容,本篇未能获取原始报告,也没有任何主流财经媒体(Bloomberg/Reuters)的二手引述交叉印证。
把五个来源能证明什么、不能证明什么列开,这条预警的分量就清楚了:
| 来源 | 说了什么 | 能证明什么 | 不能证明什么 |
|---|---|---|---|
| X @Rocky_Bitcoin(6-28) | Jefferies 预警 Q3 +50%、Q4 +40%、2028 前难缓解;两种结局 | 业内在讨论「内存暴涨→逼停或替代」这一议题 | Jefferies 是否真这么说、数字口径、是否被第二源引用 |
| X @Rocky_Bitcoin(6-27) | MRVL「1GB 当 3.6GB」、美光-苹果争议、MRVL 看万亿市值 | 替代叙事的民间版本;原厂与大客户博弈定价权 | MRVL 技术口径、市值目标(均为账号推测) |
| OpenAI 官方博客(6-24) | Jalapeño 推理芯片、9 个月流片、吉瓦级部署 | 「技术替代」结局已有大型官方样本 | Jalapeño 对 HBM 的实际替代幅度(待性能报告) |
| Wikipedia:HBM | 3:1 晶圆转换比、DRAM +200%、三家供应商 | 涨价的物理机制独立成立 | 50%/40% 季度口径是否成立 |
| Wikipedia:AI boom | 2025 企业 AI 投资 >600 亿美元、Nvidia 5 万亿市值 | capex 仍在扩张、非已放缓 | 未来是否会因内存成本而转向 |
结论是:事件框架(内存涨价压力 + 两种结局)是行业里被广泛讨论的真实议题,但 Jefferies 的具体数字目前只能当「单一来源的未经证实说法」对待。本文置信度因此定为 medium,涉及 50%/40% 具体涨幅的判断单独标 low——把这两个百分比当结论来用,是读这篇稿子最大的陷阱。
抽掉百分比,机制还站得住
「内存价格在涨」这件事本身,有独立来源支撑,不需要靠这条推文。Wikipedia 的 HBM 词条显示,受 AI 需求驱动,DRAM 价格自 2025 年初以来「已累计上涨,部分品类涨幅超过 200%」;同一词条引用美光(Micron)的说法,指出 HBM 与 DDR5 之间存在约 3:1 的晶圆产能转换比——每多产一份 HBM,就直接压缩通用内存的供给。这条机制链比 Jefferies 的百分比更值得记住,因为它解释了「为什么 HBM 一火,普通内存就跟着涨」,而它完全不依赖 Jefferies 是否真这么说过。
HBM(高带宽内存)是 3D 堆叠的 DRAM,通过硅通孔(TSV)把多层存储芯片叠在一起,用更小的面积、更低的功耗换更高的带宽。它是现代 AI GPU 的命脉:Nvidia H100 用 HBM3(80GB、3TB/s 带宽),H200/GH200 升级到 HBM3E(141GB),Blackwell B200 同样依赖 HBM3E;AMD 的 MI 系列也是 HBM 的核心客户。问题在于,HBM 和你电脑里的 DDR5 内存抢的是同一批晶圆产能,而转换比是 3:1——做一份 HBM 产能,要牺牲约三份普通 DRAM 产能。
HBM 的全球供应商只有三家:SK 海力士、三星、美光。这是一个高度集中的寡头供给:AI 算力扩张越快,三家就越把产线往 HBM 倾斜,普通 DRAM/NAND 就越紧缺,价格就越往上走。这正是「内存暴涨」的物理基础——它不是投机炒作,而是产能置换的必然结果。而 HBM4 标准已于 2025 年 4 月定稿,带宽冲到 2,048 GB/s,但越往前走,对先进制程晶圆的吞噬只会更狠。
扩展:各代 HBM 规格(带宽/容量)演进
| 代次 | 定标时间 | 最高带宽 | 单堆最大容量 | 代表搭载 |
|---|---|---|---|---|
| HBM1 | 2013-10 | 128 GB/s | 4 GB | AMD Fury 系列(首款消费级 HBM GPU) |
| HBM2/2E | 2016 / 2019 | 307 / 461 GB/s | 8 / 24 GB | Nvidia V100、A100 |
| HBM3 | 2022-01 | 819 GB/s | 48 GB | Nvidia H100(80GB、3TB/s) |
| HBM3E | 2023-05 | 1,229 GB/s | 48 GB | Nvidia H200/GH200(141GB)、Blackwell B200 |
| HBM4 | 2025-04 | 2,048 GB/s | 64 GB | AMD MI430X(首款用 HBM4) |
供应商里程碑:SK 海力士 2022-06 量产 HBM3、2024-09 量产 12 层 HBM3E;美光 2024-02 宣布 HBM3E 量产;三家共同参与 HBM4 标准。来源:Wikipedia:High Bandwidth Memory。
这就把 Jefferies 的第一种结局——「逼停 AI 数据中心建设」——放到了一个具体的物理约束上:数据中心买的不仅是 GPU,更是 GPU 背后那堆越来越贵的 HBM。当 HBM 占 GPU 物料成本的大头、且还在以 50%/40% 的节奏(若预警属实)上涨,每新增一个机柜的边际成本就在快速抬高。Wikipedia 的 AI boom 词条也把「2024–2026 全球内存供应短缺」收进了相关条目——短缺不是预言,是已经持续两年的事实。所以机制这一层是硬的:HBM 挤普通内存,普通内存就涨,这与 Jefferies 数字真伪无关。
两条出路,「换形态」那一条已经动工
Jefferies(据转述)给出两条出路:
| 出路 | 含义 | 现实进度 |
|---|---|---|
| 一:capex 下调 | 云厂商减缓 AI 数据中心建设,资本开支下降 | 仍是预测,无独立佐证;反向证据是 capex 仍在扩张 |
| 二:技术替代 | 用 MRVL 等硬件加速方案「曲线救国」 | 已有官方样本:OpenAI Jalapeño |
第一条目前仍是预测,缺乏独立佐证。反向证据倒是有一条:企业 AI 投资在 2025 年已超 600 亿美元(Wikipedia 引《纽约时报》),Nvidia 市值在 2025 年 10 月冲到 5 万亿美元,资本仍在疯狂涌入——至少到 2026 年中,「减缓建设」还看不出实据。但要注意 MIT 一项被广泛引用的研究称约 95% 的企业 AI 项目不盈利,这意味着 capex 本就建在脆弱的回报预期上,内存成本一旦真的台阶式抬升,可能成为压垮部分项目 ROI 的那根稻草。换言之,「逼停整体」没有实据,「逼停个别项目」却是个合理的局部推论。
第二条「技术替代」,这一条已经有官方样本。6 月 24 日,OpenAI 与 Broadcom 官宣自研推理芯片 Jalapeño——OpenAI 首颗「智能处理器」(Intelligence Processor)。关键不在它叫什么,而在它的设计哲学:官方博客明确说 Jalapeño「减少数据搬运,平衡算力、内存与网络资源,使实际利用率更接近理论峰值」,并称早期测试显示「每瓦性能显著优于当前最优」。这是对「内存成本瓶颈」的直接架构回应——不靠堆更多 HBM,而是让每一 GB 内存做更多有效功。该芯片从设计到流片只用了 9 个月(OpenAI 称其为高性能先进半导体史上最快 ASIC 开发周期),工程样片已在实验室以目标频率与功耗跑 GPT-5.3-Codex-Spark 等负载,计划 2026 年底起与微软及其他伙伴以吉瓦级(gigawatt scale)规模部署。Broadcom CEO Hock Tan 把它定义为「面向未来十年 AI 的物理基础设施」多代路线图的第一步。
@Rocky_Bitcoin 在前一天的转述里把「技术替代」具体押注在 Marvell($MRVL)身上,称其方案能让「1GB 当 3.6GB 用」,并推测 MRVL 的 XPU 业务未来单季营收可达 50 亿美元、理论市值看 1 万亿美元(对照博通 1.74 万亿、MRVL 当前 2300 亿)。这部分完全是单一账号的推测与计价叙事,1GB→3.6GB 的技术口径、市值目标均无原始材料佐证;但它点出的方向——定制 ASIC/加速器赛道(博通、Marvell)正成为「绕开内存线性依赖」的受益方——与 OpenAI Jalapeño 的官方动作方向一致。把这两条放一起看:出路二不是「可能」,而是「已经在做」,只是做的人是 OpenAI 而不是 MRVL,且做得多彻底还要看后续报告。
这场挤压里,谁被挤、谁得利
顺着机制和出路往下捋,各方处境的差别很大:
- 内存原厂(三星/SK 海力士/美光):短期最大赢家。产能置换让他们既能吃 HBM 的高溢价,又能坐享普通内存被带涨的红利;@Rocky_Bitcoin 转述中提到的「美光与苹果的口水战」,本质就是原厂试图把定价权从大客户手里抢回来。
- 英伟达/AMD:两面受压。一边是 HBM 成本推高 GPU 物料成本,一边是要不要自研或扶持替代内存架构的抉择。Jefferies(据转述)直接点名它们「不知道能抗多久」。
- 超大规模云厂商(微软/谷歌/Meta/亚马逊):第一种结局的直接承压方。但他们更可能的反应不是「停建」,而是「换形态」——把 capex 从买 HBM 密集的现成 GPU,转向自研或联合定制推理芯片(OpenAI+Broadcom+微软的吉瓦级部署就是模板)。capex 总量未必降,结构会变。
- 定制芯片/加速器厂商(博通、Marvell):结构性受益方。当「内存效率」成为新护城河,能帮客户降低每单位内存依赖的 ASIC 设计商,议价权上升。
- 苹果等大内存消费方:被原厂涨价直接挤压,但苹果有自研芯片能力,长期可对冲。
这条利益链最值得记的一点是:赢家和输家不是按「做不做 AI」分,而是按「能不能把每 GB 内存的产出做上去」分。原厂靠稀缺赢,定制芯片商靠效率赢,被卡在中间的是只会堆通用 GPU 的那一档。
这件事最该盯的不是 50% 和 40% 这两个数字。它们来自一条带加密色彩的账号转述,Jefferies 原始报告至今没人见过,50%/40%/2028、连同 @Rocky_Bitcoin 顺手抛出的 MRVL「1GB 当 3.6GB」、单季 50 亿美元、1 万亿市值,无一经过第二源印证——本篇置信度因此压到 medium,这几个数字只能当「一个被放大的方向性信号」而非结论。真正结实的是那条机制:HBM 与普通 DRAM 抢同一批晶圆、转换比约 3:1,它不依赖 Jefferies 是否真这么说过,独立地解释了「只要 AI 还在抢 HBM,普通内存就跟着涨」——这才是「内存暴涨」命题能站住的物理底座。读法因此很简单:涨幅数字存疑,涨价趋势可信。
两种结局里,第一种「逼停数据中心」被夸大了。2025 年企业 AI 投资已超 600 亿美元、Nvidia 市值冲到 5 万亿,资本还在涌,内存涨一截不足以让巨头停手;MIT 那项「约 95% 企业 AI 项目不盈利」的研究提醒我们 capex 本就建在脆弱回报上,内存成本抬升可能压垮个别项目,但「逼停整体建设」仍是预测、无实据。真正在发生的是第二种:内存涨会改变 capex 的去向,而不是总量——从买更多 HBM 密集的通用 GPU,转向自研或定制能把每 GB 内存压榨到极致的推理专用芯片。OpenAI 9 个月流片 Jalapeño、明年底吉瓦级部署,就是这场换轨的明牌。结局大概率不是「停建」,而是「换形态建」。
只是别把「换形态」当成免战牌,因为它能对冲多少至今是个未知数。Jalapeño「每瓦性能显著优于 SOTA」至今只有官方口径,详细报告要等「未来几个月」;自研芯片压缩的是每单位内存的有效产出,可训练一个大模型所需的绝对内存量仍在膨胀,它能对冲一部分、对冲不了全部。所以这条传闻最该被验证的,不是谁先扛不住的口号,而是一个可查的硬指标:三星、SK 海力士、美光 Q3 的 DRAM 合约价到底涨了多少——TrendForce 每月追踪这张表,数字逼近 +50% 预警就坐实,远低于则说明它只是圈层噪音。在那张表出来之前,别把单一推文的百分比当结论,也别因为来源软就忽视它指向的真问题。
接下来盯什么
- 三星/SK 海力士/美光 Q3 DRAM 合约价实际涨幅(TrendForce 月度追踪)是否逼近 +50%,这是验证预警最直接的硬指标——它同时决定 50%/40% 是坐实还是噪音。
- Jefferies 原始报告是否流出,或被 Bloomberg/Reuters 等主流财经媒体引述,以核实 50%/40%/2028 三个数字与口径(合约价还是现货价?HBM 专项还是全 DRAM?)。
- **美光-苹果「口水战」**是否有官方或媒体跟进:争的是价格、产能优先级还是分配——这决定原厂定价权博弈的烈度。
- OpenAI Jalapeño 详细性能报告(「未来几个月」发布)能否兑现「每瓦性能大幅领先」,以及它对 HBM 容量的实际依赖度——这决定「换形态」能对冲掉多少内存成本。
- 超大规模云厂商 2026 Q3/Q4 capex 指引:是下调(印证结局一)还是维持或转向上自研芯片(印证结局二)。
- Marvell XPU 营收能否逼近单季 50 亿美元,对照博通定制 ASIC 业务的体量与增速。