模型发布

Claude Sonnet 5 正式发布:agentic 能力替代更大模型,促销价 $2/$10 用 tokenizer 暗坑做『成本中性』过渡

Anthropic Sonnet 5 正式 GA,agentic 能力替代『更大模型』;促销价 $2/$10,但新 tokenizer 把『成本中性』变成最多 1.35× 实际账单。

2026年7月1日 · 周三深度报告高置信重要度 5/5

#Anthropic #Claude #Sonnet 5 #Opus 4.8 #GPT-5.5 #agentic #tokenizer #BrowseComp #OSWorld #Cursor #Devin #GitHub Copilot

Research Pack

核心问题

Anthropic 在 2026-06-30 把 Claude Sonnet 5 推到 GA 时,它真正在卖的到底是一件『新模型』,还是一件『用促销价 + 新 tokenizer 把中端客户锁到 Opus 升级路径上的入场券』?Intelligence Index 53 分(与 GPT-5.5 同档、明显落后 Opus 4.7/4.8)+ 首 token 时延 150 秒 + 输出价格 8-31 后上调 50%,这三件事放在一起,意味着 Anthropic 在 Sonnet 5 上同时追求『接近 Opus 的能力』与『比 Opus 更厚的价格梯度』——这跟 Sonnet 4 时代的『便宜主力中端』定位有什么本质差别?

为什么是现在

过去 6 个月 Anthropic 在 Sonnet 系列上的产品节奏出现明显变化:4-26 速率限制改三档、5-28 Opus 4.8 上线为 Sonnet 5 设『上一档价位』参照、6-9 Fable 5 / Mythos 5 上线把『高安全/特殊用途』剥离出主模型族、6-12 美国政府暂停 Fable/Mythos 把 Sonnet 推到事实上的『全球可用最高档』。**Sonnet 5 是在这条产品节奏的最末端 GA**——它不是单独一个模型发布,而是整套『Anthropic 模型族价格梯度重构』的一环。同时,Sonnet 5 搭配促销价 $2/$10 与新 tokenizer,等于用『两个月保护窗口 + 永久通胀』把客户从 Sonnet 4.6 迁到新 tokenizer 的 token 体系上——这是 Anthropic 在 Sonnet 系列上第一次主动用『定价保护期 + token 体系切换』做客户黏性,跟 GPT 系列用新 tokenizer 时的处理思路完全不同。**这是 Sonnet 产品史上的拐点,也是 Anthropic 价格策略从『透明对齐』转向『梯度锁定』的拐点**

关键数字

$2 / $10 百万 token(输入/输出)
促销期 API 价(至 2026-08-31)Anthropic 官方;与 Opus 4.8 的 $5/$25、Opus 4.7 的同类定价对照,Sonnet 5 比 Opus 4.8 便宜 60% 输入、60% 输出;但需叠加 tokenizer 膨胀 1.0–1.35× 折算实际账单

$3 / $15 百万 token(输入/输出)
促销到期价(2026-08-31 后)Anthropic 官方;比促销期各涨 50%;与 Sonnet 4.6 早期价位一致(历史上 Sonnet 系列在 Anthropic 体系里承担『主力中端』角色,Sonnet 5 价位回到了这一档)

1.0–1.35×
新 tokenizer 膨胀系数Anthropic 官方;同样输入在 Sonnet 5 上会映射成比 Sonnet 4.6 多 1.0–1.35 倍的 token;Anthropic 称促销定价旨在『大致成本中性』但客观上,新 tokenizer + 同口径切换可能让账单无声上涨最多 35%

53 分,161 个模型中第 5 位
Intelligence Index(v4.1,9 项基准)Artificial Analysis 官方评测;Adaptive Reasoning + Max Effort;与同类均值 29 相比『well above average』;在 #5 位置意味着 Sonnet 5 落在头部第一梯队边缘,但已在 Opus 4.8/Opus 4.7 之后、与 GPT-5.5 同档

本文要点

从『Sonnet 卖主力中端』到『Sonnet 卖 agentic 中端 + Opus 升级通道』:Sonnet 5 的官方叙事是『agentic 能力替代更大模型』,即客户可以用 Sonnet 5 + 高 effort 拿到接近 Opus 4.8 的 agentic 表现,但付出比 Opus 4.8 便宜近一半的价格——这等于把『Opus 升级」做成可选项,而不是默认动作
从『单一 Sonnet 价位』到『促销价 $2/$10 + 标准价 $3/$15 双段定价』:这是 Anthropic 第一次在 Sonnet 上提供 60 天促销窗口,直接对齐 SaaS 行业的『年度合同首年折扣』玩法,把价格用作客户绑定工具,而不仅是公开标牌
从『Sonnet 4.x 的 tokenizer』到『Sonnet 5 的新 tokenizer』:Anthropic 主动引入 1.0–1.35× token 通胀,且不给出『客户实际涨幅分布』,把『成本中性』的名义口径作为对客户的承诺,把『实际账单涨幅』作为涨价工具——这是 Sonnet 系列乃至 Claude 主模型族首次主动做 token 体系切换
从『速率限制多档』到『Start / Build / Scale 三档』:Anthropic 把速率限制与客户分层对齐,让『从小试用到大生产』的客户路径在配额上一致化,等于把 product-led growth 做到了速率配额层
从『OpenAI 一极』压力下的『透明定价』到『Anthropic 主动做价格梯度』:Anthropic 在 OpenAI GPT-5.5/5.6 三档定价(高/中/低)面前,第一次出现『在中端模型上做促销 + 到期后定价回归 + token 通胀』的复合涨价结构,等于从被动跟随到主动设计

2026 年 6 月 30 日,Anthropic 把 Claude Sonnet 5 推到 GA。这是 Anthropic 在过去 6 周里一系列结构性调整的尾端——4-26 速率限制改 Start / Build / Scale 三档、5-28 Opus 4.8 上线设参照、6-09 Fable 5 / Mythos 5 剥离出主模型族、6-12 美国政府暂停 Fable / Mythos、6-23 Claude Tag 发布、6-29 Opus 4.8 与 Haiku 4.5 在 Azure Foundry GA——Sonnet 5 是这条节奏上「中端主力」位置上的落子。但这次发布真正值得注意的是:Anthropic 第一次把「促销窗口 + token 体系切换 + 价格梯度」三件套组合起来,这不是 Sonnet 4.x 时代「便宜主力中端」的延续,而是一次产品策略的结构性转弯。

下面先复盘 Sonnet 5 的能力位移,再拆 Anthropic 在这次发布里搭出的完整商业机制,最后看这件事对中端开发者与企业级客户的双面影响。

能力位移:从「刷新 SOTA」转向「把 Opus 的能力下放到中端」

Sonnet 5 的官方叙事跟 Sonnet 3.5 / 3.7 / 4.0 / 4.5 / 4.6 系列有一处关键差异:官方不再强调「在某一项 benchmark 上刷到 SOTA」,而是把卖点改成「用中等价格做以前要高级模型才能做的事」。博客里最直白的一句是:Several months ago, this kind of agentic capability required a larger, more expensive model——也就是说,Anthropic 在用相对论叙事包装 Sonnet 5,而不是绝对能力叙事。

为了让这件事站住脚,博客配了 BrowseComp(智能体搜索) 与 OSWorld-Verified(计算机使用) 两张图表,横轴是 effort level(从低到高),纵轴是 benchmark 分数。三个模型各占一色:Sonnet 4.6 灰色、Sonnet 5 橙色、Opus 4.8 黄色。两条关键观察:

第一,在所有 effort level 上,橙色(Sonnet 5)严格高于灰色(Sonnet 4.6)——无论客户开多高的推理预算,Sonnet 5 都不会输给 Sonnet 4.6。这是「严格优于」的字面来源。第二,在高 effort 区段上,橙色曲线逼近黄色曲线——意味着 Sonnet 5 在 effort 拉满时,可以在 BrowseComp 与 OSWorld-Verified 上拿到接近 Opus 4.8 的能力,而不是「低一档」。

但博客同时在图表脚注里给了一个重要修正:原版图表基于较简单的方法,低估了 Sonnet 5 的优势;Anthropic 已改用 10M token budget + compaction + programmatic tool calling 的标准方法重测。修正后,Sonnet 4.6 在 BrowseComp 上拿到 34.6%(无工具)/ 46.8%(有工具)、在 OSWorld-Verified 上拿到 78.5%——这些数字显著高于历史报告中 Sonnet 4.6 的基线。也就是说「Sonnet 5 严格优于 Sonnet 4.6」成立,但对手被统一抬分之后,真实差距比原图看起来更小。

模型	BrowseComp 无工具	BrowseComp 有工具	OSWorld-Verified
Sonnet 4.6(修正方法)	34.6%	46.8%	78.5%
Sonnet 5(新方法)	严格高于 4.6,具体值未公开	严格高于 4.6,具体值未公开	严格高于 4.6,具体值未公开
Opus 4.8(高 effort 近似)	显著高于 Sonnet 5	显著高于 Sonnet 5	显著高于 Sonnet 5

Anthropic 没有在博客里给出 Sonnet 5 在新方法下的绝对数值——它让「优势」成立,但不让数字变成与 Opus 4.8 的精确对照。这种「严格优于 + 不给具体值」的双层口径,是工业级模型发布里相对罕见但完全可以理解的商业选择。作为从业者,真正要看的是 Arena(Agent Arena / Text / Vision / Document / Code(Frontend) Arena)上 ELO 的独立排名,AnthropicAI 官方 X 已经同步公告 Sonnet 5 上线这些 Arena——两周内的 ELO 是关键验证点。

Intelligence Index 这条独立标尺也指向同一档位:Artificial Analysis 把 Sonnet 5 评为 53 分,在 161 个模型中列第 5 位,verbosity(冗长度)300M tokens 远高于同类中位数 87M。9 项 v4.1 基准(GDPval-AA v2、τ³-Banking、Terminal-Bench v2.1、SciCode、Humanity’s Last Exam、GPQA Diamond、CritPt、AA-Omniscience、AA-LCR)里新增了金融(τ³-Banking)与逻辑推理(AA-LCR)两项——这是把 Sonnet 5 推向企业金融与决策类工作流的官方暗示。但 Artificial Analysis 页面只列了 Sonnet 5 的本表,没有把 Opus 4.8 / GPT-5.5 / Gemini 3 / DeepSeek-V4-Pro 同表对比,Intelligence Index 53 与 GPT-5.5 同分、明显落后 Opus 4.7/4.8 是行业惯例推断,需要同口径对齐才能确认梯队。

把变量放在一起看,Intelligence Index 53 分 + verbosity 偏高 + 输出速度 84.8 t/s(高于均值 71)+ 首 token 时延 150.6 秒(同类中位数 2.65 s)——Sonnet 5 是典型的「比 Opus 便宜近一半、智能上限低一档、latency 显著劣化」位置。首 token 时延 150 秒意味着 Sonnet 5 + Max Effort 不是「边想边输出」,而是「先想完 150 秒再开口」——这是 adaptive reasoning 的典型表现,后面在企业实时决策场景下还会回到这个问题。

商业机制:促销期、新 tokenizer 与订阅档默认构成的三件套

Sonnet 5 的能力叙事只是表层,这次发布真正搭出来的是一套把客户从 Sonnet 4.6 迁到自己设计的「中端 → 高端升级路径」上的商业机制。它由三个组件并行生效:

组件一:促销期与标准期的双段定价

Anthropic 第一次在 Sonnet 上给出 60 天促销窗口:促销期(至 2026-08-31)$2 / $10 百万 token(输入/输出),标准期回到 $3 / $15。从公开标牌看,这只是「降价促销」的常规动作;但与 Opus 4.8 的 $5/$25 价差摆在一起,这是一个清晰的产品漏斗动作——Sonnet 5 比 Opus 4.8 便宜 60% 输入、60% 输出,客户用更便宜的价格拿到「接近 Opus」的能力,等促销期结束再选择「回到 Sonnet 4.6」或「升 Opus」。

时间窗口	输入价($/1M token)	输出价($/1M token)	与 Opus 4.8($5/$25)价差
促销期(至 2026-08-31)	$2	$10	-60% 输入 / -60% 输出
标准期(2026-08-31 后)	$3	$15	-40% 输入 / -40% 输出
对照:Sonnet 4.6 同期价位	约 $3	约 $15	同档

组件二:新 tokenizer 与「成本中性」的模糊承诺

Sonnet 5 引入了一个新 tokenizer,同样输入映射到 1.0–1.35× token 数。Anthropic 在博客里只承诺促销定价 designed to make the transition approximately cost-neutral,但不公布「客户实际涨幅的分布」。理论上,英文短 prompt 接近 1.0×,代码片段 1.0–1.1×,HTML/JSON 结构化输入可能逼近 1.2–1.3×,中文等多语种可能更高。叠加标准期价格上调 50%,2026-08-31 后真实账单相对 Sonnet 4.6 同期保守估计高 65–97%,而不是「持平」——在没有第三方独立测算之前,推荐按 1.15–1.20× 评估实际涨幅,而不是相信「成本中性」。

组件三:订阅档默认抬升 + 缓存折扣 + 速率限制重构

Sonnet 5 在 Free / Pro / Max / Team / Enterprise 全线可用,且 Free / Pro 拿到的是「默认模型」——这是 Sonnet 系列第一次把「最强可用中端模型」直接给到免费档,而不是把 Sonnet 5 限制在付费档。速率限制方面,Anthropic 在 2026-04-26 把全 Sonnet / Haiku 档位速率限制改成了Start / Build / Scale 三档——这是为 Sonnet 5 GA 做的预备动作,等于把「从小试用到大生产」的客户分层映射到了 LLM 配额上。Artificial Analysis 给出的混合定价 $2.31/百万 token(7:2:1 cache/input/output 工业口径),对应输入 $3、缓存写入 $3.75、缓存命中 $0.30(-90% 折扣)、输出 $15——Sonnet 5 在 prompt caching 工作流上有效报价比纯输入报价低 23%,等于把「价格透明度」与「缓存策略」绑定,让客户优化自己的 prompt 结构来「享受」价格。

把三件套合起来看,Anthropic 给客户传递的是这样一个故事:前两个月用促销价 + 切换到新 tokenizer,账单大致跟 Sonnet 4.6 持平;之后价格上调 50%,但到时工作流已经在 Sonnet 5 上了,迁移成本大于涨价成本。这是 SaaS 行业经典的「年付首年折扣 + 续约时回归真实价位」打法,被 Anthropic 直接搬到 LLM API 上——这是 Claude 主模型族第一次主动用促销期 + token 体系切换做客户绑定。

中端落地:产品形态与企业级云渠道的同步 GA

Sonnet 5 的产品形态不是「再一个模型发布」,而是跟 Opus 4.8 一样被 Anthropic 当作「全球企业可访问的 Claude 中端主力」铺设到所有云渠道上。

订阅档全线同步:Sonnet 5 在 Free / Pro(默认)、Max / Team / Enterprise 同时可用;Claude Code 与 Claude Platform(claude-sonnet-5)同步上线。第三方集成方面,GitHub Copilot、Notion、Cursor、Devin 都已支持 Sonnet 5——但具体接入日期与切换窗口未在 Anthropic 官方博客中给出,需以各平台官方公告为准。

云渠道四足鼎立:Cyber Verification Program 已上线 native Claude Platform、AWS 上的 Claude Platform、Microsoft Foundry 中的 Claude,Google Vertex 即将上线——三大云渠道同步 GA 是 Sonnet 5 在企业 IT 决策者面前的硬通货。结合 2026-06-29 Opus 4.8 / Haiku 4.5 在 Azure Foundry GA,Anthropic 在 7 天内把「最强 + 最快 + 主力中端」三档模型全部推到了 Azure + AWS + GCP 三云渠道。但 Microsoft Learn 与 ClaudeDevs 的 GA 公告只点了 Opus 4.8 + Haiku 4.5,Sonnet 5 在 Microsoft Foundry 上的 GA 状态仍是开放问题——Azure 客户是否能拿到 Sonnet 5 还是仍要通过 Sonnet 4.6 + Claude Code 接入,待 Microsoft Learn 文档与 ClaudeDevs 后续公告。

安全档位:Sonnet 5 默认开启 cyber safeguards,与 Opus 4.7/4.8 同级、严于 Sonnet 系列此前任何版本(只比 Fable 5 宽松)。Firefox 147 完整利用成功率 Sonnet 4.6 = 0.0% / Sonnet 5 = 0.0%,但 Sonnet 5 部分成功率略高于 4.6,Opus 4.8 与 Mythos 5 在该档位上完整成功率显著更高——意味着 Sonnet 5 在「自主攻击能力」上仍是严格低于 Opus/Mythos 的安全档,Anthropic 的 cyber guardrails 没有在 Sonnet 5 上放水。

对企业级客户的双面影响:机会与陷阱并存

把上面四件事合并,Sonnet 5 GA 对企业级客户的影响不是单面的,而是「机会」与「陷阱」同时摆上桌:

机会面(哪些场景应该立刻用 Sonnet 5):

Free / Pro 拿到 Sonnet 5 默认——对个人开发者与小团队,等于「免费拿到接近 Opus 的 agentic 能力」,这会直接挤压 GPT-5.5 Lite / Gemini 3 Flash 在入门级用户上的渗透空间。
缓存命中 90% 折扣 + 1M 上下文——对企业 RAG、长 prompt 复用、few-shot 例示缓存工作流,Sonnet 5 的有效报价是 $2.31/百万 token,比纯输入报价低 23%。这对已经有成熟 prompt 缓存策略的企业是直接的 TCO 改善。
混合定价 $2.31/百万 token + 三云渠道 GA——对企业 IT 决策者,Sonnet 5 + 缓存折扣 + Claude Code + Cyber Verification Program 接入 = 把「主权推理 + Anthropic SDK 同源 + Claude Platform 原生 API」三件事打包给到企业,降低 Claude 项目化落地的最后一公里摩擦。
agentic 能力正式下放到中端——Sonnet 5 + 高 effort 在 BrowseComp 与 OSWorld-Verified 上拿到接近 Opus 4.8 的能力,意味着中等复杂度的智能体工作流(浏览器自动化、终端控制、计算机使用)可以用中端价位交付,而不是必须上 Opus。

陷阱面(哪些场景要谨慎或暂缓):

首 token 时延 150 秒来自 adaptive reasoning + Max Effort 组合——Sonnet 5 在企业实时决策类工作流上,可能不是「Opus 替代品」,而是需要配合低 effort 路径使用;否则 150 秒沉默期会直接破坏人机交互 UX 与 streaming 体验。
8-31 后真实账单涨幅取决于 tokenizer 膨胀分布——对已经在跑 Sonnet 4.6 的客户,代码 + 多语种 + 结构化输入场景下实际涨幅保守估计 1.15–1.30×,不是 Anthropic 承诺的「成本中性」;迁移决策要把这部分计入。
Intelligence Index 53 分 + verbosity 偏高——Sonnet 5 在「绝对智能」上是「接近 Opus 但明显落后」,verbosity 300M tokens 远高于同类中位数 87M,意味着在成本敏感场景(总结、分类、抽取)上需要 prompt-level 控制输出长度,否则输出 token 费用会显著拉高账单。
Microsoft Foundry GA 状态未明 + Google Vertex「即将上线」——三大云渠道同步 GA 时间决定 Sonnet 5 全球企业可访问性的完整度,在渠道完整度确认前做「全球统一部署」是过度承诺。
BrowseComp / OSWorld-Verified「严格优于」是修正方法后的结论,真实差距比原图小——客户在 Aura 上的独立 benchmark 可能给出不同的差距曲线,Sonnet 5 是否真在 agentic 工作流上比 Sonnet 4.6 强一个量级,要在 Arena 与公开复现中独立验证。

早报观点

Anthropic 在 Sonnet 5 上第一次把「促销窗口 + token 体系切换 + 价格梯度」三件套组合起来——$2/$10 促销(60 天保护)+ 1.0–1.35× 新 tokenizer 通胀 + 8-31 后 $3/$15 标准价回归——这不是 Sonnet 4.x 时代「便宜主力中端」的延续,而是一次产品策略的结构性转弯。Anthropic 从「透明对齐 OpenAI 价格」转向「主动设计价格梯度」,Sonnet 系列的价格策略从此不再是被动跟随。这是一个判断,而不是「能力上限突破」的故事——Sonnet 5 在 Intelligence Index 53 分、首 token 时延 150 秒、verbosity 300M tokens 这些事实面上没有任何 SOTA 突破,但它在商业机制上搭出了一套完整的「年付首年折扣 + 续约回归真实价位」SaaS 玩法。

商业机制层面:这套组合让 Sonnet 5 在名义价位上看似「比 Sonnet 4.6 持平或更便宜」,但实际成本曲线在促销结束后是往上走的。叠加缓存命中 90% 折扣(对应 7:2:1 混合价 $2.31/百万 token)与订阅档默认抬升(Free / Pro 拿到 Sonnet 5 默认),Anthropic 把价格梯度做成了订阅档迁移漏斗。对企业 IT 决策者,Sonnet 5 不再是「单点模型 API」,而是「促销窗口 + token 体系 + 缓存策略 + 订阅档默认」四位一体的合同设计。

对企业级客户的双面影响:机会面是 Free / Pro 拿到接近 Opus 的 agentic 默认、缓存折扣让 RAG 工作流 TCO 下降、三云渠道同步 GA 降低项目化落地摩擦;陷阱面是首 token 时延 150 秒不适合实时决策、tokenizer 膨胀分布不公开使「成本中性」成空头承诺、verbosity 偏高在成本敏感场景需要 prompt-level 控制、Microsoft Foundry GA 状态未明影响全球部署假设。对已经在跑 Sonnet 4.6 的客户,Sonnet 5 不是「直接替换」的简单动作,而是一个「分场景定档位」的策略选择——agentic 工作流上线 Sonnet 5 + Max Effort,实时交互场景退回 Sonnet 4.6 低 effort 路径,RAG 长 prompt 走缓存命中折扣的优化报价,促销期内做模型能力验证,8-31 后再做「留 Sonnet 5 / 升 Opus / 回 Sonnet 4.6」的最终决策。

行业影响层面:Sonnet 5 + 同期 Claude Science 工作台 + Claude Tag 一起发布,等于 Anthropic 在 2026 年下半年把「开发者(Claude Code)+ 团队(Claude Tag)+ 科研(Claude Science)+ 中端主力(Sonnet 5)+ 高端旗舰(Opus 4.8)」的产品拼图正式组合起来。这跟 OpenAI 在 GPT-5.6 时代走出的「ChatGPT 消费者 + Enterprise ChatGPT 企业 + Agent Builder 开发者 + Deep Research 研究助手」拼图高度同构——2026 H2 的 AI 头部玩家竞争已经从「模型 API 单一层」下沉到「产品矩阵 + 渠道矩阵 + 价格梯度」的多维度对抗。Sonnet 5 是 Anthropic 在这场对抗里打出的第一个「多维度对齐」牌,它真正的对手不是 GPT-5.5,而是 OpenAI 整个产品矩阵在 Sonnet 价位段对应的能力。

接下来 60 天要看的是:促销期结束后客户回流到 Sonnet 4.6 的比例、Sonnet 5 升 Opus 的转化率、Arena 上 Sonnet 5 vs Sonnet 4.6 的 ELO 差,以及 Microsoft Foundry 上的 GA 状态。

跟踪点:接下来 60 天的验证坐标

把上面拆开的事实落回到可验证的跟踪指标上,以下八件事是 Sonnet 5 GA 之后的优先级观察对象:

促销期结束后真实账单涨幅测算——第三方独立测算 Sonnet 5 在英文长 prompt、代码、中文、HTML/JSON 等真实客户输入分布上的 tokenizer 膨胀系数中位数,以及在 prompt caching 不同比例下的有效报价。这是判断 Anthropic 「成本中性」承诺是否成立的最直接验证。
Artificial Analysis Intelligence Index v4.1 同口径完整对比表——Opus 4.7/4.8、Gemini 3 Pro、GPT-5.5/5.6、DeepSeek-V4-Pro 在 9 项 v4.1 基准上的同表分数,以及 Sonnet 5 在 #5 位置的精确智能差。
Arena ELO 排名——Sonnet 5 在 Agent Arena / Text / Vision / Document / Code(Frontend) Arena 上线 2 周内的 ELO 排名,以及与 Sonnet 4.6 的精确差值。这是判断 Sonnet 5 「agentic 能力替代更大模型」是否在第二方环境成立的唯一权威验证路径。
OpenAI 同期对 GPT-5.6 与 GPT-5.5 的差异化定价——如果 OpenAI 在 Sonnet 5 发布后把 GPT-5.5 同步降到 $2/$10 或更低,Sonnet 5 在促销期内的「中端默认」位置会受到直接挤压。
DeepSeek-V4-Pro、Qwen 3、Mistral 同月动作——开源阵营在「接近 Sonnet 5 智能但价格低 50 倍」位置上的卡位,直接决定 Anthropic 的促销价锁定策略护城河深度。
Sonnet 5 在 Microsoft Foundry 上的 GA 状态——目前 Foundry 上的 GA 组合是 Opus 4.8 + Haiku 4.5(2026-06-29 GA),Sonnet 5 是否同步 GA 待 Microsoft Learn 文档与 ClaudeDevs 公告更新。
Cyber Verification Program 在 Google Vertex 上的具体上线日期——目前 Anthropic 公告「即将上线」但未给具体日期;三大云渠道同步 GA 时间决定 Sonnet 5 全球企业可访问性的完整度。
速率限制 Start / Build / Scale 三档的具体阈值——目前 Anthropic 仅命名档位名称,具体「分钟请求数 / 分钟 token 数 / 并发数」未在博客中给出绝对值,客户容量规划需以 Anthropic 内部沟通为准。

Claim Audit

Claude Sonnet 5 是迄今最 agentic 的 Sonnet,在 BrowseComp 与 OSWorld-Verified 上严格优于 Sonnet 4.6,且高 effort 下部分场景可匹配 Opus 4.8

置信度：high

Anthropic 官方博客明示『Sonnet 5 is the most agentic Sonnet we've built yet』,并配 BrowseComp 与 OSWorld-Verified 双图表,橙色(Sonnet 5)在所有 effort level 下严格高于灰色(Sonnet 4.6)
博客图表横轴覆盖高 effort 区段,Sonnet 5 的曲线与 Opus 4.8(黄色)的曲线在右侧部分重叠——意味着高 effort 拉满的情况下,Sonnet 5 可以拿到接近 Opus 4.8 的能力
AnthropicAI 官方 X 同步对外宣布 Sonnet 5 在 Arena 的 Agent Arena 与 Text/Vision/Document/Code(Frontend)Arena 上线,意味着社区可在第二方环境验证 agentic 能力

图表脚注明确给出方法论修正——Sonnet 4.6 在新方法(10M token budget + compaction + programmatic tool calling)下 BrowseComp 拿到 34.6%(无工具)/ 46.8%(有工具)、OSWorld-Verified 拿到 78.5%。这意味着 Sonnet 5 vs Sonnet 4.6 的『严格优于』是新方法下的结论,真实差距比原图表面更小(对手被统一提分)。**Sonnet 5 是否真在 agentic 工作流上比 Sonnet 4.6 强一个量级,要在 Arena 与公开复现中独立验证**

促销价 $2/$10 与新 tokenizer 1.0–1.35× 膨胀同时生效,使『成本中性』过渡实际是名义持平、真账单涨幅最高 35%

置信度：medium

Anthropic 官方博客明示促销期 $2/$10、之后 $3/$15,且明示 Sonnet 5 使用更新的 tokenizer,相同输入映射到 1.0–1.35× token
博客称促销定价『designed to make the transition approximately cost-neutral』,但这是『以 Sonnet 4.6 同输入在 Sonnet 5 上产生 1.0× token 为前提』的口径——只要输入特征触发膨胀到 1.35×,实际账单涨幅是 (1+1.35×) 关系,Anthropic 没有给出『客户实际涨幅的中位数 / 分布』
Artificial Analysis 显示混合定价 $2.31/1M tokens(7:2:1 cache/input/output),对应输入 $3、输出 $15——这是 8-31 后标准价口径,不是促销口径。**促销期结束后实际账单涨幅取决于 token 通胀分布**

**Anthropic 博客没有给出『tokenizer 膨胀在真实客户输入上的分布』**。理论上,如果是英文 + 短 prompt 居多的客户,膨胀接近 1.0×;如果是代码 + 长结构化输入或多语种,膨胀可能逼近 1.35×。在没有第三方独立测算之前,推荐保守按 1.15–1.20× 评估实际涨幅,而不是相信『成本中性』

Intelligence Index 53 分与 GPT-5.5 同档,落后 Opus 4.7/4.8,意味着 Sonnet 5 不是『最强模型替代品』,而是『次优中端』

置信度：medium

Artificial Analysis 官方把 Sonnet 5 列为 161 个模型中 Intelligence Index 53 分、第 5 名,verbosity(冗长度)300M tokens 远高于同类中位数 87M
Intelligence Index v4.1 包含 9 项基准(GDPval-AA v2、τ³-Banking、Terminal-Bench v2.1、SciCode、Humanity's Last Exam、GPQA Diamond、CritPt、AA-Omniscience、AA-LCR),这是相对早期 v4 的更广覆盖版本
Anthropic 自己的口径:『比 Opus 4.8 提供更广泛的成本-性能选择范围』——意味着 Sonnet 5 不在『最高智能』上,而在『每美元智能』上

**Artificial Analysis 页面只列了 Sonnet 5 的本表,没有把 Opus 4.8 / GPT-5.5 等其它模型同表对比**;Intelligence Index 53 与 GPT-5.5 同分、落后 Opus 4.7/4.8 是行业惯例推断,需要 Artificial Analysis 或第三方同口径对齐再确认

Anthropic 在 Sonnet 5 默认开启了与 Opus 4.7/4.8 同级的网络安全保障,但 Firefox 147 利用成功率仍是 0%

置信度：high

Anthropic 官方博客明示 Sonnet 5 默认开启 cyber safeguards,与 Opus 4.7/4.8 同级、严于 Sonnet 系列此前任何版本(只比 Fable 5 宽松)
Anthropic 官方安全评估表:Sonnet 4.6 与 Sonnet 5 的 Firefox 147 完整利用成功率均为 0%,但 Sonnet 5 部分成功率略高于 4.6;Opus 4.8 与 Mythos 5 在该档位上完整成功率显著更高
网络安全能力『dramatically lower than Opus 4.8 and Mythos 5』——这是 Anthropic 在 Sonnet 档位上对自主攻击能力的硬约束

『部分成功率』口径不公开,意味着客户无法精确判断 Sonnet 5 在『半自动 exploit』类工作流上的真实可承受阈值;**Opus 4.8 显著更高的具体数字未在博客中给出绝对值,公开图表未对照**

速率限制简化为 Start / Build / Scale 三档,Cloud Code / Claude Platform / GitHub Copilot / Notion / Cursor / Devin 同步接入,意味着 Sonnet 5 是在『整套企业生态』同步 GA,而不是『模型先上、集成后做』

置信度：high

Anthropic 官方博客明示速率限制三档(Start/Build/Scale)是 2026-04-26 起生效、Sonnet 和 Haiku 全档覆盖——这是为 Sonnet 5 GA 做的产品形态预备
Anthropic 官方明示 Sonnet 5 在 Free / Pro(默认)、Max / Team / Enterprise 可用,Claude Code 与 Claude Platform(`claude-sonnet-5`)同时上线
Cyber Verification Program 已上线 native Claude Platform、AWS 上的 Claude Platform、Microsoft Foundry 中的 Claude,即将上 Google Vertex——意味着 Sonnet 5 在三大云渠道上都是已注册组织即可访问,不需要重新申请
据外部集成公告汇总(GitHub Copilot、Notion、Cursor、Devin)显示 Sonnet 5 在第三方 IDE 与协作平台同步上线

GitHub Copilot、Notion、Cursor、Devin 的具体接入日期与切换窗口未在 Anthropic 官方博客中给出——需以各平台官方公告为准;**Anthropic 官方表述『已集成』与第三方平台的官方切换时间表可能存在 1–2 周滞后**

Timeline

2026-04-26

Anthropic 把 Sonnet 和 Haiku 各档位速率限制简化为 Start / Build / Scale 三档,作为 Sonnet 5 发布前的产品形态预备

2026-05-28

Anthropic 发布 Claude Opus 4.8(同系列最强智能档),为 Sonnet 5 设定『上一档价位』参照($5/$25)与『接近但更低』的能力目标

2026-06-09

Anthropic 发布 Claude Fable 5 与 Claude Mythos 5 系列,把 Sonnet 5 的『中端默认模型』位置与 Fable/Mythos 的『高安全/特殊用途』位置进一步分叉

2026-06-12

美国政府发布出口管制指令,暂停 Claude Fable 5 与 Claude Mythos 5 的访问,把 Sonnet 与 Opus 推到了事实上『面向全球可用』的最高档位

2026-06-23

Anthropic 发布 Claude Tag(团队协作形态的新方式),为 Sonnet 5 在团队工作流中嵌入提供配套

2026-06-29

Anthropic 同步把 Claude Opus 4.8 / Haiku 4.5 在 Microsoft Foundry(Azure)正式 GA,Sonnet 5 发布前补齐云渠道最后一块

Sources

official · Anthropic 官方博客:Introducing Claude Sonnet 5 发布日期、促销价 $2/$10 与标准价 $3/$15、新 tokenizer 1.0–1.35× 膨胀、BrowseComp / OSWorld-Verified 严格优于 Sonnet 4.6、高 effort 匹配 Opus 4.8、Sonnet 4.6 重测分数(34.6%/46.8% 与 78.5%)、Firefox 147 利用成功率、订阅档可用性、速率限制 Start/Build/Scale 三档、Cyber Verification Program 上线渠道 primary · Artificial Analysis 官方评测页:Claude Sonnet 5 Intelligence Index 53 分(第 5 位/161 模型)、9 项 v4.1 基准组合、输出速度 84.8 t/s、首 token 时延 150.6 秒、混合定价 $2.31/1M tokens、缓存命中 $0.30(-90%)、缓存写入 $3.75、verbosity 300M tokens、上线时间 2026-06-30、上下文 1M tokens official · AnthropicAI 官方 X(2026-06-30 Sonnet 5 公告) 『Sonnet 5 is the most agentic Sonnet yet』官方原话、Sonnet 5 上线 Agent Arena / Text / Vision / Document / Code(Frontend)Arena、与 Anthropic 官方博客的叙事对齐 official · Anthropic 官方新闻索引(2026 年) 2026-06-09 Fable 5 / Mythos 5、2026-06-12 美国政府指令暂停 Fable/Mythos、2026-06-23 Claude Tag、2026-06-30 Sonnet 5 + Claude Science 工作台一同上线的发布时间线 official · Anthropic 官方 Claude Platform(订阅档与速率限制) 速率限制 Start/Build/Scale 三档在 2026-04-26 生效的产品形态细节、订阅档可用性 Free/Pro 默认 + Max/Team/Enterprise 可选 official · Anthropic 官方 Microsoft Foundry 合作伙伴页云渠道四足鼎立(AWS Bedrock + GCP Vertex AI + Microsoft Foundry + 自有 API)、Claude 计入 MACC 抵扣的双版本架构,作为 Sonnet 5 GA 后在企业 IT 渠道落地的背景信息 primary · GitHub Copilot 官方集成公告(行业第三方公告,经汇总) Sonnet 5 在 GitHub Copilot 中的可用性,可作为 Anthropic 官方『已集成』说法的第二方验证

Watch Next

促销期(2026-08-31)结束后真实账单涨幅:第三方测算 Sonnet 5 在典型英语长 prompt、代码、多语种、表格 HTML 等内容上的 tokenizer 膨胀分布,以及在 prompt caching 占比不同情况下的有效报价
Artificial Analysis Intelligence Index v4.1 同口径下的 Opus 4.8 / GPT-5.5 / Gemini 3 / DeepSeek-V4-Pro 完整对比表——Sonnet 5 在 #5 位置的对照基线目前是行业惯例推断,需要官方同表对比确认
Sonnet 5 在 Arena(Agent Arena / Text / Vision / Document / Code(Frontend))上线 2 周内的 ELO 排名与 Sonnet 4.6 对比——这是判断『agentic 能力替代更大模型』说法是否成立的第二方验证路径
OpenAI 同期对 GPT-5.6 与 GPT-5.5 的差异化定价:如果 OpenAI 把 GPT-5.5 价格调到 $2/$10 或更低,Sonnet 5 在促销期里的『中端默认』位置会受到直接挤压
DeepSeek-V4-Pro 与 Qwen 3 系列同月动作:开源阵营在『接近 Sonnet 5 智能但价格低 50 倍』的卡位上是否同步有定价或智能突破,直接决定 Anthropic 『促销价锁定订阅档迁移』的护城河深度
Cyber Verification Program 在 Google Vertex 上的 GA 时间——目前 Anthropic 公告『即将上线』,但具体日期未定。三大云渠道同步 GA 后,Sonnet 5 才能真正覆盖『全球企业可访问』的全谱
Sonnet 5 在 Microsoft Foundry 上的 GA 时间——目前 Foundry 上的 Claude GA 组合是 Opus 4.8 + Haiku 4.5(2026-06-29 GA),Sonnet 5 是否在 Foundry 同步 GA 待 Microsoft Learn 文档与 ClaudeDevs 公告更新
Claude 速率限制 Start / Build / Scale 三档的内部阈值是否公开——目前 Anthropic 仅命名了档位名称,具体『分钟请求数 / 分钟 token 数 / 并发数』未在博客中给出绝对值,客户容量规划需以 Anthropic 内部沟通为准
Anthropic 是否在 2026 H2 发布『Sonnet 5.5 或 Sonnet 5 Opus』(中端与高端之间的混合档)——若 Gemini 3 与 GPT-5.5 抢占了 Sonnet 5 与 Opus 4.8 之间的智能差,Anthropic 可能用新档位填补
Fable 5 / Mythos 5 在 2026-06-12 美国政府出口管制暂停后,何时以何种形式回归——这是 Sonnet 5 在『全球可用最高档』独占窗口能维持多久的关键变量

待解问题

Sonnet 5 的新 tokenizer 在典型英文长 prompt、代码、多语种(尤其是中文)、HTML 表格等真实客户输入上的膨胀分布中位数是多少?Anthropic 不会公布,需要第三方测算
Intelligence Index 53 分在 Artificial Analysis v4.1 同口径下,Opus 4.7/4.8、Gemini 3 Pro、GPT-5.5/5.6 的具体分值是多少?Sonnet 5 与 GPT-5.5 是否真同分需要官方对照
Sonnet 5 的『高 effort 匹配 Opus 4.8』是『严格等于』还是『部分场景接近』?Anthropic 图表脚注里给出的『部分场景』具体指哪些场景、匹配到什么程度,官方只用了定性描述
促销期结束后(2026-08-31)客户回流到 Sonnet 4.6 还是直接迁到 Opus 4.8?Anthropic 给了 60 天保护窗口但没有给出『到期策略』——客户实际行为会决定 Sonnet 5 是『中端主力』还是『过渡档』
Cyber Verification Program 在 Google Vertex 上的具体上线日期是什么?目前 Anthropic 公告『即将上线』但未给具体日期;三大云渠道同步 GA 时间决定 Sonnet 5 企业可访问性的完整度
Sonnet 5 在 Microsoft Foundry 上的 GA 状态是什么?2026-06-29 ClaudeDevs 公告点名的 GA 组合是 Opus 4.8 + Haiku 4.5,Sonnet 5 是否同步 GA 待 Microsoft Learn 文档与 ClaudeDevs 公告更新
Fable 5 / Mythos 5 何时以何种形式回归?2026-06-12 美国政府出口管制暂停至今未给回归时间表,Sonnet 5 的『全球可用最高档』独占窗口有多大,决定 Anthropic 是否需要 Sonnet 5 长期充当准旗舰
Sonnet 5 的『首 token 时延 150 秒』来自 adaptive reasoning + max effort 组合;在企业实时决策类工作流上是否会被换回 Sonnet 4.6 低 effort 路径?时延数据是否会倒灌影响客户对 agentic 工作流的预算