产品上新

Claude Code 2.1.198:Chrome 正式 GA、Background Agents 端到端开 PR,把『流行病学调试』搬进产品

32 项 CLI 变更里,真正改变工程师工作方式的是 Chrome GA 与后台 agent 自交付——Anthropic 把 GitHub Copilot Coding Agent 和 Devin 走了两年的方向,折叠进了 Claude Code 自身的更新节奏。

2026年7月2日 · 周四 深度报告 高置信 重要度 5/5

本文要点

  • Claude in Chrome 由 beta → GA:Chrome/Edge 浏览器成为 Claude Code 的第一类原生运行环境,登录态共享,8 类浏览器内任务在文档里被明确列举
  • Background agents 在 worktree 写完代码后,由『停在 dirty worktree 等开发者 attach』变为『自动 commit + push + 开 draft PR』;agent view 增加 PR 列(黄/绿/紫/灰),开发者从『盯 agent 跑』切换为『看 PR 颜色变绿』
  • Explore agent 不再跑在固定 Haiku 上,改为继承主会话模型(opus 封顶);subagents + context compaction 同步继承 extended thinking 配置——子代理质量门统一上调
  • Gateway 引入 anthropicAws 上游 provider,model-not-found 响应推进 failover chain;对企业多 region / 多账号路由场景做了硬化
  • 新增 /dataviz skill(自带可运行调色板验证器);`Notification` hook 增 `agent_needs_input` / `agent_completed` 两个事件,后台 agent 状态可被外部自动化消费

2026 年 7 月 2 日,Anthropic 发布 Claude Code 2.1.198,带来 32 项 CLI 变更——CHANGELOG 上拆成 8 项 new features17 项 fixes6 项 improvements(其中 1 项 Removed)。这并不是一次普通的小版本:Chrome 浏览器集成结束 beta 阶段正式 GA;后台 agents 在 worktree 中完成代码后,会自动 commit、push 并开 draft PR;Explore 子代理不再跑在 Haiku 上,改为继承主会话模型(opus 封顶)。一连串变化的共同指向是:Anthropic 把『agent 不需要开发者随时监督,可以独立在后台交付』这一思路,从工程博客搬进了产品的默认行为。

Claude in Chrome:从 dev tools 到 dev/web 交界面

Chrome 集成从 beta 阶段(自 Claude Code 2.0.73 起作为可选能力)走到 2.1.198 正式 GA,意味着 Chrome/Edge 浏览器成为 Claude Code 的第一类原生运行环境。能力清单覆盖 8 类:

  • Live debugging:打开 dev console 读取错误,直接定位代码侧根因
  • Design verification:从 Figma mock 出 UI 后,在浏览器里肉眼校验
  • Web app testing:填表单、检查 visual regression、跑完整 user flow
  • Authenticated web apps:复用浏览器登录态,直接操作 Google Docs / Gmail / Notion,无需 MCP 连接器
  • Data extraction:从网页结构化抽取数据
  • Task automation:跨站点、多步骤的重复性操作
  • Session recording:把浏览器交互录成 GIF 用于文档或团队分享
  • Multi-site workflows:跨多个 tab 协调任务,如『查明天日历,给每个外部参会者公司主页加备注』

这是 Anthropic 在 IDE 与终端之外的第三块拼图——把『code 在哪儿写』和『code 在哪儿运行』拉到同一个 session 里。值得注意的是,Chrome GA 不止是『再多一个集成』:它把 web 应用从『需要 MCP 写 wrapper 才能被 Claude 访问』的间接层,降级为『浏览器已经在桌面上打开,直接控制标签页』。对一个工程师日常工作流而言,这意味着跨 stack 调试(local + Web)第一次有了统一的 agent 编排层。

不过 GA 也带来硬约束:Chrome 集成不支持 Brave、Arc 或其他 Chromium 衍生浏览器,WSL 也不支持;通过 Bedrock、Vertex AI、Microsoft Foundry 接入 Claude 的企业用户,无法用 Chrome 能力——文档原话是『not available through third-party providers』。换言之,Bedrock/Vertex 客户的 Chrome 集成,要走企业版 Claude.ai 账号或直连 Anthropic Console 才走得通。

Background agents:终于拿到 commit 权限

2.1.198 最让从业者注目的变更,是后台 agents 终于不必等开发者点头就能交活。CHANGELOG 原话:

Background agents launched from claude agents now commit, push, and open a draft PR when they finish code work in a worktree, instead of stopping to ask.

对应 agent view 文档的设计:PR 列以4 色编码状态——黄色(等 CI/review 或 CI 失败)、绿色(CI 通过且无 review 阻塞)、紫色(已合并)、灰色(草稿或已关闭)。文档原话:

For most tasks this column is where you pick up the result: review and merge the pull request when its number turns green.

这一步的意义在于:此前的 background agent 只是『跑在后台的 Claude 会话』,完成代码后停在 dirty worktree 上等开发者 attach;现在 agent view 把 PR 列当成终端用户接入点,开发者从『盯着 agent 跑』转为『看 PR 颜色变绿』。这是 Anthropic 把 GitHub Copilot Coding Agent、Devin 走了两年的方向折叠进自家产品的更新节奏——而且是在原生 CLI 里实现,不需要开发者切到独立 SaaS。

需要注意的是边界条件。agent view 文档明确指出:auto-PR 仅在 worktree 内的工作适用,若设置 worktree.bgIsolation: "none"(文档原话是『background sessions then edit your working copy directly without moving into a worktree first』),agent 直接改 working copy,这条 PR 自动化路径不适用。Hotfix 场景下,大多数工程师不会希望 background agent 自动改 main 分支,因此 bgIsolation=none 仍是关闭开关。

为支持这条路径,2.1.198 还顺手补了几个相关变更:Notification hook 新增 agent_needs_input / agent_completed 两个事件,外部自动化(如 Slack bot、企业 webhook)可以订阅后台 agent 状态;/loginclaude agents view 里直接打开登录对话框,而不是提示『not available』;worktree 自动清理逻辑加固(leaked worktree 会被自动回收)。这些加起来,是一整套『开发者不必守在终端前』的产品体验。

Explore agent 模型继承:Anthropic 抬高子代理质量门

表面上是 32 项变更里不起眼的一行,实质上是 Anthropic 在产品里悄悄抬高了子代理的质量门槛。CHANGELOG 原话:

The built-in Explore agent now inherits the main session’s model (capped at opus) instead of running on haiku.

同期另一条:

Subagents and context compaction now inherit the session’s extended thinking configuration, improving output quality on delegated tasks.

过去 Explore agent 一律跑在 Haiku 类小模型上,token 便宜但代码理解深度受限;现在改继承主会话模型(opus 封顶),意味着 Anthropic 在『小模型跑子代理省 token』与『大模型跑子代理拿质量』之间,选边了后者。这是与 2.1.197 把 Sonnet 5 设为默认模型的连锁反应——底层模型能力上来了,上层 agent 的成本/质量 tradeoff 自然要重新调。

至于成本弹性的具体数字,CHANGELOG 没披露。一个粗略的估算:Haiku 输入价约为 Sonnet 的 1/15、Opus 的 1/60;若一个典型 Explore 调用原本用 50k tokens 跑在 Haiku 上,改用 Sonnet 5 之后成本约 15 倍,改用 Opus 约 60 倍。这意味着 Explore 在大型 monorepo 上的日均成本可能从几美分跃升到几美元——这对个人开发者不痛不痒,但对 CI 里跑几十次 Explore 的企业流水线是预算级影响。

旁路:worktree 隔离如何撑起 auto-PR

auto-PR 这件事能落到产品默认行为,背后是 Claude Code 自 2.1.139 起逐步搭起的 worktree 隔离架构——这条线在 agent view 文档里有详细描述,但容易被读者当作脚注忽略。简单梳理:

每个 background session 启动时,supervisor 进程会先在 .claude/worktrees/ 下创建独立 git worktree。多个并行 session 共享同一个仓库的 read view,但各自写入自己的 worktree——这是 PR 自动化的物质基础:agent 改的文件天然在隔离分支里,commit + push 不会污染 main。Worktree 之外有两类跳过:已在一个 linked git worktree 内的工作目录(如开发者手动 git worktree add 的临时分支),以及非 git 仓库 + 没有 WorktreeCreate hook 的目录。文档明确写出这条规则,意味着开发者主动用 git worktree 隔离的工作流不会被『挤』进 .claude/worktrees/

子代理层面,Claude 提供了 isolation: "worktree" 前置字段——subagent 可以拿到自己的 worktree,而不是继承父 session 的 worktree。Worktree 的生命周期由 supervisor 管理:claude rm <id> 在没有 uncommitted change 时清理 worktree,有 change 时打印路径让开发者自决;Ctrl+X 两次连续按下会在 agent view 里删 session 并清 worktree。

把这条架构摊开看,Anthropic 在过去 6 个月里(2.1.139 → 2.1.198)把 background agent 从『一个孤立的子进程』升级成了『带状态持久化 + worktree 隔离 + PR 自动化 + supervisor 进程模型』的完整运行时。2.1.198 不是起点,是这条线的终点形态——agent view 文档末尾的『Version history』表也佐证这一点:2.1.196 才把 single press 背景化做通,2.1.195 才让 Windows in-flight work 携带,2.1.198 终于把 auto-PR 加进来。

Sonnet 5 + 1M 上下文:Claude Code 的底座升级

值得在 2.1.198 报道里点一笔的背景:同一天,Anthropic 还在别的产品线推送 Sonnet 5 与 1M token 上下文,而 2.1.197 把 Sonnet 5 设为 Claude Code 的默认模型。Sonnet 5 引入 1M token 原生上下文(对应 Claude Code 的 /model 面板里会出现 1M 选项),introductory 定价 $2/$10 per Mtok 至 8 月 31 日,之后调为 $3/$15 per Mtok(对比 Opus 4.8 仍为 $5/$25)。CHANGELOG 原文:

Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31

1M 上下文对代码 agent 的意义不止『能装更多代码』:在大型 monorepo 上,整个仓库 + git log + 文档可以一次性塞进上下文,Explore agent 与代码改写类 agent 不再需要频繁 compact 或分片读取;长 PR review 一次性喂给 Sonnet 5,人类 reviewer 与 agent 拿到的是同一份完整视图。LMArena 在 6-30 同步推送的 Agent Arena 上,Fable 5 重回 #1;Claude Science(7-02 上线)则把同一思路——长上下文 + 多 agent 编排 + specialist 衍生——搬进 science workbench。

把 2.1.198 的 auto-PR 与 1M 上下文叠加,Claude Code 现在的形状是:Sonnet 5 默认 + 1M 上下文 + background agents auto-PR + Chrome GA + Explore 子代理模型继承——一个企业级 dev tools 栈,把 Sonnet 5 装进了开发者每天打开 8 小时的工作流。

暗线:从『医生式』到『流行病学』的工程范式

把 2.1.198 放回一周内的事件脉络,会发现多个产品线在同步推进同一思路:

日期事件共同信号
2026-06-30OpenAI 发布《Core dump epidemiology》把『开发者盯屏幕看错误』转为『后台系统自动聚类』
2026-07-01Claude Fable 5 全球恢复 + Sonnet 5 上线模型 + safeguard + 商业恢复并行
2026-07-01Claude Code 2.1.197(Sonnet 5 默认 + 1M context)把 Sonnet 5 装入开发者工具
2026-07-02Claude Code 2.1.198(Chrome GA + 后台 agent 自动 PR + Explore 模型继承)把『agent 自交付』搬进默认行为
2026-07-02Claude Science beta 上线(接 NVIDIA BioNeMo)进入 science AI workbench 市场

OpenAI 6-30 那篇工程博客讲的是 Rockset 团队怎么用『流行病学方法』定位 GNU libunwind 18 年历史的 race condition——竞态窗口只有一条指令宽(约 100 皮秒),传统『医生模式』单 case 调试根本捕捉不到,必须靠全量 core dump 按节点/时间/区域聚类。Anthropic 在自家 dev tools 上做的事,正是同一思路的产品化:agent 不再需要开发者像医生问诊一样盯着,而是像流行病学家一样,在后台持续观测、自动汇总异常、产出可消费的 PR。

具体到 Claude Code,这条思路的载体有三个:Notification hook 在 agent_needs_input / agent_completed 时把后台 agent 状态广播出去,企业 Slack / PagerDuty / Lark 机器人可以订阅;claude agents --json 输出 state: working/blocked/done/failed/stopped + waitingFor 字段,运维脚本可以按状态聚类;PR 列的颜色编码把『哪些 PR 需要人类关注』压缩成一个视觉信号。整套机制是把『异常 → 聚类 → 消费』的流行病学流水线搬进了开发者终端

这跟传统 IDE 的『live debug』哲学相反。传统 IDE 假定开发者会盯着断点和栈;新的 agent 范式假定开发者只关心最终 PR 颜色。Devin、Cognition、GitHub Copilot Coding Agent 都走过这条路;Claude Code 2.1.198 的差异在于把这条路折叠进开发者已经在用的 CLI 节奏——企业不需要为『AI agent 自交付』重新采购 SaaS,而是升级 Claude Code 版本就拿到了。对 GitHub Copilot Coding Agent 来说,这意味着 2.1.198 之后的 Claude Code 用户多了一个不切换 IDE 就能跑 agent 自交付的选项;对 Devin 这类独立 SaaS 来说,Claude Code 把 agent 自交付内化到『开发者已经在的工作流』,Devin 的『独立 SaaS 体验』优势被稀释。

早报观点

早报观点

从产品史的角度看,Claude Code 2.1.198 是 Anthropic 把『agent 不需要被监督』从口号落实到 CLI 默认行为的标志性版本。三条判断:

第一,Chrome GA 是 Anthropic 在 IDE 之外补『dev/web』交界面。 这不是简单的『再加一个集成』。Chrome/Edge 跑在每个工程师桌面上,复用浏览器登录态后,Anthropic 实际上把 web 应用从『需要 MCP 写 wrapper』的间接层降级为『浏览器已开,直接控制』的零摩擦层。这条路上 Anthropic 的对手不是 JetBrains、不是 Cursor,而是 OpenAI 的 ChatGPT Atlas、Perplexity 的 Comet——AI-native browser。Anthropic 走的是相对轻的扩展路径(extension + native messaging host),不是重做一个浏览器,这是工程上更稳的选择,但品牌曝光度不及 Atlas/Comet。

第二,auto-PR 是开发者工作流最实质的范式切换。 表面上 PR 列颜色只是 UI 改动,实质上是把『开发者从『盯 agent 跑』切换为『看 PR 颜色变绿』』。这要求人类 reviewer 重新校准预期:过去 review 同事的 PR,现在 review agent 的 PR——后者可能在 syntax、命名、test coverage 上更工整,但在 architecture intent、边界 case 的工程判断上需要 reviewer 主动追问。Anthropic 把『agent 能交活』这件事从概念落到了开发者每天会扫的视觉信号。

第三,Explore agent 模型继承是一道暗线。 子代理质量门统一上调,意味着 Anthropic 在『小模型省 token』与『大模型拿质量』之间明确选了后者。这条决策在 Sonnet 5 价格(促销 $2/$10 per Mtok)已经下行之后成立,但对用 Opus 跑 Explore 的用户来说,token 成本会显著上升。这是开发者要在配置层面重新做的一笔账。

反面 caveat 三条:Chrome GA 的硬约束(Brave/Arc/WSL/第三方 provider 不支持)会让企业落地分两阶段——先在 Anthropic 直连账号上全量铺,再跟 Bedrock/Vertex 团队谈判是否独立支持。auto-PR 的边界条件(worktree.bgIsolation=none 时不适用)也会让一线的 hotfix 场景继续走人工 commit 路径。最后,Explore 模型继承的成本弹性目前是『黑盒』,Anthropic 没给企业一个明确的 token 预算工具——这是后续 1-2 个小版本里大概率会补的东西。

接下来看什么

  • PR 列颜色的真实分布:Anthropic 是否会公开 Background agents auto-PR 的人类 review 通过率与合并率?若 PR 列大量停在黄色,意味着 agent 写的代码 review 通过率偏低,工程团队需要重新校准 dispatch 粒度。
  • Explore agent 在大型 monorepo 上的 token 弹性:Haiku → Sonnet/Opus 的成本弹性需要 Anthropic 与企业客户共同披露;建议在自家 monorepo 上做 A/B(用 2.1.197 vs 2.1.198 跑同一批 dispatch prompt,对比 token 与 PR 合并率)。
  • Chrome 集成的第三方 provider 解禁时间表:Bedrock/Vertex/Foundry 用户的硬约束何时松动;这条直接决定 Anthropic 在企业 dev tools 市场的渗透速度。
  • anthropicAws Gateway 上游的 failover 行为:model-not-found 触发链式 fallback 时,会不会把账号/region 配置错误『静默掩盖』——failover chain 是好用,但也可能成为排查难题。
  • Background agents 在 Windows / WSL 上的稳定性:2.1.195 文档把 Windows in-flight work 携带写明,但 hot-reload / restart 路径尚未在大规模企业用户中跑过;关注 2.1.199/2.1.200 是否有针对 Windows 的二次硬化。
  • /dataviz skill 的扩散路径:自带可运行调色板验证器是个有意思的工程实践,看是否会被吸收进 Claude.ai 通用工具栈——如果吸收,意味着 Claude Code 既是 dev tools,也是 IDE 的试验田。
附:2.1.198 完整 32 项变更清单(原文摘要)

New features(8 项)

  1. Claude in Chrome 由 beta → GA
  2. Background agent 通知:claude agents 中需要输入或完成的任务触发 Notification hook(agent_needs_input / agent_completed)
  3. 新增 /dataviz skill(图表 / dashboard 设计指引 + 可运行调色板验证器)
  4. Gateway 新增 Claude Platform on AWS(anthropicAws)上游;model-not-found 推进 failover chain
  5. Background agents 从 claude agents 启动后,在 worktree 完成代码即 commit + push + 开 draft PR
  6. 内置 Explore agent 改为继承主会话模型(opus 封顶),不再跑在 Haiku
  7. Subagents + context compaction 继承主会话 extended thinking 配置
  8. Mac over SSH 时键盘快捷键提示用 opt/cmd 而非 alt/super

Fixes(17 项,节选)

  • 网络瞬断(E.g. ECONNRESET)现在带 backoff 重试,不再 abort 当次 turn
  • 后台分类器对同一网络主机的重复访问不再触发重复请求
  • 后台任务(web/desktop/VS Code)在完成或 resume 后不再卡在『Running』
  • Agent teams:队友在 API error 后向 lead 上报『failed』;对 stuck 队友发消息可立即唤醒重试
  • /diff 面板在 session 外切换分支 / commit 后不再不刷新
  • Markdown 表格在全屏模式下不再溢出右侧边框
  • macOS 后台 agent 访问内网主机不再被『no route to host』拦截(Local Network entitlement 已声明)
  • /desktop 进入并退出 worktree 后不再报『Cannot determine working directory』
  • macOS 后台 agent view 打开时不再每 ~52 秒弹『Reconnecting…』
  • claude attach <id> 中按 不再误退到 shell,而是打开 agent view
  • claude --bg--print/-p 冲突时前置拒绝,不再静默建出无法 attach 的 session
  • .claude/rules/ 条件规则在符号链接路径上不再不加载
  • macOS Warp 全屏模式下 Cmd+click 不再打不开 URL
  • 全屏模式双击单词选词现在包含 scheme 完整 URL
  • Plan mode 启动时不再不自动允许只读 tool
  • /branch 默认 fork 名取自首条真实 prompt 而非 compaction summary
  • Claude Platform on AWS / Mantle STS token 过期不再死锁到『Please run /login』(awsAuthRefresh 自动触发)

Improvements(6 项,含 1 项 Removed)

  • Focus mode 改进:subagent 出现在活动 summary,完成的后台通知合并成单一计数
  • 代码块 / diff / 文件预览的语法高亮升级到 highlight.js 11
  • API retry UX:第二次失败时显示具体错误原因;API 过载时 spinner 提示换成 status page 链接
  • /loginclaude agents view 里直接打开登录对话框
  • Subagents 视上游 agent 的消息为普通任务指令;agent 消息仍不会被当作 user 批准
  • 移除 /agents 向导:改为直接对话或编辑 .claude/agents/