产品上新

Claude Code 2.1.198：Chrome 正式 GA、Background Agents 端到端开 PR,把『流行病学调试』搬进产品

32 项 CLI 变更里,真正改变工程师工作方式的是 Chrome GA 与后台 agent 自交付——Anthropic 把 GitHub Copilot Coding Agent 和 Devin 走了两年的方向,折叠进了 Claude Code 自身的更新节奏。

2026年7月2日 · 周四深度报告高置信重要度 5/5

#claude-code #anthropic #agent #devtools #background-agent #chrome #worktree

Research Pack

核心问题

Claude Code 2.1.198 的 32 项变更里,真正改变开发者工作方式的是哪几项?这些变更背后,Anthropic 想把 Claude Code 推向哪种产品形态?

为什么是现在

2.1.198 紧跟 2.1.197(Sonnet 5 默认模型)与 OpenAI 6-30 工程博客《Core dump epidemiology》强调的『流行病学调试』思路。在一周内连续把『agent 自交付』从博客叙事搬进产品默认行为——这是开发者工具市场的拐点信号:从『人监督 agent』到『agent 自交付』的范式切换

关键数字

32 项
Claude Code 2.1.198 CLI 变更数GitHub CHANGELOG 共 32 条 bullet;拆为 8 项 new features + 18 项 fixes(附录节选 17/18) + 6 项 improvements(含 1 项 Removed)

默认模型
Sonnet 5 在 Claude Code 的默认状态2.1.197 起 Claude Code 把 Sonnet 5 设为默认模型,首推 1M-token 上下文;introductory 定价 $2/$10 per Mtok 至 8 月 31 日

0 步手动 commit/push
Background agent 自动开 PR 的人工参与度agent 在 worktree 写完代码后直接 commit + push + 开 draft PR;开发者只需在 agent view 看 PR 列颜色变化(灰→黄→绿→紫)

4 色
Agent view PR 列状态颜色编码黄(等 CI/review 或失败)、绿(CI 过且无 review 阻塞)、紫(已合并)、灰(草稿或已关闭)

本文要点

Claude in Chrome 由 beta → GA:Chrome/Edge 浏览器成为 Claude Code 的第一类原生运行环境,登录态共享,8 类浏览器内任务在文档里被明确列举
Background agents 在 worktree 写完代码后,由『停在 dirty worktree 等开发者 attach』变为『自动 commit + push + 开 draft PR』;agent view 增加 PR 列(黄/绿/紫/灰),开发者从『盯 agent 跑』切换为『看 PR 颜色变绿』
Explore agent 不再跑在固定 Haiku 上,改为继承主会话模型(opus 封顶);subagents + context compaction 同步继承 extended thinking 配置——子代理质量门统一上调
Gateway 引入 anthropicAws 上游 provider,model-not-found 响应推进 failover chain;对企业多 region / 多账号路由场景做了硬化
新增 /dataviz skill(自带可运行调色板验证器);`Notification` hook 增 `agent_needs_input` / `agent_completed` 两个事件,后台 agent 状态可被外部自动化消费

2026 年 7 月 2 日,Anthropic 发布 Claude Code 2.1.198,带来 32 项 CLI 变更——CHANGELOG 上拆成 8 项 new features、17 项 fixes 与 6 项 improvements(其中 1 项 Removed)。这并不是一次普通的小版本:Chrome 浏览器集成结束 beta 阶段正式 GA;后台 agents 在 worktree 中完成代码后,会自动 commit、push 并开 draft PR;Explore 子代理不再跑在 Haiku 上,改为继承主会话模型(opus 封顶)。一连串变化的共同指向是:Anthropic 把『agent 不需要开发者随时监督,可以独立在后台交付』这一思路,从工程博客搬进了产品的默认行为。

Claude in Chrome:从 dev tools 到 dev/web 交界面

Chrome 集成从 beta 阶段(自 Claude Code 2.0.73 起作为可选能力)走到 2.1.198 正式 GA,意味着 Chrome/Edge 浏览器成为 Claude Code 的第一类原生运行环境。能力清单覆盖 8 类:

Live debugging:打开 dev console 读取错误,直接定位代码侧根因
Design verification:从 Figma mock 出 UI 后,在浏览器里肉眼校验
Web app testing:填表单、检查 visual regression、跑完整 user flow
Authenticated web apps:复用浏览器登录态,直接操作 Google Docs / Gmail / Notion,无需 MCP 连接器
Data extraction:从网页结构化抽取数据
Task automation:跨站点、多步骤的重复性操作
Session recording:把浏览器交互录成 GIF 用于文档或团队分享
Multi-site workflows:跨多个 tab 协调任务,如『查明天日历,给每个外部参会者公司主页加备注』

这是 Anthropic 在 IDE 与终端之外的第三块拼图——把『code 在哪儿写』和『code 在哪儿运行』拉到同一个 session 里。值得注意的是,Chrome GA 不止是『再多一个集成』:它把 web 应用从『需要 MCP 写 wrapper 才能被 Claude 访问』的间接层,降级为『浏览器已经在桌面上打开,直接控制标签页』。对一个工程师日常工作流而言,这意味着跨 stack 调试(local + Web)第一次有了统一的 agent 编排层。

不过 GA 也带来硬约束:Chrome 集成不支持 Brave、Arc 或其他 Chromium 衍生浏览器,WSL 也不支持;通过 Bedrock、Vertex AI、Microsoft Foundry 接入 Claude 的企业用户,无法用 Chrome 能力——文档原话是『not available through third-party providers』。换言之,Bedrock/Vertex 客户的 Chrome 集成,要走企业版 Claude.ai 账号或直连 Anthropic Console 才走得通。

Background agents:终于拿到 commit 权限

2.1.198 最让从业者注目的变更,是后台 agents 终于不必等开发者点头就能交活。CHANGELOG 原话:

Background agents launched from claude agents now commit, push, and open a draft PR when they finish code work in a worktree, instead of stopping to ask.

对应 agent view 文档的设计:PR 列以4 色编码状态——黄色(等 CI/review 或 CI 失败)、绿色(CI 通过且无 review 阻塞)、紫色(已合并)、灰色(草稿或已关闭)。文档原话:

For most tasks this column is where you pick up the result: review and merge the pull request when its number turns green.

这一步的意义在于:此前的 background agent 只是『跑在后台的 Claude 会话』,完成代码后停在 dirty worktree 上等开发者 attach;现在 agent view 把 PR 列当成终端用户接入点,开发者从『盯着 agent 跑』转为『看 PR 颜色变绿』。这是 Anthropic 把 GitHub Copilot Coding Agent、Devin 走了两年的方向折叠进自家产品的更新节奏——而且是在原生 CLI 里实现,不需要开发者切到独立 SaaS。

需要注意的是边界条件。agent view 文档明确指出:auto-PR 仅在 worktree 内的工作适用,若设置 worktree.bgIsolation: "none"(文档原话是『background sessions then edit your working copy directly without moving into a worktree first』),agent 直接改 working copy,这条 PR 自动化路径不适用。Hotfix 场景下,大多数工程师不会希望 background agent 自动改 main 分支,因此 bgIsolation=none 仍是关闭开关。

为支持这条路径,2.1.198 还顺手补了几个相关变更:Notification hook 新增 agent_needs_input / agent_completed 两个事件,外部自动化(如 Slack bot、企业 webhook)可以订阅后台 agent 状态;/login 在 claude agents view 里直接打开登录对话框,而不是提示『not available』;worktree 自动清理逻辑加固(leaked worktree 会被自动回收)。这些加起来,是一整套『开发者不必守在终端前』的产品体验。

Explore agent 模型继承:Anthropic 抬高子代理质量门

表面上是 32 项变更里不起眼的一行,实质上是 Anthropic 在产品里悄悄抬高了子代理的质量门槛。CHANGELOG 原话:

The built-in Explore agent now inherits the main session’s model (capped at opus) instead of running on haiku.

同期另一条:

Subagents and context compaction now inherit the session’s extended thinking configuration, improving output quality on delegated tasks.

过去 Explore agent 一律跑在 Haiku 类小模型上,token 便宜但代码理解深度受限;现在改继承主会话模型(opus 封顶),意味着 Anthropic 在『小模型跑子代理省 token』与『大模型跑子代理拿质量』之间,选边了后者。这是与 2.1.197 把 Sonnet 5 设为默认模型的连锁反应——底层模型能力上来了,上层 agent 的成本/质量 tradeoff 自然要重新调。

至于成本弹性的具体数字,CHANGELOG 没披露。一个粗略的估算:Haiku 输入价约为 Sonnet 的 1/15、Opus 的 1/60;若一个典型 Explore 调用原本用 50k tokens 跑在 Haiku 上,改用 Sonnet 5 之后成本约 15 倍,改用 Opus 约 60 倍。这意味着 Explore 在大型 monorepo 上的日均成本可能从几美分跃升到几美元——这对个人开发者不痛不痒,但对 CI 里跑几十次 Explore 的企业流水线是预算级影响。

旁路:worktree 隔离如何撑起 auto-PR

auto-PR 这件事能落到产品默认行为,背后是 Claude Code 自 2.1.139 起逐步搭起的 worktree 隔离架构——这条线在 agent view 文档里有详细描述,但容易被读者当作脚注忽略。简单梳理:

每个 background session 启动时,supervisor 进程会先在 .claude/worktrees/ 下创建独立 git worktree。多个并行 session 共享同一个仓库的 read view,但各自写入自己的 worktree——这是 PR 自动化的物质基础:agent 改的文件天然在隔离分支里,commit + push 不会污染 main。Worktree 之外有两类跳过:已在一个 linked git worktree 内的工作目录(如开发者手动 git worktree add 的临时分支),以及非 git 仓库 + 没有 WorktreeCreate hook 的目录。文档明确写出这条规则,意味着开发者主动用 git worktree 隔离的工作流不会被『挤』进 .claude/worktrees/。

子代理层面,Claude 提供了 isolation: "worktree" 前置字段——subagent 可以拿到自己的 worktree,而不是继承父 session 的 worktree。Worktree 的生命周期由 supervisor 管理:claude rm <id> 在没有 uncommitted change 时清理 worktree,有 change 时打印路径让开发者自决;Ctrl+X 两次连续按下会在 agent view 里删 session 并清 worktree。

把这条架构摊开看,Anthropic 在过去 6 个月里(2.1.139 → 2.1.198)把 background agent 从『一个孤立的子进程』升级成了『带状态持久化 + worktree 隔离 + PR 自动化 + supervisor 进程模型』的完整运行时。2.1.198 不是起点,是这条线的终点形态——agent view 文档末尾的『Version history』表也佐证这一点:2.1.196 才把 single ← press 背景化做通,2.1.195 才让 Windows in-flight work 携带,2.1.198 终于把 auto-PR 加进来。

Sonnet 5 + 1M 上下文:Claude Code 的底座升级

值得在 2.1.198 报道里点一笔的背景:同一天,Anthropic 还在别的产品线推送 Sonnet 5 与 1M token 上下文,而 2.1.197 把 Sonnet 5 设为 Claude Code 的默认模型。Sonnet 5 引入 1M token 原生上下文(对应 Claude Code 的 /model 面板里会出现 1M 选项),introductory 定价 $2/$10 per Mtok 至 8 月 31 日,之后调为 $3/$15 per Mtok(对比 Opus 4.8 仍为 $5/$25)。CHANGELOG 原文:

Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31

1M 上下文对代码 agent 的意义不止『能装更多代码』:在大型 monorepo 上,整个仓库 + git log + 文档可以一次性塞进上下文,Explore agent 与代码改写类 agent 不再需要频繁 compact 或分片读取;长 PR review 一次性喂给 Sonnet 5,人类 reviewer 与 agent 拿到的是同一份完整视图。LMArena 在 6-30 同步推送的 Agent Arena 上,Fable 5 重回 #1;Claude Science(7-02 上线)则把同一思路——长上下文 + 多 agent 编排 + specialist 衍生——搬进 science workbench。

把 2.1.198 的 auto-PR 与 1M 上下文叠加,Claude Code 现在的形状是:Sonnet 5 默认 + 1M 上下文 + background agents auto-PR + Chrome GA + Explore 子代理模型继承——一个企业级 dev tools 栈,把 Sonnet 5 装进了开发者每天打开 8 小时的工作流。

暗线:从『医生式』到『流行病学』的工程范式

把 2.1.198 放回一周内的事件脉络,会发现多个产品线在同步推进同一思路:

日期	事件	共同信号
2026-06-30	OpenAI 发布《Core dump epidemiology》	把『开发者盯屏幕看错误』转为『后台系统自动聚类』
2026-07-01	Claude Fable 5 全球恢复 + Sonnet 5 上线	模型 + safeguard + 商业恢复并行
2026-07-01	Claude Code 2.1.197(Sonnet 5 默认 + 1M context)	把 Sonnet 5 装入开发者工具
2026-07-02	Claude Code 2.1.198(Chrome GA + 后台 agent 自动 PR + Explore 模型继承)	把『agent 自交付』搬进默认行为
2026-07-02	Claude Science beta 上线(接 NVIDIA BioNeMo)	进入 science AI workbench 市场

OpenAI 6-30 那篇工程博客讲的是 Rockset 团队怎么用『流行病学方法』定位 GNU libunwind 18 年历史的 race condition——竞态窗口只有一条指令宽(约 100 皮秒),传统『医生模式』单 case 调试根本捕捉不到,必须靠全量 core dump 按节点/时间/区域聚类。Anthropic 在自家 dev tools 上做的事,正是同一思路的产品化:agent 不再需要开发者像医生问诊一样盯着,而是像流行病学家一样,在后台持续观测、自动汇总异常、产出可消费的 PR。

具体到 Claude Code,这条思路的载体有三个:Notification hook 在 agent_needs_input / agent_completed 时把后台 agent 状态广播出去,企业 Slack / PagerDuty / Lark 机器人可以订阅;claude agents --json 输出 state: working/blocked/done/failed/stopped + waitingFor 字段,运维脚本可以按状态聚类;PR 列的颜色编码把『哪些 PR 需要人类关注』压缩成一个视觉信号。整套机制是把『异常 → 聚类 → 消费』的流行病学流水线搬进了开发者终端。

这跟传统 IDE 的『live debug』哲学相反。传统 IDE 假定开发者会盯着断点和栈;新的 agent 范式假定开发者只关心最终 PR 颜色。Devin、Cognition、GitHub Copilot Coding Agent 都走过这条路;Claude Code 2.1.198 的差异在于把这条路折叠进开发者已经在用的 CLI 节奏——企业不需要为『AI agent 自交付』重新采购 SaaS,而是升级 Claude Code 版本就拿到了。对 GitHub Copilot Coding Agent 来说,这意味着 2.1.198 之后的 Claude Code 用户多了一个不切换 IDE 就能跑 agent 自交付的选项;对 Devin 这类独立 SaaS 来说,Claude Code 把 agent 自交付内化到『开发者已经在的工作流』,Devin 的『独立 SaaS 体验』优势被稀释。

早报观点

从产品史的角度看,Claude Code 2.1.198 是 Anthropic 把『agent 不需要被监督』从口号落实到 CLI 默认行为的标志性版本。三条判断:

第一,Chrome GA 是 Anthropic 在 IDE 之外补『dev/web』交界面。 这不是简单的『再加一个集成』。Chrome/Edge 跑在每个工程师桌面上,复用浏览器登录态后,Anthropic 实际上把 web 应用从『需要 MCP 写 wrapper』的间接层降级为『浏览器已开,直接控制』的零摩擦层。这条路上 Anthropic 的对手不是 JetBrains、不是 Cursor,而是 OpenAI 的 ChatGPT Atlas、Perplexity 的 Comet——AI-native browser。Anthropic 走的是相对轻的扩展路径(extension + native messaging host),不是重做一个浏览器,这是工程上更稳的选择,但品牌曝光度不及 Atlas/Comet。

第二,auto-PR 是开发者工作流最实质的范式切换。 表面上 PR 列颜色只是 UI 改动,实质上是把『开发者从『盯 agent 跑』切换为『看 PR 颜色变绿』』。这要求人类 reviewer 重新校准预期:过去 review 同事的 PR,现在 review agent 的 PR——后者可能在 syntax、命名、test coverage 上更工整,但在 architecture intent、边界 case 的工程判断上需要 reviewer 主动追问。Anthropic 把『agent 能交活』这件事从概念落到了开发者每天会扫的视觉信号。

第三,Explore agent 模型继承是一道暗线。 子代理质量门统一上调,意味着 Anthropic 在『小模型省 token』与『大模型拿质量』之间明确选了后者。这条决策在 Sonnet 5 价格(促销 $2/$10 per Mtok)已经下行之后成立,但对用 Opus 跑 Explore 的用户来说,token 成本会显著上升。这是开发者要在配置层面重新做的一笔账。

反面 caveat 三条:Chrome GA 的硬约束(Brave/Arc/WSL/第三方 provider 不支持)会让企业落地分两阶段——先在 Anthropic 直连账号上全量铺,再跟 Bedrock/Vertex 团队谈判是否独立支持。auto-PR 的边界条件(worktree.bgIsolation=none 时不适用)也会让一线的 hotfix 场景继续走人工 commit 路径。最后,Explore 模型继承的成本弹性目前是『黑盒』,Anthropic 没给企业一个明确的 token 预算工具——这是后续 1-2 个小版本里大概率会补的东西。

接下来看什么

PR 列颜色的真实分布:Anthropic 是否会公开 Background agents auto-PR 的人类 review 通过率与合并率?若 PR 列大量停在黄色,意味着 agent 写的代码 review 通过率偏低,工程团队需要重新校准 dispatch 粒度。
Explore agent 在大型 monorepo 上的 token 弹性:Haiku → Sonnet/Opus 的成本弹性需要 Anthropic 与企业客户共同披露;建议在自家 monorepo 上做 A/B(用 2.1.197 vs 2.1.198 跑同一批 dispatch prompt,对比 token 与 PR 合并率)。
Chrome 集成的第三方 provider 解禁时间表:Bedrock/Vertex/Foundry 用户的硬约束何时松动;这条直接决定 Anthropic 在企业 dev tools 市场的渗透速度。
anthropicAws Gateway 上游的 failover 行为:model-not-found 触发链式 fallback 时,会不会把账号/region 配置错误『静默掩盖』——failover chain 是好用,但也可能成为排查难题。
Background agents 在 Windows / WSL 上的稳定性:2.1.195 文档把 Windows in-flight work 携带写明,但 hot-reload / restart 路径尚未在大规模企业用户中跑过;关注 2.1.199/2.1.200 是否有针对 Windows 的二次硬化。
/dataviz skill 的扩散路径:自带可运行调色板验证器是个有意思的工程实践,看是否会被吸收进 Claude.ai 通用工具栈——如果吸收,意味着 Claude Code 既是 dev tools,也是 IDE 的试验田。

附:2.1.198 完整 32 项变更清单(原文摘要)

New features(8 项)

Claude in Chrome 由 beta → GA
Background agent 通知:claude agents 中需要输入或完成的任务触发 Notification hook(agent_needs_input / agent_completed)
新增 /dataviz skill(图表 / dashboard 设计指引 + 可运行调色板验证器)
Gateway 新增 Claude Platform on AWS(anthropicAws)上游;model-not-found 推进 failover chain
Background agents 从 claude agents 启动后,在 worktree 完成代码即 commit + push + 开 draft PR
内置 Explore agent 改为继承主会话模型(opus 封顶),不再跑在 Haiku
Subagents + context compaction 继承主会话 extended thinking 配置
Mac over SSH 时键盘快捷键提示用 opt/cmd 而非 alt/super

Fixes(17 项,节选)

网络瞬断(E.g. ECONNRESET)现在带 backoff 重试,不再 abort 当次 turn
后台分类器对同一网络主机的重复访问不再触发重复请求
后台任务(web/desktop/VS Code)在完成或 resume 后不再卡在『Running』
Agent teams:队友在 API error 后向 lead 上报『failed』;对 stuck 队友发消息可立即唤醒重试
/diff 面板在 session 外切换分支 / commit 后不再不刷新
Markdown 表格在全屏模式下不再溢出右侧边框
macOS 后台 agent 访问内网主机不再被『no route to host』拦截(Local Network entitlement 已声明)
/desktop 进入并退出 worktree 后不再报『Cannot determine working directory』
macOS 后台 agent view 打开时不再每 ~52 秒弹『Reconnecting…』
claude attach <id> 中按 ← 不再误退到 shell,而是打开 agent view
claude --bg 与 --print/-p 冲突时前置拒绝,不再静默建出无法 attach 的 session
.claude/rules/ 条件规则在符号链接路径上不再不加载
macOS Warp 全屏模式下 Cmd+click 不再打不开 URL
全屏模式双击单词选词现在包含 scheme 完整 URL
Plan mode 启动时不再不自动允许只读 tool
/branch 默认 fork 名取自首条真实 prompt 而非 compaction summary
Claude Platform on AWS / Mantle STS token 过期不再死锁到『Please run /login』(awsAuthRefresh 自动触发)

Improvements(6 项,含 1 项 Removed)

Focus mode 改进:subagent 出现在活动 summary,完成的后台通知合并成单一计数
代码块 / diff / 文件预览的语法高亮升级到 highlight.js 11
API retry UX:第二次失败时显示具体错误原因;API 过载时 spinner 提示换成 status page 链接
/login 在 claude agents view 里直接打开登录对话框
Subagents 视上游 agent 的消息为普通任务指令;agent 消息仍不会被当作 user 批准
移除 /agents 向导:改为直接对话或编辑 .claude/agents/

Claim Audit

Claude Code 2.1.198 是 Anthropic 把『agent 自交付』从概念落到 CLI 默认行为的标志性版本

置信度：high

CHANGELOG.md 2.1.198 原文『Background agents launched from claude agents now commit, push, and open a draft PR when they finish code work in a worktree, instead of stopping to ask』
agent-view 文档单独设计了 PR 列(黄/绿/紫/灰)作为终端用户的接入点,文档原话『For most tasks this column is where you pick up the result』

auto-PR 仅在 worktree 内的工作适用;若设置 worktree.bgIsolation=none,文档明确不自动开 PR

Claude in Chrome 的 GA 把『浏览器内会话与 agents』直接对接 CLI,实际把 Anthropic 从 dev tools 推到了 dev/web 交界面

置信度：high

CHANGELOG.md 2.1.198 单独列出『Claude in Chrome is now generally available』
chrome 文档列出 8 类浏览器内任务能力(实时调试、设计验证、Web 应用测试、登录态应用、数据提取、任务自动化、会话录制、多站点 workflow)

仅支持 Google Chrome / Microsoft Edge,不支持 Brave/Arc/其他 Chromium 浏览器;WSL 暂不支持;Bedrock/Vertex/Foundry 第三方 provider 也无法使用

Explore agent 改用主会话模型而非 Haiku,是 Anthropic 在 2.1.198 释放的隐藏信号——子代理的质量门正在上调

置信度：medium

CHANGELOG.md 2.1.198『The built-in Explore agent now inherits the main session's model (capped at opus) instead of running on haiku』
同期『Subagents and context compaction now inherit the session's extended thinking configuration, improving output quality on delegated tasks』

文档未给出成本/延迟对比,模型继承会带来 token 成本上升;Anthropic 把探索类子代理的成本/质量 tradeoff 选边为『质量优先』

Gateway 新增 Claude Platform on AWS(anthropicAws),意味着 Anthropic 在云上把『model-not-found 走 failover chain』视为一等公民

置信度：high

CHANGELOG.md 2.1.198『Gateway: added Claude Platform on AWS (anthropicAws) as an upstream provider; model-not-found responses now advance the failover chain』

failover chain 行为需配合企业 gateway 部署才能看到效果,个人用户不可观察

Timeline

2026-06-30

OpenAI 发布工程博客《Core dump epidemiology》,提出『全量 core dump 自动聚类 > 单 case 调试』范式——把『开发者盯屏幕看错误』转为『后台系统自动聚类』

2026-07-01

Claude Fable 5 全球恢复可用(Anthropic 与 Glasswing 伙伴起草 jailbreak 严重性框架);同日 LMArena 把 Fable 5 加回 Agent Arena

2026-07-01

Claude Code 2.1.197 发布,Sonnet 5 设为默认模型,首推 1M-token 上下文,promotional pricing $2/$10 per Mtok 至 8/31

2026-07-02

Claude Code 2.1.198 发布,32 项 CLI 变更,三大功能更新:Chrome GA、Background agents 自动 PR、Explore agent 模型继承

2026-07-02

Claude Science beta 上线,Anthropic 进入 science AI workbench 市场(NVIDIA BioNeMo Evo 2/Boltz-2/OpenFold 3 集成)

Sources

official · Claude Code GitHub CHANGELOG.md(raw) 2.1.198 及前后 50+ 个小版本的完整 release notes;官方一手信源,版本号、行为变更、定价一律以此为准 official · code.claude.com docs: agent-view Background agents 工作流、worktree 隔离规则、PR 列颜色编码、agent view 13 项键盘快捷键、supervisor 进程模型、版本演进历史表 official · code.claude.com docs: chrome Claude in Chrome 能力清单(8 类浏览器内任务)、浏览器兼容性矩阵、权限边界、调试流程、第三方 provider 限制 official · code.claude.com docs: tools-reference Grep 工具基于 ripgrep 的实现细节、Glob 默认不读 .gitignore 的行为差异、Read offset/limit 语义、agent view 工具行为 primary · OpenAI Engineering: Core dump epidemiology 把 Anthropic 2.1.198 放进『agent 自交付 = 流行病学调试』的行业脉络;OpenAI 的范式切换叙事作为对照 community · ClaudeCodeLog X(Claude Code 完整 changelog 跟踪) 作为独立 changelog 跟踪源核验 32 项变更计数;但本文核心事实以 GitHub CHANGELOG 为准

Watch Next

Background agents 自动开 draft PR 的实际合并率:看 PR 列颜色(黄→绿)与人类 review 之间的实际耗时;若 PR 列大量停在黄色,说明 auto-agent 写的代码 review 通过率偏低
Explore agent 模型继承后,Explore 子代理在大型 monorepo 上的 token 消耗占比变化:Haiku → Sonnet/Opus 的成本弹性需要 Anthropic 与企业客户共同披露
Claude in Chrome GA 后第三方 provider(Bedrock/Vertex/Foundry)是否放开:目前文档明确『not available through third-party providers』,这是企业落地的硬约束
Gateway anthropicAws provider 的 model-not-found failover 在生产环境的实际触发率,以及 failover chain 是否会掩盖账号/region 配置错误
/dataviz skill 后续是否进入 Claude.ai 通用工具栈;目前仅在 Claude Code CLI 出现,色板 validator 是 dataviz skill 一次有意思的工程实践

待解问题

auto-PR 的边界条件:在 worktree 之外的开发分支(如 production hotfix)agent 是否仍然自动开 PR?文档说跳过 worktree 时不走隔离,但 PR 自动化是否同步跳过?文档未明示
subagent 模型继承在 opusplan / 1M context / thinking disabled 三种状态下的实际行为是否一致?CHANGELOG 只说『继承主会话模型』,未给细分边界
Chrome GA 之后,Anthropic 是否会把『browser agents』产品线独立化,与 OpenAI 的 ChatGPT Atlas、Perplexity Comet 形成直接竞争?目前仍以 Chrome extension 形态存在
Background agents 在 Windows / WSL 上的稳定性:2.1.195 文档写明 Windows in-flight work 自此携带,但 hot-reload / restart 路径尚未在大规模企业用户中跑过