产品上新

Anthropic 推 Claude Tag:把 Agent 搬进 Slack,自家产品团队 65% 代码已由它生成

@Claude 进 Slack 频道做异步团队成员,跑在 Opus 4.8 上;Anthropic 自家 65% 产品代码已由它生成。

2026年6月28日 · 周日 深度报告 高置信 重要度 4/5

6 月 23 日,Anthropic 发布 Claude Tag——一种让团队在 Slack 里与 Claude 协作的新方式。管理员把 Claude 加进选定频道、连上指定的工具、数据与代码库后,频道里任何人 @Claude 用自然语言派活,Claude 会把请求拆成多个阶段、调用可用工具逐步推进,再在 Slack 线程里回复。它运行于 Opus 4.8,今日起对 Claude Enterprise 与 Team 客户 beta 开放,并将替换旧版「Claude in Slack」应用、给管理员 30 天迁移窗口。Anthropic 明确把它定位为「Claude Code 的演进(the beginning of an evolution of Claude Code)」——让模型更主动、更适合团队协作。最抓眼球的一个数字:Anthropic 称其产品团队 65% 的代码已由内部版 Claude Tag 生成,且用途早已超出写代码——还用于追产品指标、处理支持工单、定位 bug 根因。作为横向参照,Google 此前公开的内部 AI 写代码占比是 >30%(2024 年底),微软是 20–30%(2025 年 4 月)。

发生了什么

从「开 IDE / 开聊天框」到「在频道里 @Claude」

Claude Tag 改变的是委派的入口和形态。过去用 Claude Code 是单人在 IDE 或终端里跑 agent,用 claude.ai 是单人在聊天框里一问一答。Claude Tag 把这件事搬进了团队最常待的地方——Slack 频道:管理员先把 Claude 接入工作区、授予频道访问权、连上工具/数据/代码库并设好花费上限,之后频道成员只要 @Claude 派任务,它就拆解、执行、在线程里交付。私聊(DM)则用每个人各自配置的个人工具与连接器,给出私密回复。

这套设计的核心,是把 Claude 从「一个会回答的 bot」变成「一个常驻的团队成员」。Anthropic 用四个特性来概括这一转变:

  • Multiplayer(多人接力)——每个频道一个共享的 Claude,与频道里所有人交互。它的工作过程对所有成员可见,任何人都能接着别人停下的地方继续,而不是各自维护一份私有对话。
  • 随时间学习(learns over time)——Claude 跟踪它所在频道的活动来积累上下文,获得「隐性知识(tacit knowledge)」;在获得授权后还能从其它频道与数据源学习,但不会从私有频道泄露内容(doesn’t report from private channels)。
  • Ambient(主动环境感知)——若开启,Claude 会主动浮现相关信息、并对停滞的线程或未解决的任务做跟进,而不是被动等人召唤。
  • 异步自主(asynchronous)——它在你专注别处时持续工作,可以自行排期并自主推进项目,跨越数小时到数天

治理:管理员手里的四个旋钮

对企业买家而言,能不能放心把 Claude 接进 Slack,关键看治理。Anthropic 这次把治理做成了产品的一等公民,给管理员四类控制:

  1. 按频道配置工具与信息——每个频道里 Claude 能用哪些工具、能看哪些数据,由管理员逐频道定义。
  2. 记忆隔离的多重身份——可为不同用途创建记忆相互隔离的 Claude 身份:记忆「只限定在管理员定义的频道范围内」,比如给销售配的 Claude 不会把它学到的东西共享给工程团队。
  3. 组织级 + 频道级 token 花费上限——既能设整个组织的花费上限,也能设单个频道的上限,双层封顶控成本。
  4. 全量操作日志——可审阅每一个动作的日志,以及每个任务是谁发起的

Anthropic 还给了落地四步:(1) 与 Slack 工作区配对;(2) 授予工具访问;(3) 设月度花费上限;(4) 先在一个私有频道里测试。符合条件的 Enterprise/Team 组织还能拿到一笔引导期赠送额度。

跑在 Opus 4.8 上

Claude Tag 的底层是 Claude Opus 4.8——Anthropic 在 5 月 28 日发布、定价与 Opus 4.7 持平(标准档每百万 token 输入 $5、输出 $25;fast 模式 $10/$50)的旗舰模型。官方称 Opus 4.8 在编码与 agentic 任务上更强,一个被反复强调的指标是:它让「自己写的代码中的缺陷被漏检通过」的概率约为前代的 1/4(4× less likely)。同批发布的还有面向大规模任务、可调度数百个并行 subagent 的 Dynamic workflows 研究预览——这正是 Claude Tag「异步推进数小时至数天」背后的能力来源之一。

关键数据 / 技术细节

Claude Tag 四大特性 vs 旧版「Claude in Slack」——核心区别在于「常驻成员」对「一问一答 bot」:

维度旧版 Claude in SlackClaude Tag
形态单次问答的助手频道内常驻团队成员(multiplayer)
接力各自私有对话工作过程可见,任何人可接力
上下文单次会话内随时间积累隐性知识、跨频道学习(授权后)
主动性被动等召唤ambient 主动推送 + 跟进停滞任务
时长同步、即时异步自主,跨数小时至数天
治理较弱按频道配工具、记忆隔离身份、双层 token 上限、全量日志
迁移替换旧版,管理员 30 天迁移窗口

「AI 写代码占比」横向对照——65% 是 Anthropic 自报、口径未公开,但放在公开披露过同类数字的厂商里,它明显更激进:

公司AI 写代码占比披露时间来源
Anthropic(产品团队)65%2026-06Anthropic 官方博客
Google(新代码)>30%(从 10 月的 25% 升)2024 年底Business Insider 引 Pichai
微软(代码库)20–30%2025-04-29TechCrunch/CNBC 引 Nadella
扩展:Opus 4.8 关键能力与定价(Anthropic 官方)
  • 发布日期:2026-05-28,定位为 Opus 系列升级,「在编码、agentic 任务与专业工作上更强」。
  • 定价(与 4.7 持平):标准档 $5 / 百万输入 token$25 / 百万输出 token;fast 模式 $10 / $50(官方称比更早模型便宜 3×、速度 2.5×)。
  • 代码质量:约 4× less likely 让自写代码的缺陷漏检通过;更倾向于主动标注不确定性、避免无依据断言。
  • agentic:判断更「锐利」、工具调用更省步骤。
  • Dynamic workflows(研究预览):让 Claude Code 调度数百个并行 subagent 做代码库级迁移等大规模任务。
  • Effort control:用户可选 Claude 投入的「努力程度」,默认高 effort。
  • 注:以上为 Anthropic 厂商自报,部分 benchmark 具体分值需查 System Card,本文不展开第三方复现。

为何重要

第一,这是 coding agent 从「单人工具」走向「团队基础设施」的关键一步。 Claude Code 过去的叙事是「程序员的 IDE 副驾」,Claude Tag 则把它推进到「整个团队共享的异步成员」。多人接力、跨频道学习、ambient 跟进——这些都不是为单个开发者设计的,而是为「一个频道、一群人、一串持续数天的任务」设计的。更重要的是,Anthropic 自报的 65% 数据里特意点明:用途已扩展到追指标、处理工单、定位 bug——这等于宣告 Claude Tag 的目标用户不止工程师,而是产品、运营、支持等所有在 Slack 里干活的人。如果说 Claude Code 卖的是「写代码更快」,Claude Tag 卖的是「让 Claude 成为公司里一个不下班、能审计、有预算上限的同事」。

第二,它直接落在 Slack 已经铺好的「Agent 赛道」上,竞争是正面的。 Slack 早在 2026 年 1 月 31 日就宣布把平台「为 Agentic 时代重构」,提供 Agents 工具箱、MCP 集成、开发者沙箱,主页打出「Build on the platform that agents and AI call home」,并直接列出 OpenAI、Claude、Cursor 等 Agent 的 logo。换句话说,Slack 把自己定位成 Agent 的「操作系统」,谁都能进。Anthropic 这次不是开创了一个新场景,而是在一个已经拥挤的入口里抢占企业心智。同一周的信号很能说明问题:OpenAIDevs 宣布 Codex 优化了「从 Codex 复制内容粘贴到 Slack 时完整保留 Markdown 格式」的体验——竞品也在抢同一个 Slack 工作流入口。再叠加 Slack 母公司 Salesforce 自家的 Agentforce,Claude Tag 面对的是 Slack 平台方 + OpenAI + Cursor 的三面夹击。

第三,治理而非能力,可能才是这场竞争的真正胜负手。 大模型的能力差距在收敛,但企业要不要把一个能读代码库、能跨频道学习、能异步自主跑数天的 Agent 放进 Slack,卡点从来不是「它聪明不聪明」,而是「它会不会泄露、会不会失控、花了多少钱、出了事能不能查」。Anthropic 这次把记忆隔离、双层 token 上限、全量操作日志摆在和功能同等的位置,针对的正是企业安全与合规团队的否决权。这是一个成熟的 B 端打法——也是 Anthropic 一贯的「安全即卖点」策略在产品层的延伸。

第四,对开发者与企业买方的影响是分化的。 对开发者,Claude Tag 降低了「召唤 Agent」的门槛——不必切到 IDE,在聊天里 @ 一下就行,且能看到同事和 Claude 的协作过程;但也带来新摩擦:ambient 主动推送如果做不好,频道会变嘈杂。对企业买方,65% 这个数字是强力的销售弹药,但 CIO 会追问口径与可复现性;token 双层上限解决了「失控烧钱」的第一层焦虑,可异步长任务的真实成本仍是未知数。

早报观点

Claude Tag 真正的信号,不在「Slack 里能 @Claude 了」这件功能本身——那只是载体——而在 Anthropic 对 Claude Code 的重新定位。把它从「程序员的 IDE 副驾」改写成「团队里一个能异步干活、可审计、有预算的常驻成员」,等于把 coding agent 的市场从「开发者工具」整个抬进了「企业协作基础设施」。这是一笔更大的生意:开发者工具的天花板是程序员人数,协作基础设施的天花板是「在 Slack 里上班的所有人」。65% 这个数字被放在最显眼处,不是因为它是最硬的技术指标,而是因为它最能讲清这个故事——连 Anthropic 自己的产品团队都已经把它当同事用,且用途早不止写代码。

但要给三组 caveat。其一,65% 是厂商自报、口径不透明。「65% 代码由 AI 生成」按行数、按 commit、按 PR、还是按字符算,差异可以很大;Google 的 >30% 和微软的 20–30% 同样是 CEO 在财报会上的口径,三者未必可比。在 Anthropic 披露统计方法、或有第三方审计之前,这个数字更适合当「方向性信号」而非「精确战报」——它证明 Anthropic 敢吃自己的狗粮,但不证明你的团队也能跑到 65%。其二,异步自主是双刃剑。能跑数小时到数天、能 ambient 主动推送,意味着它在没人盯着时也在花 token、也在改东西。双层花费上限挡住了「烧爆预算」的极端情况,但 swyx 本周那条「评测该按成本($)而非 token 对齐」的提醒恰好点到要害:当 Agent 异步长跑成为常态,真实的成本账要按「每个任务烧多少钱」而不是「单价多便宜」来算,企业很可能在第一个月账单上才学会这堂课。其三,护城河在治理,但治理也最难证明。记忆隔离、操作日志听起来周到,可一旦权限误配,跨频道泄露就是真实风险;这套控制能不能过金融、医疗等强监管行业的合规审计,现在只有 Anthropic 的一面之词,要等企业安全团队和监管实测来背书——尤其在 Fable 5 / Mythos 5 刚因政府指令被暂停访问的当下,监管对前沿模型企业级落地的审视只会更严,不会更松。

一句话:Claude Tag 是一次聪明的产品升维,把 Claude Code 的故事从「写代码」讲成了「当同事」;但它卖的是叙事和治理,真正的能力与成本账,要等 beta 之外的真实企业用过一个季度才见分晓。

接下来看什么

  • 65% 的口径与曲线:Anthropic 是否披露这一比例的统计方法(行/commit/PR),以及它随时间怎么变——这是判断数字含金量的第一关。
  • GA 时间表与跨平台:beta 之后何时 GA、是否扩展到 Slack 以外(Teams、Discord、企业自建 IM);beta 期企业反馈的「接力连贯度」和「ambient 打扰度」。
  • 竞品对位:Slack 自家 Agentforce、OpenAI Codex、Cursor 在「频道内 @ + 异步」上的能力与价格对照——同一周 Codex 已在优化 Slack 粘贴体验,赛道在加速。
  • 异步长任务的真实成本:token 双层上限在「跑了一夜」的场景下是否够用,企业首月账单会不会出现意外——成本而非单价是新战场。
  • 治理的合规验证:记忆隔离与全量日志能否通过强监管行业(金融/医疗)的审计;是否出现权限误配导致的跨频道泄露事件。
  • Opus 4.8 的代码质量在多人异步场景的稳定性:「缺陷漏检约前代 1/4」是在受控环境得出的,无人盯防的频道异步协作下是否依然成立。