产品上新

Hermes Agent v0.18.0「The Judgement Release」:十二天清空 692 个 P0/P1 积压,把『开放权重 + 中立平台』agent 推到产品成熟期

Hermes Agent v0.18.0 单版本清空 692 个 P0/P1,把『自建 agent harness』推过产品成熟期门槛。

2026年7月2日 · 周四深度报告中置信重要度 4/5

#Nous Research #Hermes Agent #The Judgement Release #v0.18.0 #Mixture-of-Agents #agentskills.io #Nous Portal #open-weights #中立平台 #agent observability

Research Pack

核心问题

Nous Research 在 Hermes Agent v0.18.0「The Judgement Release」中,把『12 天清空 692 个 P0/P1』+『MoA 升格为 first-class model』+『reference model 推理实时可见』+『/goal completion contracts + 用量透明化』一次性堆到单版本上,这件事真正在回答什么问题?它是要把 Hermes 推到『生产路径候选』,还是『自建 agent harness 爱好者玩具』与『生产级 agent 平台』之间的临界点?

为什么是现在

过去 6 周 Nous 沿『Surface(6-05 桌面/Web) → Reach(6-19 多平台触达) → Judgement(7-01 可观测性/自验证)』三段节奏把 Hermes 从『自托管 CLI agent』推到『桌面/Web + 多平台 + 自验证 + 可观测』的复合形态。**7-01 早报已报道的『60x 网页抓取 / 1/49 成本 / `/usage` 命令 + 多智能体看板稳定性』是 v0.18.0 Judgement 的外溢指标**——v0.18.0 在同一发布窗口把这些指标变成 feature contract(可观测、可自验、可运维)而不是 demo 数字。同时,Nous Portal 上 Step 3.7 Flash MoE 限时 30 天免费开放,与 Hermes v0.18.0 的『生产路径』叙事形成上下层协同——Hermes 是『自托管运行层』,Nous Portal 是『中立分发层』,两者一起构成『开放权重 + 中立平台』路径的双脚

关键数字

约 1,720 个
v0.18.0 累计 commit 数GitHub releases 页官方数字;意味着单版本一次性合并规模显著高于 v0.17.0(约 1,475)与 v0.16.0(874),是 Hermes 发布史上最大单版本合入量

998 个 PR / 949 个 issue close
v0.18.0 合并 PR 数 / Issue 关闭数GitHub releases 页官方;commit/PR/issue 三件套均明显放大,反映『12 天窗口集中清积压』

496 个 issue / 196 个 PR(100%)
v0.18.0 P0+P1 清零GitHub releases 页官方:『P0 (critical) 3 个 issue + 8 个 PR』+『P1 (high) 493 个 issue + 188 个 PR』;Open P0/P1 计数在 12 天内降至 0;意味着 Hermes 把『修复债清零』作为版本号分代的标志

370+
v0.18.0 贡献者数GitHub releases 页官方;v0.17.0 为 245,意味着 Hermes 社区在两次大版本之间的扩展幅度超 50%

本文要点

从『功能增量 + 多平台触达』到『修复债清零 + 可观测性 + 自验证 + 多智能体可运维』:v0.17.0 Reach 的主轴是『触达面扩张』(iMessage / Raft / Cursor Grok / WhatsApp Business / Telegram Bot 10.1),v0.18.0 Judgement 的主轴是『判定 + 可观测性 + 自验』(MoA first-class / reasoning live / /goal contracts / background fan-out / Scale-to-zero)——这是从『面』到『体』的范式切换
从『reference impl MoA』到『`moa` provider 下的可选模型』:Mixture-of-Agents 不再是 demo 级 reference implementation,而是 Hermes model routing 的一等公民——意味着 MoA 进入了 Hermes 的『生产可调用层』
从『/goal 是状态变化』到『/goal 是带验证证据的契约完成』:`/goal` 在 v0.18.0 引入 completion contracts(PRs #50501/#52285/#55413/#53552),『done』必须由验证证据证明,这是 agent 从『声明式完成任务』走向『可审计完成任务』的语义层重构
从『单一桌面端 UI』到『Desktop Projects(per-profile sidebar + coding rail + review pane + worktree management)』:v0.16.0 Surface 给 Electron 桌面 + Web dashboard admin, v0.18.0 在此之上加 Projects 形态,意味着 Hermes 桌面端从『单人工具』升级为『多 profile 协作终端』
从『用量不可见』到『用量在任意调用点可见』:7-01 早报已报道的 `/usage` 命令 + v0.18.0 的 Cheaper self-improvement(auxiliary model routes post-turn review) + See every model's reasoning live,把『模型调用成本与推理过程』从『开发者查账单』下沉到『agent 运行时自我审计』
从『Hermes 是一家开源 agent 』到『Hermes + Nous Portal 是开放权重 + 中立平台路径的双脚』:Nous Portal 聚合 300+ 模型 + Step 3.7 Flash MoE 限时免费 + Hermes Agent 本地运行,共同把『模型分发』与『agent 运行』解耦——这是 OpenRouter + 本地 agent 的复合形态

Hermes Agent v0.18.0「The Judgement Release」是在 7-01 早报已报道的「网页抓取性能提升 60x / 成本降至 1/49」事件基础上,12 天后的一次集中收口。从数字本身看,这并不是一次普通的迭代:GitHub releases 页口径下,v0.18.0 单版本合并约 1,720 个 commit / 998 个 PR / 949 个 issue close / 370+ 贡献者——比 v0.17.0「Reach Release」(1,475 commit / 245 contributor)与 v0.16.0「Surface Release」(874 commit / 170 contributor)同时高出 50% 以上。更关键的是官方明示的「P0=3 个 issue + 8 个 PR、P1=493 个 issue + 188 个 PR、合计 692 项 100% 解决、Open P0/P1 计数降至 0」——这意味着 Nous 用一次发布把『修复债清零』作为版本号分代的标志。

下面分四个层面拆解这次发布:先把『12 天清零 P0/P1』放到 Hermes 版本演进节奏里看清它不是『小修补』而是『重置』;再拆 v0.18.0 的 12 项核心功能,识别出真正改变 Hermes 形态的三件套(MoA first-class / reasoning live / /goal completion contracts);再把 Hermes 放在「开放权重 + 中立平台」路径上做横向定位;最后给出可验证的跟踪点。

一次『重置』而非『小修补』:从 Reach 到 Judgement 的范式切换

把 Hermes 最近 6 周的版本号摆在一起,可以看出 Nous 在三次发布里换了三个主轴:

版本	代号	日期	主轴
v0.16.0	The Surface Release	2026-06-05	触达形态:Electron 原生 Desktop app + Remote gateway(OAuth/username-password) + 完整 Web dashboard admin panel + 简体中文全翻译 + NVIDIA/skills trusted tap
v0.17.0	The Reach Release	2026-06-19	触达面扩张:iMessage via Photon Spectrum(无需 Mac relay) + Raft agent network adapter + Background/async subagents + Cursor Composer via xAI Grok 200k + Skills Hub 重塑 + WhatsApp Business Cloud API + Telegram Bot 10.1 rich text
v0.18.0	The Judgement Release	2026-07-01	判定与可观测性:MoA first-class + reference model reasoning live + `/goal` completion contracts + `/learn` + `/journey` + background fan-out + Scale-to-zero drain coordination + Google Vertex AI

v0.16.0 Surface 把 Hermes 从『CLI + 单一 Telegram/Discord bot』推到『Electron 桌面 + Web admin』;v0.17.0 Reach 在此基础上把触达面扩到 6+ messaging 平台 + 跨厂商模型(Grok / GPT / Claude) + 自托管外部 agent 协议(Raft);v0.18.0 Judgement 是一次范式切换——它不再追求『更多功能 / 更广触达』,而是回到『让功能可被判定 / 可被观测 / 可被自验 / 可被运维』。这个判断有三个佐证:

第一,/goal 在 v0.18.0 引入 completion contracts(PRs #50501/#52285/#55413/#53552)——『done』必须由验证证据证明,而不是状态变化。在 agent 系统里这是从『声明式完成』走向『可审计完成』的语义层重构:用户不再需要相信 agent 的『已完成』字面,而是看到 evidence。

第二,reference model 推理过程实时可见(PRs #53793/#53855/#55625/#56101):reference model 的输出渲染为带 label 的块,aggregator 流式输出。这是 MoA 真正落地为 first-class model 的必要条件——用户必须能『看见』每路 reference model 在说什么,才能信任 aggregator 的综合判断。

第三,Scale-to-zero & drain coordination(PRs #52243/#52937/#54824)与 Background fan-out(delegate_task, PR #49734)把『多智能体看板运行』从『脚本里硬塞』变成『运行时契约』——gateway quiesces cleanly for restart/migrations,delegate_task 在后台跑多个 subagent 并返回 consolidated results。这两个能力与 7-01 早报中提到的『大规模多智能体看板运行 + 高并发会话稳定性改进』是同一个发布主题。

把三件事放在一起,v0.18.0 的『Judgement』命名就有了具体含义:把『判定权』从『主观判断』推向『证据判定』——验证证据(/goal contracts)、推理过程(reasoning live)、用量与成本(/usage + cheaper self-improvement)。 这三个轴共同回答了一个产品问题:agent 的『结果』如何被相信?

12 项功能拆解:三件套是主菜,其他是配菜

v0.18.0 单版本合入的 12 项主要功能,按『是否改变 Hermes 的产品形态』可以分三档:

第一档(形态级):Mixture-of-Agents 升格为 first-class model(PRs #46081/#53548/#53561)。Hermes 现在把 MoA 暴露为 moa provider 下可选的命名预设——意味着用户可以用一行 hermes model 切到 MoA 组合,而不必自己用 reference implementation 拼装。这把 MoA 从『学术圈的 reference impl』推到『生产可调用层』。Google Vertex AI 接入(PR #56363,Gemini via service account + 自动 OAuth2 token refresh)同属此档——Nous 把 Vertex 加入『中立平台可调用清单』,与 OpenAI / Anthropic / local 模型并列。

第二档(运行时契约级):除上面三件套外,还包括 /learn <anything>(PRs #51506/#52372,从目录/URL/历史工作流提炼 reusable skill)、/journey(PRs #55555/#55859/#55226,可回放的 memory/skill 时间轴)、Desktop Projects(PRs #49037/#54385/#54517,per-profile sidebar + coding rail + review pane + worktree management)、/prompt editor(PR #50509,在 $EDITOR 中编辑多行 prompt)、Cheaper self-improvement(PR #49252,auxiliary model 路由 post-turn review)。这一档的功能是把 Hermes 从『能跑』推向『能生产化』的临界点——它们单看都不算大改,但放在一起意味着 Hermes 在『生产路径』上的硬门槛大部分补齐了。

第三档(运维与边界级):hermes update 命令(7-02 NousResearch 公告原话)、Security hardening round(GitHub release notes 在我抓取时被截断)、7-01 早报已报道的 /usage 命令可在任意调用点查看用量明细(单一 NousResearch 推文披露,GitHub release notes 未显式列入——可能作为 Cheaper self-improvement / Scale-to-zero 的子特性落地)。

值得标注的一个信源缺口:7-01 早报提到的 /usage 命令在 v0.18.0 GitHub release notes 中并未显式出现。NousResearch 6-30 推文预告过此功能,v0.18.0 release notes 中最接近的描述是『Cheaper self-improvement — Auxiliary model routes post-turn review(PR #49252)』与『See every model’s reasoning live』。前者涉及用量与成本的可见性,后者涉及推理过程可见性——两者合并构成了 /usage 的语义内核,但命令本身的存在与归属需 Hermes 官方在 docs / 后续 patch 中明确。这是 v0.18.0 报道里最显眼的单源信源风险,读者应把它作为已知不确定性对待。

横向定位:Hermes 在『开放权重 + 中立平台』路径上的具体位置

把 Hermes Agent 放到当前 agent 生态里看,它的差异化不是『某一个 benchmark 最强』,而是README 自述中的五点定位——这五点放在一起就是『开放权重 + 中立平台』路径的完整定义:

维度	Hermes Agent	典型闭源订阅 agent 框架
学习循环	Built-in 持久化 skill 自创 + 自我改进 + 跨 session recall + Honcho dialectic user modeling	通常仅 session-scoped memory
模型锁定	`hermes model` 一行切换 Nous Portal / OpenRouter / OpenAI / custom(README 称 300+ 模型)	绑定供应商自家模型 API
部署	$5 VPS / Termux 移动 / 本地 laptop / serverless / 原生 Windows;6 terminal backends(local / Docker / SSH / Singularity / Modal / Daytona)	通常云托管或要特定 runtime
触达	单 gateway 到 Telegram / Discord / Slack / WhatsApp / Signal / Email / CLI/TUI	通常 SDK 或仅 Web
开放标准	MIT 许可 + agentskills.io 兼容 + 内置 OpenClaw importer	闭源

把这五点与 v0.18.0 的功能映射起来:『学习循环』对应 /learn <anything> + /journey + cheaper self-improvement;『模型无关』对应 MoA first-class + Google Vertex AI 接入;『部署灵活性』对应 Desktop Projects + Scale-to-zero;『触达面』是 v0.17.0 Reach 已完成的事;『开放标准』由 MIT 许可 + agentskills.io 兼容承接。

在更大的格局里,Hermes 代表的不是『与 Anthropic Sonnet 5 / OpenAI 内部 agent 框架的同台竞争』,而是两种分发哲学的对位:

闭源订阅 + 场景整合(代表:Anthropic Claude Sonnet 5 + Claude Science + 订阅档 + Cyber Verification Program):把 agent 嵌进模型 API + 第三方协作平台(Cursor / Devin / GitHub Copilot)+ 场景工作台(Claude Science),用户付费换取『开箱即用 + 场景整合』。
自托管 MIT + 中立平台(代表:Hermes Agent + Nous Portal + agentskills.io):用户下载 Hermes 部署在自己的 $5 VPS / Modal serverless / 本地,经 Nous Portal 聚合的 300+ 模型与 Step 3.7 Flash MoE 限时免费作为『中立分发层』,agentskills.io 作为『开放 skill 标准』。用户付出运维成本换取『模型无关 + 数据自主 + 平台中立』。

这两条路径不是『同台竞争』,而是『不同预算/合规/数据敏感度下的并存选项』。Hermes 在 v0.18.0 后真正站住了『生产路径候选』门槛——但它的客户画像与 Sonnet 5 + Claude Science 并不重叠太多。真正的胜负在科研向 agent 这个交集:科研用户既敏感于数据自主(倾向 Hermes),又敏感于场景整合(倾向 Claude Science),Anthropic 7-01 发布的 Claude Science 把『60+ 科研连接器 + 60+ skills + NVIDIA BioNeMo Agent Toolkit + 本地/HPC/Modal 算力调度 + reviewer agent 自校』做成一体化入口,这是 Hermes + Nous Portal + agentskills.io 组合需要正面回应的对手戏。

接下来看什么:可验证的跟踪点

把 v0.18.0 的功能点收拢到可验证层,有 6 个跟踪点是未来 30-60 天值得看的:

第一,v0.18.0 12 项新功能在『真实生产工作流』中的回归情况——尤其关注 MoA provider、/goal completion contracts、Scale-to-zero drain coordination 三处。Hermes 在 Discord / GitHub Discussions 给出 early production feedback 时点(预估 7-02 至 7-15 之间),是判断『堆叠风险』是否兑现的关键节点。

第二,/usage 命令的官方归属与文档释出——7-01 早报中提到的『任意调用点查看用量明细』目前仅出现在 NousResearch 推文与早报转述中。v0.18.0 release notes 未显式列入此命令,需 Hermes 在 docs / release notes 后续 patch 中明确归属(独立命令 vs Cheaper self-improvement 的子特性 vs Scale-to-zero 的暴露面)。

第三,MoA 作为 moa provider 的具体模型组合与推荐路径——Hermes 是否在 docs 中给出按『成本 / 智能 / 延迟』分级的 MoA 模板清单,在 300+ 模型上的默认推荐组合是什么。

第四,Nous Portal 中 Step 3.7 Flash MoE 视觉语言模型 30 天限时免费(预计 7-15 结束)结束后的定价——这是『中立平台 + 限时免费』获客模式可持续性的现金流感官信号。Step 3.7 Flash 由 StepFun 提供,Nous Portal 作为中立分发层的实际毛利与转售协议,会影响后续模型接入节奏。

第五,v0.18.0 接入 Google Vertex AI 后,Hermes 是否在 routing 层做『Gemini / OpenAI / Anthropic / local』的智能调度——如果是,这是 MoA 之外的第二条『跨厂商 routing』路径,会让 Hermes 的『中立平台』定位进一步加强。

第六,Hermes Agent 与 Anthropic Claude Science 在『科研向 agent』市场的直接对位——Hermes 是『自托管 MIT + 中立平台』,Claude Science 是『闭源订阅 + 科研场景整合』;两者在科研用户重叠区(数据敏感 + 场景整合需求同时存在)的客户取舍,会决定 2026 H2 这一细分市场的格局。

早报观点

v0.18.0 真正改变了什么:不是『多了一个功能』,而是 Nous 第一次用『修复债清零』作为版本号分代标志,把 Hermes 从『快速迭代 + 缺陷堆积』的早期产品节奏,推向『快速迭代 + 强修复 + 形态固化』并存期。1,720 commit / 998 PR / 692 P0/P1 清零 这组数字的真正含义是:Hermes 社区从 245 贡献者扩到 370+,单版本信息密度大幅提升——但同时也意味着单版本回归测试矩阵被推到 Hermes 史上最大。从工程管理视角,这是一次高风险发布:12 项功能同时合入,加之 Security 段在抓取时被截断,我们无法判断是否有未公开的 breaking changes。

反方 caveat(必读):① 「P0/P1 清零」是仓库层关闭,不是真实用户工作流验证——Hermes 的『生产路径』是否真站住,需 7-02 至 7-15 之间社区回归反馈;② 「/usage 命令」目前是单源(NousResearch 6-30 推文 + 7-01 早报),在 v0.18.0 GitHub release notes 中未被显式列入,信源存在显式缺口——读者应把它视为『预告功能、在 v0.18.0 中以子特性形式落地、未单独成项』,而不是『v0.18.0 的官方主打 feature』;③ MoA 升格为 first-class model 是 model-layer 重构,与 Desktop Projects(UI/UX)、Scale-to-zero(ops)、/goal contracts(语义)三层同时变动,意味着 Hermes 跨层耦合面大幅扩张,短期内的『小版本 hotfix』概率高于平均水平。

对谁有利 / 不利:Hermes Agent v0.18.0 对自建 agent harness 团队最有利——/learn <anything> + /journey + cheaper self-improvement 三件套,把『skill 自创 + 自我改进 + 跨 session recall + Honcho dialectic user modeling』做成可复用范式,自建团队可以拿来作为『Hermes-style learning loop』的参考实现。对『闭源订阅 + 场景整合』路径(Anthropic Sonnet 5 + Claude Science)的直接威胁有限——两者客户画像重叠度不高,真正的胜负在科研向 agent 这个交集。对中立分发层(OpenRouter / Nous Portal 自身)的影响更微妙——Hermes + Nous Portal 是『运行层 + 分发层』的复合形态,与 OpenRouter 单纯做分发形成差异;但 Nous Portal 是否能承接 OpenRouter 的中立分发功能,取决于 Step 3.7 Flash 限时免费结束后的定价与续接模型节奏。

被忽视的点:v0.18.0 的「Scale-to-zero & drain coordination」+「Background fan-out」是同一个发布主题的两个切面——前者解决『多智能体看板停机时的优雅退出』,后者解决『多智能体并发的提交与回收』。这两件事共同把『大规模多智能体看板运行 + 高并发会话』从口号变成可观测的运行时契约——7-01 早报提到的『多智能体看板稳定性改进』在这里有了具体技术映射,而不仅仅是营销表述。这是 v0.18.0 Judgement Release 真正比 v0.17.0 Reach Release 走得更深的地方:Reach 让 Hermes 触达更多人,Judgement 让 Hermes 能承载更多同时在线的多智能体工作流。

Claim Audit

Hermes Agent v0.18.0 用 12 天窗口把 P0+P1 共 692 个高优先级项清零,是 Hermes 发布史上最大单版本修复债清零

置信度：high

GitHub releases 页官方数字:1,720 commit / 998 PR / 949 issue close / 370+ contributor,P0=3 个 issue + 8 个 PR、P1=493 个 issue + 188 个 PR,合计 692 项 100% 解决
对比 v0.17.0(1,475 commit / ~800 PR / 245 contributor)与 v0.16.0(874 commit / 542 PR / 170 contributor),v0.18.0 在贡献者与 PR 数量上同时拉高 50% 以上
v0.18.0 发布代号『Judgement Release』与『done 必须由验证证据证明』(`/goal` completion contracts)的叙事一致——把『判定』从主观改写为证据化

P0/P1 清零是 Nous 自报口径,issue 的『closed』不等于『生产路径验证』;读者应区分『仓库层关闭』与『真实用户工作流验证』

v0.18.0 实质升级集中在『agent 可观测性 + 自验证 + 多智能体可运维』三个轴,`/usage` 命令、reference model 推理可见、Scale-to-zero drain coordination 是同一个主题的不同切面

置信度：medium

GitHub releases 页明示 12 项功能中,与可观测性 / 自验证 / 多智能体可运维直接相关的至少 5 项:`See every model's reasoning live`(PRs #53793/#53855/#55625/#56101)、`Self-verification`(`/goal` completion contracts, PRs #50501/#52285/#55413/#53552)、`Background fan-out`(`delegate_task`, PR #49734)、`Scale-to-zero & drain coordination`(PRs #52243/#52937/#54824)、`Cheaper self-improvement`(auxiliary model 路由 post-turn review, PR #49252)
7-01 早报已报道的 `/usage` 命令在任意调用点查看用量明细(单一 NousResearch 推文披露),与 v0.18.0 的『Cheaper self-improvement + Auxiliary model routes post-turn review』属同一观察——后者把『用量可见性 + 成本优化』下沉到 model routing 层
Background fan-out 的『consolidated results』与 Scale-to-zero 的『gateway quiesces cleanly』,共同把『多智能体看板运行』从『脚本里硬塞』转向『运行时契约』

**官方 GitHub release notes 我在抓取时被截断在 Security 段**——不能排除 release notes 中另有未公开的 `/usage` 命令具体 PR;但无论命令本身是否存在,v0.18.0 的整体方向(可观测性 + 多智能体可运维)是清楚的。另,7-01 早报中提到的 `/usage` 命令在 v0.18.0 release notes 中未被显式列入,可能源于 6-30 推文中预告的功能、在 v0.18.0 中作为子特性落地而未单独成项

Hermes Agent 在『开放权重 + 中立平台』路径上,经 v0.18.0 后正式具备『产品成熟期』门槛特征:多平台触达(6-19 Reach)+ 大规模多智能体可运维(7-01 Judgement)+ 桌面端原生 Electron(6-05 Surface)+ 简体中文翻译

置信度：high

NousResearch README 自述:Hermes Agent 是『唯一的 built-in learning loop』agent,基础设施无关($5 VPS/GPU 集群/serverless)、模型无关(Nous Portal/OpenRouter/OpenAI/custom,300+ 模型)、多平台 gateway(Telegram/Discord/Slack/WhatsApp/Signal/CLI)、MIT 许可、agentskills.io 开放标准兼容
v0.16.0 Surface 提供 Electron 原生 Desktop + 远程 gateway + 完整 web dashboard admin panel + Simplified Chinese 全翻译,意味着桌面端 + Web 端双形态已就位
v0.17.0 Reach 把触达扩展到 iMessage(无需 Mac relay)、Raft agent 网络适配器(作为外部 agent 被调用)、Cursor Composer via xAI Grok 200k context、WhatsApp Business Cloud、Telegram Bot API 10.1 rich text,完成『触达面』覆盖
v0.18.0 Judgement 集中做『判定 + 可观测性 + 自验证 + 多智能体可运维』,这是 agent harness 进入生产路径的硬门槛——『能跑』≠『能生产化』

『产品成熟期』是早报视角的归纳,Nous 官方表述未用此说法;具体阈值(如 SLO/错误预算/客户案例)Nous 未对外披露

Hermes Agent 在 v0.18.0 后,首次出现『OpenAI/Anthropic 闭源订阅』与『自建 MIT 中立平台』两条 agent 路径的明确分工:Hermes 不与 Claude/OpenAI agent 框架争『单一模型最优』,而是用『模型无关 + 300+ 模型 + 学习循环 + 自托管』卡位

置信度：high

README 自述对比表中,Hermes 的差异化维度集中在 learning loop(built-in 持久化 skill 自创 / 自我改进)、模型无关(provider 切换一行命令)、部署($5 VPS / Termux / serverless)、触达(单 gateway 到 6+ messaging 平台)、开放标准(agentskills.io)、迁移(OpenClaw importer)
v0.18.0 的 MoA 升格为 first-class model + `moa` provider,本质是把『多种参考模型协作』做成可路由的模型层,而不是某一家供应商的专属能力
v0.18.0 接入 Google Vertex AI(Gemini via service account + 自动 OAuth2 token refresh, PR #56363),意味着 Nous 主动把 Vertex 加入『中立平台可调用清单』——把 Gemini 与 OpenAI/Anthropic/local 模型并列

『明确分工』是早报视角,Hermes 的『中立平台』定位能否站住脚,取决于 Nous Portal 是否能持续承接 OpenRouter 的『中立分发』功能、是否会被某些模型厂商限制调用

v0.18.0 的『功能大幅堆叠』与『P0/P1 100% 清零』同时出现,意味着 Hermes 进入了『快速迭代 + 强修复』并存期,但同时也面临『新功能落地验证不足』风险

置信度：medium

v0.18.0 单版本合并 12 项重大功能(MoA、reasoning live、/goal contracts、/learn、/journey、background fan-out、Desktop Projects、Scale-to-zero、cheaper self-improvement、/prompt editor、Vertex AI、security),同时 692 个 P0/P1 被清零——单版本信息密度显著高于此前任何版本
MoA 升格为 first-class model 是 model-layer 重构、Desktop Projects 是 UI/UX 重构、Scale-to-zero 是 ops-layer 重构、/goal contracts 是语义层重构——四层同时变动,意味着回归测试矩阵大幅扩张
GitHub release notes 中『Security』段被截断,无法判断安全加固的具体范围与潜在 breaking changes

『堆叠风险』是早报视角的推断;具体回归验证情况需等 Hermes 官方在 Discord / GitHub Discussions 给出早期 production feedback

Timeline

2026-04-23

Hermes Agent v0.11.0 发布(系列起点之一)

2026-04-30

v0.12.0 发布,继续功能演进

2026-05-07

v0.13.0「The Tenacity Release」

2026-05-16

v0.14.0 发布

2026-05-28

v0.15.0「The Velocity Release」

2026-05-29

v0.15.1「The Patch Release」+ v0.15.2 修补版本同日发布

Sources

official · NousResearch GitHub releases 页(v0.18.0 / v0.17.0 / v0.16.0 等) v0.18.0 全部 12 项主要功能的 PR 列表、commit/PR/issue/contributor 数字、P0/P1 清零数据、版本号代号 official · NousResearch 官方 X:Hermes Agent v0.18.0 公告 v0.18.0 发布代号、官方公告原话、hermes update 升级路径 official · NousResearch/hermes-agent README Hermes Agent 产品定位(self-improving / built-in learning loop / 基础设施无关 / 模型无关 / 多平台 gateway / MIT 许可 / agentskills.io 兼容 / OpenClaw migration / 300+ 模型 / $5 VPS 起步 / 6 terminal backends)、与 OpenAI/Anthropic agent 框架的差异化对照 official · NousResearch 官方 X:7-01 网页抓取性能升级(60x / 1/49) Hermes Agent 网页抓取性能提升 60x / 成本 1/49 的来源依据(单一推文,未经第三方复算) secondary · AI 早报 7-01 总览(本地已生成) 7-01 早报对 Hermes Agent 网页抓取 + `/usage` 命令 + Step 3.7 Flash MoE 30 天免费的同期报道,作为 v0.18.0 的前置上下文 official · Hermes Agent v0.17.0 Reach Release / v0.16.0 Surface Release changelog(经 GitHub releases 抓取) 版本演进时间线:Hermes 在 6 周内完成 Surface(桌面/Web) → Reach(多平台触达) → Judgement(可观测性/自验证)三段递进

Watch Next

v0.18.0 12 项新功能在『真实生产工作流』中的回归情况:Hermes 官方在 Discord/GitHub Discussions 给出 early production feedback 时点(预估 7-02 至 7-15 之间),尤其关注 MoA provider、`/goal` completion contracts、Scale-to-zero drain coordination 三处的实际行为
`/usage` 命令的官方 PR / 文档释出:7-01 早报中提到的『任意调用点查看用量明细』目前仅出现在 NousResearch 推文与早报转述中,v0.18.0 release notes 未显式列入,需 Hermes 官方在 docs / release notes 后续 patch 中明确归属
Mixture-of-Agents 作为 `moa` provider 的具体模型组合与推荐路径:Hermes 是否提供『按成本 / 按智能 / 按延迟』的 MoA 模板清单,以及在 300+ 模型清单上的具体推荐组合
`/learn <anything>` 与 agentskills.io 开放标准的耦合程度:从目录/URL/历史工作流提炼 reusable skill 后,这些 skill 是否可直接分享到 agentskills.io 生态,以及 skill 验证机制
Nous Portal 中 Step 3.7 Flash MoE 视觉语言模型 30 天限时免费的结束时间(7-15 前后)与结束后的定价:Hermes Agent 与 Nous Portal 的协同是『中立平台』路径的现金流试验,定价披露是判断路径可持续性的关键变量
Google Vertex AI 接入的实际效果:PR #56363 让 Gemini 通过 service account + 自动 OAuth2 token refresh 接入 Hermes,需独立验证在 Hermes 调度下 Gemini 与 OpenAI/Anthropic/local 模型的混合 routing 是否真正可用
v0.18.0 12 项功能中,Scale-to-zero & drain coordination 对『大规模多智能体看板运行 + 高并发会话』稳定性的具体收益:Nous 未给出数字,需第三方 benchmark
Hermes Agent 与 Anthropic Claude Sonnet 5 + Claude Science 在『科研向 agent』上的对位:Sonnet 5 + Claude Science 是『闭源订阅 + 场景整合』路径,Hermes 是『自建 MIT + 中立平台』路径,两条路径在『科研用户』重叠区的胜负判断
v0.18.0 的 Security 加固段(被截断)与 Mythos 5 出口管制事件后的网络安全态势呼应:Hermes 是否在 v0.18.0 引入了类似 Anthropic 的 safety classifier,以及它对『中立平台』定位的边界影响

待解问题

v0.18.0 release notes 中被截断的『Security』段到底加固了什么?是否存在类似 Anthropic Mythos 5 出口管制事件后的 safety classifier?这是判断 Hermes『中立平台』边界的关键变量
`/usage` 命令在 v0.18.0 release notes 中未被显式列入——它究竟是 v0.18.0 的子特性(隐藏在 Cheaper self-improvement / Scale-to-zero / reasoning live 三处的某一处)还是 7-01 推文预告的独立功能?需 Hermes 官方在 docs / 后续 patch 明确归属
MoA 作为 `moa` provider 的具体模型组合与推荐路径:Hermes 是否提供按『成本 / 智能 / 延迟』的 MoA 模板清单?在 300+ 模型清单上 MoA 的默认推荐组合是什么?
`/learn <anything>` 与 agentskills.io 开放标准的耦合程度:提炼出的 skill 是否可直接 publish 到 agentskills.io 生态?skill 验证机制是人工评审、agent 自评还是社区共识?
v0.18.0 12 项功能同时合入,回归测试矩阵在『多智能体看板 + 大并发会话』下的真实表现:Hermes 官方在 Discord / GitHub Discussions 给出 early production feedback 时,12 项功能中哪几项『被一线用户回滚或暂时禁用』
Nous Portal 中 Step 3.7 Flash MoE 30 天限时免费(预计 7-15 结束)结束后的定价:这是『中立平台 + 限时免费』获客模式是否可持续的现金流感官信号
v0.18.0 接入 Google Vertex AI 后,Hermes 是否会在 routing 层做『Gemini / OpenAI / Anthropic / local』的智能调度?如果是,这是 MoA 之外的第二条『跨厂商 routing』路径,值得追踪
Hermes Agent 在 v0.18.0 后是否会与 Anthropic Claude Sonnet 5 + Claude Science 直接竞争『科研向 agent』市场?两者分别代表『自托管 MIT + 中立平台』与『闭源订阅 + 场景整合』两条路径,在科研用户重叠区的胜负判断