Topic Timeline

#记忆系统

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

研究论文 2026-06-24 · 周三 重要度 4/5 深度报告 →

Execute-Distill-Verify:破解 agent 经验学习的「自我确认陷阱」

一篇新论文指出 agent 经验学习的核心失效模式——同一个 agent 既执行又评估,会把「错误但自洽」的轨迹当成有效经验写入记忆并越用越偏。EDV 用异构 agent 并行探索、第三方蒸馏、执行组共识校验三阶段解耦,τ²-bench 均分 Pass@1 86.6(对比 Router 83.5),且较 ReasoningBank 省 24.5% token。