Topic Timeline

#长程任务

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

研究论文 2026-06-22 · 周一 重要度 3/5

WorldLines:长程具身智能体的状态化记忆基准与 ObsMem 框架

WorldLines(arXiv 2606.18847,HKUST(GZ)/HKUST/Knowin)面向长程家庭具身助理,构造时间跨度长的家庭轨迹(对话、动作、反馈、状态变化),拆为记忆 QA 与具身任务规划两类样本;提出观察者锚定的记忆框架 ObsMem,用事件/状态/信念/承诺四类记忆轨道并区分『观察到』与『被告知』来源。在记忆 QA 上 Judge 0.713、完美率 69%,各维度领先 A-mem/Mem0。

WorldLines 把『智能体记忆』从纯文本 QA 拉进了部分可观测的物理环境——这才是家庭/服务机器人真正面对的难题:世界状态在变、信息有真假来源、旧记忆会过期。ObsMem 的『信念轨道』(fresh/stale/uncertain/contradicted)是个聪明设计,消融显示去掉信念跟踪后隐藏问题得分直接归零。它与 MemSlides、GateMem 同日上榜,坐实了『记忆』是当前 Agent 研究的最大公约数。