Topic Timeline

#上下文管理

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

研究论文 2026-06-24 · 周三 重要度 3/5

MemGUI-Agent:把「管理上下文」做成一等动作,治长程手机 GUI agent 的健忘

针对 ReAct 式提示在长程手机 GUI 任务里被动堆历史、导致 prompt 爆炸又稀释关键跨 app 事实的问题,MemGUI-Agent 提出 Context-as-Action(ConAct):让同一个策略既选 UI 动作、也主动发出『折叠动作历史/折叠 UI 状态/保留近期步骤』三类结构化上下文管理动作。配套 2956 条轨迹数据集 MemGUI-3K,训出的 8B 模型拿到 MemGUI-Bench 最佳开源数据成绩,并泛化到分布外的 MobileWorld。

这条思路的聪明之处在于把『记什么、扔什么』从外挂的记忆模块变成策略自己学的动作——上下文管理和 UI 操作同源同策略,模型在『点哪个按钮』和『该记住哪个事实』之间统一决策。它点中了长程 agent 的真实痛点:失败往往不是不会操作,而是走到第 30 步时忘了第 3 步填的关键信息。8B 拿到最佳开源数据成绩 + 泛化到 OOD 基准,说明『主动压缩上下文』比『被动追加历史』更可学、更省 token。但它仍是『最佳开源数据 8B』这个限定赛道,与闭源大模型的绝对差距未在此口径体现。