Topic Timeline

#Program-as-Weights

这个主题在过往早报中的出现记录。深度条目直达研究报告，其余条目回到当日 edition。

研究论文 2026-07-04 · 周六重要度 3/5

arXiv 今日亮点合集:Program-as-Weights 新范式 + 持续态 AI 控制分布式攻击 + SkillCoach 自演化评分 + WorldDirector 世界模拟器——研究层 5 篇交叉印证

arXiv 与 Hugging Face papers 今日出现多篇高价值研究:① Program-as-Weights: A Programming Paradigm for Fuzzy Functions(arXiv 2607.02512,HF 53 分)——将程序作为神经网络权重的新范式,模糊函数(fuzzy functions)可通过程序直接编码为网络权重;② Distributed Attacks in Persistent-State AI Control(arXiv 2607.02514)——持续态 AI 控制系统中的分布式攻击,直接对应 Anthropic Fable 5 cyber safeguards 关注的安全场景;③ SkillCoach: Self-Evolving Rubrics for Evaluating and Enhancing Agentic Skill-Use(arXiv 2607.01874,HF 12 分)——Agent 技能使用的自演化评分方法,与 mattpocockuk 提出的 skill eval 瓶颈直接相关;④ WorldDirector: Building Controllable World Simulators with Persistent Dynamic Memory(arXiv 2607.02517,HF 16 分)——可控世界模拟器 + 持久动态记忆;⑤ EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments(arXiv 2607.02440,HF 39 分)——智能体策略自主进化的交互评测环境;另 AgenticSTS / AgenticDataBench / Multi-Resolution Flow Matching 等亦值得跟踪。

今日研究层呈现三个交叉应证的方向:① Agent 安全:Distributed Attacks in Persistent-State AI Control 与 Anthropic Fable 5 cyber safeguards 同期出现,说明「持续态 AI 控制」是 AI 安全的新前沿——传统 LLM 安全关注单次 prompt-response,但 agent 时代的「持续态 AI」(长时间运行、跨 session 维护状态)引入了全新攻击面;② Agent 评测:SkillCoach(self-evolving rubrics)+ EvoPolicyGym(策略自主进化评测)+ AgenticSTS(有界记忆测试床)+ AgenticDataBench(数据智能体基准)四篇同期出现,说明「Agent 评测」正从单点基准向多维评测矩阵演化,呼应开发者社区的 skill eval 瓶颈讨论;③ 范式突破:Program-as-Weights 提出「程序即权重」的新范式,如果可复现,将挑战传统「权重 = 训练后参数」的基础假设——可能催生可解释性 / 可验证性 / 可组合性更强的神经网络架构。WorldDirector 把「持久动态记忆」引入世界模拟器,与 Anthropic Fable 5 内部 Obsidian 知识图谱 + LangChain OpenWiki 的「agent 持久记忆」方向形成学术与工业的共振。