Topic Timeline

#测试时扩展

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

研究论文 2026-06-22 · 周一 重要度 3/5

Reflective Masking:用反思式掩码激发掩码扩散模型的推理能力

Reflective Masking(arXiv 2606.16700,14 upvotes,UMD/Virginia Tech 等)提出一种轻量后训练方法,让掩码扩散模型(MDM)按位置做 keep/re-mask/reveal 决策,迭代式局部修订自身输出,实现扩散模型独有的测试时扩展;配合参数无关的 History Reference 维持去噪轨迹状态。覆盖图像编辑、数独纠错与文本推理(数学/代码),约 2 张 H100 训练 5 小时。

这与同日的 PerceptionDLM 互为呼应,共同指向一个判断:2026 年中扩散语言模型正从『能生成』走向『会推理、会改错』。Reflective Masking 把『像人一样迭代局部纠错』变成 MDM 的原生能力,无需改架构、训练成本极低,是 DLM 阵营补齐推理短板的关键一步。值得关注它在代码(MBPP)上增益大于数学(MATH)的现象——说明这类局部修订更适合结构化、可验证的任务。