Topic Timeline

#coding agent

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

产品上新 2026-06-28 · 周日 重要度 2/5

OpenCode v2 发布:TUI / 桌面 / Web 多端共享同一后端,默认全部同步

据作者 @thdxr(推文 3348 赞),OpenCode v2 让 TUI、桌面端和 Web 端的所有实例共享同一个后端,默认全部同步——无论开多少个窗口,资源占用都被压到最低。

这是 coding agent 工具走向『多端一致』的一个务实信号:开发者越来越常在终端、桌面 App 和浏览器之间来回切,各端各跑一份后端既费资源又导致状态不一致。OpenCode v2 把后端单一化、状态默认同步,等于把『一个 agent session』从某个具体窗口里解放出来,成为可以多处接入的共享资源——这和 Claude Tag『一个频道一个共享 Claude、任何人可接力』在理念上同源,都是把 agent 从『单点工具』变成『可共享的常驻服务』。对独立开发者和小团队,这种架构能显著降低多设备协作的摩擦。

产品上新 2026-06-28 · 周日 重要度 2/5

OpenAI Codex 本周体验更新:长线程滚动更顺、复制到 Slack 保留 Markdown

据 @OpenAIDevs / @thsottiaux,Codex 本周落地一批体验改进:超长对话线程滚动更顺滑、浏览时阅读位置不再跳动;线程切换后台开销降低、可加载更深本地历史;从 Codex 复制内容粘贴到 Slack 时完整保留 Markdown(列表/加粗/代码块/链接)、大段粘贴不再卡 UI;新增可悬停的导航栏轮次预览、设置搜索覆盖更多控件,以及一个 Pets 面板。@thsottiaux 推文 1949 赞、@OpenAIDevs 2967 赞。

这批更新看着琐碎,但方向值得注意:OpenAI 在抢 Slack 这个工作流入口——『复制到 Slack 保留 Markdown』和同周 Anthropic Claude Tag 进 Slack 是同一战场的两种打法,一个把 Agent 直接驻进频道,一个优化『从 IDE 到 Slack』的内容流转。当各家旗舰能力差距收敛,产品体验(长线程不卡、粘贴不丢格式)这种『最后一公里』的打磨会越来越成为留住开发者的护城河。Pets 面板这种小彩蛋也透露出 Codex 在往『日常陪伴型工具』而非纯命令行工具演化。

研究论文 2026-06-24 · 周三 重要度 3/5

NatureBench:让 coding agent 去复现 Nature 论文的 SOTA,90 题里只过 17.8%

Frontis.AI 提出跨学科基准 NatureBench,从同行评审的 Nature 系论文蒸馏出 90 个任务,配套 NatureGym 自动构建每题独立容器环境(解决此前『agent 做科研』基准的环境碎片化问题)。在禁联网搜索的严格协议下评测 10 个前沿 agent 配置,最强者在 g>0.1 标准下仅超越 SOTA 17.8% 的任务。

这篇把『agent 能不能做科研』从口号拉回到可量化的冷数据:17.8% 不是失败,而是诚实地标定了当前上限。最有价值的是它对成功/失败路径的解剖——agent 主要靠『方法论翻译』(把科学问题塞进它熟悉的监督预测套路)取得进展,而非真正的科学发明;失败也多来自『选错方法』和『算力预算不足』,而不是『没读懂题』。这等于说明白:今天的 coding agent 是熟练的工程移植工,不是会提新假设的科学家。每题独立容器 + 维护方复现的协议设计,也给『agent on research』这类长期被环境碎片化拖累、可信度存疑的基准立了个更硬的范式。