Topic Timeline

#SWE-bench

这个主题在过往早报中的出现记录。深度条目直达研究报告，其余条目回到当日 edition。

模型发布 2026-06-22 · 周一重要度 4/5 深度报告 →

智谱 GLM-5.2 开源压成本:753B MoE、MIT 许可,自报 SWE-bench Pro 62.1

智谱(Z.ai)于 6 月 13 日发布开源 GLM-5.2:753B 参数 MoE(约 40B 激活)、MIT 许可、1M 上下文。官方自报 SWE-bench Pro 62.1(vs GLM-5.1 的 58.4)、Terminal-Bench 2.1 约 81.0,API 价约 $1.40/M 输入、$4.40/M 输出,折合约 GPT-5.5 的六分之一。本地部署据称需至少 8 张 H100(FP8)。

开源前沿模型『以价换量』的主线在 6 月持续:MIT 许可移除法律门槛,价格再压一个数量级,把推理成本压力直接传导给闭源厂商。但要冷静看待——这些 benchmark 是厂商自报,各源对 Terminal-Bench 口径已出现分歧(81.0 vs 62/63.5),且本地跑满需 8×H100,真正的门槛从『许可』转向『算力』。对多数团队,现实路径仍是调 API 而非自托管。等第三方独立复现再下结论。