Topic Timeline

#GLM

这个主题在过往早报中的出现记录。深度条目直达研究报告，其余条目回到当日 edition。

模型发布 2026-06-27 · 周六深度报告 →

智谱 GLM-5.2 开源登顶 Code Arena,距 Claude Opus 4.8 不到 1%

智谱 AI 开源 GLM-5.2(Max),7440 亿参数、100 万 token 上下文、MIT 协议,在 Code Arena 前端赛道排第 2、仅次 Fable 5,击败全部 Claude Opus 变体(含 4.8/4.7 Thinking),距 Claude Opus 4.8 不到 1%、软件工程基准击败 GPT-5.5,API 比同等性能美国模型便宜 85%。All In 节目估计中国模型技术落后约 9 个月、芯片落后约 24 个月,但已用华为昇腾完成 GLM5 家族训练。

产品上新 2026-06-26 · 周五

NVIDIA/vLLM 发布 GLM-5.2 NVFP4 量化版,一行命令本地起服务

NVIDIA 与 vLLM 官方发布 GLM-5.2 的 NVFP4 4-bit 量化 checkpoint,`vllm serve nvidia/GLM-5.2-NVFP4` 即可起 OpenAI 兼容 API;针对 Blackwell 大幅削减 VRAM,且在推理/编码/1M 上下文上对精度持平。GLM-5.2 为 753B 参数 MoE,擅长 agentic 负载。

NVFP4 让 753B 级开源模型在单机 Blackwell 上零云成本跑 agentic 负载成为现实,是开源权重"可用性"的一次实质跃迁。但它也暴露矛盾:开源模型要靠 NVIDIA 官方量化才好用,硬件生态话语权仍握在闭源一方。对照 Mollick"终端用户只想要大牌"的观察,本地自托管仍是少数硬核团队的游戏。

模型发布 2026-06-22 · 周一重要度 4/5 深度报告 →

智谱 GLM-5.2 开源压成本:753B MoE、MIT 许可,自报 SWE-bench Pro 62.1

智谱(Z.ai)于 6 月 13 日发布开源 GLM-5.2:753B 参数 MoE(约 40B 激活)、MIT 许可、1M 上下文。官方自报 SWE-bench Pro 62.1(vs GLM-5.1 的 58.4)、Terminal-Bench 2.1 约 81.0,API 价约 $1.40/M 输入、$4.40/M 输出,折合约 GPT-5.5 的六分之一。本地部署据称需至少 8 张 H100(FP8)。

开源前沿模型『以价换量』的主线在 6 月持续:MIT 许可移除法律门槛,价格再压一个数量级,把推理成本压力直接传导给闭源厂商。但要冷静看待——这些 benchmark 是厂商自报,各源对 Terminal-Bench 口径已出现分歧(81.0 vs 62/63.5),且本地跑满需 8×H100,真正的门槛从『许可』转向『算力』。对多数团队,现实路径仍是调 API 而非自托管。等第三方独立复现再下结论。