模型发布 2026-06-26 深度 →
Qwen 开源原生语言世界模型 AgentWorld,宣称超 Opus 4.8
阿里通义千问发布 Qwen-AgentWorld:用单一模型模拟 MCP/Search/Terminal/SWE/Web/OS/Android 共 7 类 agent 环境,把"环境建模"作为从第一天起的训练目标。开源 35B 总参/3B 激活的 MoE(256K 上下文)及 AgentWorldBench,宣称在该榜超 Claude Opus 4.8 与 GPT-5.4;世界模型预热带来跨 7 项基准提升(Terminal-Bench 2.0 +6.3、WideSearch +12.8、Claw-Eval +11.3 等),且无需 agent 专项训练即可零样本迁移。核心范式是"先预测环境、再行动"(predict before you act)。