Topic Timeline

#推理加速

这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。

研究论文 2026-06-28 · 周日 重要度 4/5 深度报告 →

DeepSeek 联合北大发布投机解码框架 DSpark,开源全栈代码库 DeepSpec

据 X 用户 @0xLogicrw / @danielhanchen 转述(以官方技术报告为准),DeepSeek 联合北京大学发布投机采样加速框架 DSpark 技术报告,并开源全栈代码库 DeepSpec,DSpark 据称已部署于 DeepSeek-V4 线上业务。转述称在输出无损前提下,Flash 版单用户生成提速 60%-85%、Pro 版 57%-78%,超过原 MTP-1 基线;另一口径(@danielhanchen)称吞吐提升 51%-400%——两套数字差异极大,需以官方报告为准。可独立证实:deepseek-ai/DeepSpec 仓库确已开源(MIT,约 1.8k stars),自述为『训练与评估投机解码算法的全栈代码库』,README 列出 DSpark/DFlash/Eagle3 三种草稿模型,支持 Qwen3 与 Gemma,提供完整 Python 工具链。

研究论文 2026-06-27 · 周六 深度报告 →

DeepSeek DSpark 投机解码无损提速 60-85%,DeepSpec 全栈开源

DeepSeek 联合北大发布投机采样加速框架 DSpark 并开源全栈代码库 DeepSpec,已部署于 DeepSeek-V4 线上业务。无损前提下 Flash 版单用户生成提速 60-85%、Pro 版 57-78%,超越原 MTP-1 基线;DSpark 用 DFlash 并行主干网生成隐藏状态+轻量马尔可夫头注入相邻词关联,置信度预测头与后验校准避免高并发下吞吐崩溃。DeepSpec 内置支持 Qwen3、Gemma 等,提供从训练草稿模型到基准评估的完整 Python 工具链。HN 热度 714、293 评论。