TAG
#DeepSeek
2 条相关内容
研究论文 2026-06-27 深度 →
DeepSeek DSpark 投机解码无损提速 60-85%,DeepSpec 全栈开源
DeepSeek 联合北大发布投机采样加速框架 DSpark 并开源全栈代码库 DeepSpec,已部署于 DeepSeek-V4 线上业务。无损前提下 Flash 版单用户生成提速 60-85%、Pro 版 57-78%,超越原 MTP-1 基线;DSpark 用 DFlash 并行主干网生成隐藏状态+轻量马尔可夫头注入相邻词关联,置信度预测头与后验校准避免高并发下吞吐崩溃。DeepSpec 内置支持 Qwen3、Gemma 等,提供从训练草稿模型到基准评估的完整 Python 工具链。HN 热度 714、293 评论。
研究论文 2026-06-26 深度 →
DeepSeek DSpark 投机解码上线 V4,推理再提速 80%
DeepSeek 发布投机解码框架 DSpark(《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》),称推理速度提升 80%,且已部署到 DeepSeek-V4 Flash 与 Pro 的真实线上流量。论文登上 HN(598 分/228 评论)。延续 DeepSeek 一贯"把推理成本往下打"的路线,与同期 HF 上 JetSpec(并行树草稿打破投机解码扩展上限)等工作形成呼应,共同把推理效率推向新前沿。