研究论文 2026-06-26 深度 →
DeepSeek DSpark 投机解码上线 V4,推理再提速 80%
DeepSeek 发布投机解码框架 DSpark(《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》),称推理速度提升 80%,且已部署到 DeepSeek-V4 Flash 与 Pro 的真实线上流量。论文登上 HN(598 分/228 评论)。延续 DeepSeek 一贯"把推理成本往下打"的路线,与同期 HF 上 JetSpec(并行树草稿打破投机解码扩展上限)等工作形成呼应,共同把推理效率推向新前沿。