ニュース
DeepSeek 联合北大开源推测解码加速框架 DSpark
DeepSeek 与北京大学联合推出大模型推理加速框架 DSpark,已进入 DeepSeek-V4 系列生产系统。在总吞吐不变的情况下,DeepSeek-V4-Flash 单用户生成速度提升 60%–85%,DeepSeek-V4-Pro 提升 57%–78%。DSpark 采用半自回归架构与置信度调度验证机制,兼顾草稿生成速度与连贯性,能根据系统负载动态调整验证长度。
DeepSeek 与北京大学联合推出大模型推理加速框架 DSpark,已进入 DeepSeek-V4 系列生产系统。在总吞吐不变的情况下,DeepSeek-V4-Flash 单用户生成速度提升 60%–85%,DeepSeek-V4-Pro 提升 57%–78%。DSpark 采用半自回归架构与置信度调度验证机制,兼顾草稿生成速度与连贯性,能根据系统负载动态调整验证长度。