您的当前位置:首页 > 时尚 > DeepSeek最新论文:如何让大模型跑得更快?梁文锋署名 正文
时间:2026-06-29 13:31:45 来源:网络整理 编辑:时尚
当行业焦点仍停留在“谁的模型更聪明”时,DeepSeek已将目光转向更具现实意义的命题:如何让模型运行得更快。6月27日,DeepSeek在GitHub低调更新了一篇最新技术论文,正式介绍其推理加速框
当行业焦点仍停留在“谁的最新模型更聪明”时,DeepSeek已将目光转向更具现实意义的论文命题:如何让模型运行得更快。
6月27日,何让DeepSeek在GitHub低调更新了一篇最新技术论文,大模得更正式介绍其推理加速框架 DSpark。型跑该框架旨在突破大语言模型在高并发场景下的快梁推理效率瓶颈。
从作者署名来看,文锋该成果由 DeepSeek与 北京大学联合发布,署名DeepSeek创始人 梁文锋赫然在列。最新论文不仅开源了DSpark模型权重,论文还同步发布了面向推测解码、何让由算法驱动的大模得更训练代码仓库 DeepSpec。

DeepSeek最新论文截图
此次发布延续了DeepSeek一贯的型跑“硬核技术派”风格,论文标题《DSpark:基于置信度调度的快梁半自回归生成推测解码》(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)虽显晦涩,却直指核心痛点。文锋
论文首先剖析了大语言模型(LLM)的核心性能瓶颈。传统LLM采用自回归方式生成文本,即每一个新词元(token)的生成,都需基于所有前置词元完成一次完整的前向传播。这种机制导致:
* 输出越长,等待越久;
* GPU利用率低下;
* 用户等待时间过长。
这在实时对话助手、多轮智能体工作流等对低时延敏感的场景中尤为突出。
目前主流解决方案主要分为两条路线:
1. 自回归草稿模型(如Eagle3)
2. 并行草稿模型(如DFlash)
然而,现有方案均存在生成质量瓶颈、系统效率瓶颈,且普遍缺乏负载自适应校验机制。
针对上述缺陷,DeepSeek提出了 DSpark推测解码框架。该框架采用半自回归架构,通过两套互补机制,巧妙解决了草稿生成与校验环节之间的权衡矛盾,将高吞吐并行生成与自适应负载感知校验机制融为一体。
根据论文披露的受控离线基准测试数据(涵盖数学推理、代码生成、日常闲聊三类任务),DSpark框架相较于自回归草稿模型与并行草稿模型,在单轮平均可接受词元长度上实现了大幅提升。
1. 在线服务实测(DeepSeek-V4)
DeepSeek已将DSpark部署至DeepSeek-V4在线服务系统,基于真实用户流量评估其实际性能。结果显示,在相同吞吐量条件下,相较于现有生产环境基线系统 MTP-1,DSpark将用户端生成速度提升了60%-85%。
2. 跨模型通用性验证
此外,团队将该框架部署于阿里通义千问(Qwen3)系列模型(4B、8B、14B)上,验证了其通用性:
* 对比自回归草稿模型:Qwen3-4B、8B、14B的单轮可接受词元长度分别提升 30.9%、26.7%、30%。
* 对比并行草稿模型:上述模型分别提升 16.3%、18.4%、18.3%。
从技术视角看,这篇论文的核心价值在于通过算法创新显著提升了模型的推理生成速度。在大模型行业逐渐走向落地应用的当下,“更便宜、更快速”的输出能力已成为关键竞争力。
同时,DeepSeek通过全面开源,再次推动了社区发展。社交平台上的开发者评价道:“AI Infra再次被DeepSeek加速了。”
也有用户指出,DeepSeek最令人钦佩之处在于其模型迭代与推理基础设施的同步更新:在发布V4时,不仅提供了论文和代码,还验证了跨模型的通用性。
尽管近期融资消息不断,未来可能面临商业化压力,但通过此次开源,DeepSeek似乎在向业界证明:它仍坚持着开源的初心。
东鹏饮料紧急辟谣,所谓饭局视频为凭空捏造!公司市值一周蒸发超70亿元,张雪发声2026-06-29 13:28
张雪峰刚走20天,昔日爱将自曝离职,多条回复言论令人浮想联翩2026-06-29 13:10
“汕头首富”被造“我不喝”谣言,东鹏饮料跌没了70亿!2026-06-29 13:00
克而瑞好房点评网 | 交投·和顺江湾轨道交通与通勤便利深度解读:地铁2号线坛泽站步行即达,通勤效率南宁刚需盘TOP12026-06-29 12:49
谁能不想求一个孟子义同款事业运!2026-06-29 12:15
过期一天就绝对不能碰的10种危险食物,第一名你可能经常舍不得扔2026-06-29 11:47
600万预算在丰台能买多大?揭秘中建·方程国贤府的“空间魔法”与户型真相2026-06-29 11:33
《昨夜将至》大结局,对坏人的纵容,就是对好人的不公2026-06-29 11:16
武汉萝卜快跑涨价,基本与网约车持平?我们测了一下2026-06-29 11:02
德国豪华酒店新剧曝光:精英学院藏着秘密,这群年轻主演要火了2026-06-29 10:48
奔驰纯电GLC下月上市,预售34.9万,瞄准宝马iX32026-06-29 13:14
韩红被网暴,极端情绪正在吞噬电影圈2026-06-29 13:01
上新|| 被你们问了800遍的裙子,链接来了2026-06-29 12:43
人眼如何分清红绿灯?《科学》连发3篇论文揭开秘密2026-06-29 12:42
古尔曼:预计苹果今年发布搭载M5 Ultra芯片的Mac Studio2026-06-29 12:22
日本海上空!解放军轰-6k与俄图-95同框!2026-06-29 11:42
为什么艺人失业,都去演话剧了?2026-06-29 11:40
委内瑞拉进入紧急状态 首都主要国际机场关闭2026-06-29 11:32
将挑战巴西!57岁森保一:你们总嘲笑我们目标夺冠 但我们是认真的2026-06-29 11:13
红星观察|小组赛场均近3球,世界杯用球“三重浪”特殊设计成部分门将噩梦,名帅称其“快得像炮弹”2026-06-29 11:00