当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

2个月前 (02-27)Deepseek最新资讯51

  2月27日消息,依旧没等到DeepSeek V4,今天DeepSeek与北京大学、清华大学在ArXiv联合发布了一篇关于全新智能体推理框架DualPath的论文。据了解,该框架旨在解决智能体在长文本推理场景下面临的I/O瓶颈问题,通过优化存储读取路径,显著提升了大规模模型的推理吞吐量deepseek

  据论文介绍,DualPath的核心创新在于改变了传统的“存储至预填充引擎”(Storage-to-Prefill)单路径加载模式,引入了“存储至解码引擎”(Storage-to-Decode)的第二条路径。在现有的预填充-解码分离架构中,存储I/O压力往往集中在预填充引擎上,导致解码引擎的存储带宽闲置,这种不平衡成为了限制系统吞吐量的障碍。DualPath通过利用解码引擎闲置的存储网卡带宽读取缓存,并配合高速计算网络(RDMA)将其传输至预填充引擎,实现了集群存储带宽的全局池化与动态负载均衡。

  在技术实现上,DualPath采用了以计算网卡为中心的流量管理和自适应请求调度机制。系统将所有GPU相关流量统一管理,利用服务质量(QoS)机制确保推理通信的高优先级,保证大规模数据传输不干扰延迟敏感型任务。同时,调度器能实时监控各引擎负载,动态决定最优路径,减少GPU执行过程中的闲置时间。

  数据显示,研究团队在包含1152个GPU的大规模生产集群上,使用660B规模的模型进行了实测。结果表明,DualPath在离线推理场景下的吞吐量提高了1.87倍,在线服务场景下的吞吐量平均提升了1.96倍。此外,在高负载环境下,首字延迟(TTFT)得到大幅优化,而Token间的生成速度几乎未受干扰。(袁宁)原文出处:DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍” 的相关文章

“政校企”协同,助力AI赋能乡村基础教育教学改革

“政校企”协同,助力AI赋能乡村基础教育教学改革

  为深入贯彻党的二十大关于加快建设教育强国的战略部署,贯彻落实“百千万”工程,推动乡村基础教育高质量发展。10月23日至24日,由广东石油化工学院、茂名市教育局、茂名市烟草专卖局(公司)...

西安经开三中:AI赋能高中数学教学 打造智慧教研新范式

西安经开三中:AI赋能高中数学教学 打造智慧教研新范式

  10月27日,由西安经济技术开发区教育体育局主办,西安市经开第三中学承办的“智创未来:人工智能赋能高中数学教学教研”联合教研活动成功举办。   活动在精彩的教学课例分...

DeepSeek预测:狼队vs曼联!红魔客场碾压or副班长爆冷?姆伯莫+B费双核

DeepSeek预测:狼队vs曼联!红魔客场碾压or副班长爆冷?姆伯莫+B费双核

  英超第15轮最悬殊对决即将上演!排名垫底的狼队(2分)将在莫利纽球场迎战第8名的曼联(22分)。主队本赛季14轮仅2平12负,场均丢球高达2.07个;而曼联虽距欧战区仅1分,但近5场仅...

小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSee

小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSee

  该模型主打高效与超高速,在推理、代码生成以及智能体等应用场景中表现尤为突出,同时也可作为日常任务的通用型AI助手使用。   有网友反馈称,在问题响应速度方面,MiMo...

两会声音丨全国人大代表何小鹏:期待开启属于智驾领域的“DeepSeek时刻”

两会声音丨全国人大代表何小鹏:期待开启属于智驾领域的“DeepSeek时刻”

  “全自动驾驶会加速落地,并实现从L2到L4的跨越,我们期待开启属于智驾领域的‘DeepSeek时刻’。”何小鹏介绍,小鹏汽车从有图到无图,从规则驱动到端到端量产,再到第二代VLA新范式...

终端 AI 奇点已至,英特尔点燃 PC 新范式

终端 AI 奇点已至,英特尔点燃 PC 新范式

  无论是对于终端AI的讨论,还是智能硬件的热潮,其本质都是关于下一代计算入口的争夺,其底层逻辑是,将智能无缝融入个人设备,让AI从需要主动调用的工具,演变为随时待命、主动服务的环境能力。...