当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又一论文上新!新模型V4更近了?

3个月前 (02-27)Deepseek最新资讯52

  在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。

  这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

  具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

  论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

  上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

  因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

  这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

  但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

  相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

  就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

  面对传闻,DeepSeek依旧保持其一贯的沉默deepseek,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。原文出处:DeepSeek又一论文上新!新模型V4更近了?,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek又一论文上新!新模型V4更近了?” 的相关文章

1月10日DeepSeek预测:老鹰vs掘金,约基奇缺阵,掘金主场险胜

1月10日DeepSeek预测:老鹰vs掘金,约基奇缺阵,掘金主场险胜

  北京时间1月10日上午10点,NBA常规赛将迎来一场东西部对决,西部第三的丹佛掘金(25胜12负)坐镇高原主场迎战东部第九的亚特兰大老鹰(18胜21负)。尽管掘金近期遭遇核心约基奇伤停...

QM发布2025年AI应用榜:豆包、DeepSeek、元宝、阿福、千问排前五

QM发布2025年AI应用榜:豆包、DeepSeek、元宝、阿福、千问排前五

  3月3日,研究机构Quest Mobile发布的《2025年AI应用层发展核心报告》显示,截至2025年12月,全市场AI原生App中,月活跃用户排名前五的是豆包、DeepSeek、元...

ETF新闻观察 寒武纪爆发、DeepSeek开绿灯!26年国产芯片或迎三大爆点!

ETF新闻观察 寒武纪爆发、DeepSeek开绿灯!26年国产芯片或迎三大爆点!

  《每日经济新闻》记者获悉,近日包括韩国、巴西、日本、法国等国的股市接连出现大涨,国内公募基金中投资于这些市场的跨境ETF也随之快速走强。   以韩国为例,继2025年...

12月24日DeepSeek预测:灰熊vs爵士,马尔卡宁率队主场复仇?

12月24日DeepSeek预测:灰熊vs爵士,马尔卡宁率队主场复仇?

  在圣诞大战前夜,犹他爵士将坐镇主场迎战孟菲斯灰熊。作为NBA传统劲旅,爵士目前以10胜18负排名西部第12,而灰熊则以13胜16负位列西部第9。本场胜负将直接影响两队季后赛席位争夺——...

华为联袂浙大发布DeepSeek-R1大模型 首秀安全新标杆

华为联袂浙大发布DeepSeek-R1大模型 首秀安全新标杆

  在年度科技盛会华为全联接大会上,国内首个基于昇腾千卡算力平台的人工智能成果揭开面纱。由浙江大学研究团队与华为技术团队联合攻坚的DeepSeek-R1-Safe-671B基础大模型,展示...

11月20日DeepSeek预测:黄蜂vs步行者,布里奇斯率队客场擒敌

11月20日DeepSeek预测:黄蜂vs步行者,布里奇斯率队客场擒敌

  北京时间11月20日,NBA常规赛将迎来东部两支挣扎球队的较量——夏洛特黄蜂客场挑战印第安纳步行者。目前黄蜂以4胜10负排名东部第12,步行者则以1胜13负的战绩垫底东部。这场比赛对于...