当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制

5个月前 (01-13)Deepseek最新资讯86

  【#DeepSeek又开源了# 梁文锋署名新论文发布,实习生挑大梁】智东西1月13日报道,昨晚,DeepSeek又开源了,还发布一篇新论文。这次,他们提出了一种全新的“条件记忆”机制——Engram,旨在让MoE模型在保持巨量参数的同时,更高效地处理语言信息。

  DeepSeek创始人兼CEO梁文锋、北大王选计算机研究所的赵东岩和张辉帅教授都在论文中署名。Engram架构的核心优势在于以更低成本实现更优性能。训练计算量较MoE减少18%的情况下,在32768个token的长上下文任务中,Engram在RULER基准测试中反超同参数量MoE模型。

  并且,其浅层部署的记忆模块接管局部依赖与静态知识存储,为注意力机制腾出容量以专注全局推理,1000亿参数记忆表卸载后使H800推理吞吐量降幅不足3%。

  DeepSeek还观察到,增加记忆槽位数量能持续、稳定地降低验证损失,这意味着Engram提供了一个可预测的Scaling新手段:增大记忆容量持续带来收益,而无需增加计算量。

  那这种效果究竟是如何实现的呢?如今的MoE模型虽然在计算层面做到了稀疏化,但是它处理信息的方式仍然很费劲:有些老生常谈的事实性内容,比如常见的名字、公式或固定表达,模型却要重复计算,非常耗时间。

  DeepSeek的做法是,把这些“固定知识”提前整理成一个可以快速查询的表格,这样就能把更多精力放在真正需要深度思考的任务上,比如复杂推理或者理解长段文本deepseek

  值得一提的是,论文的第一作者Xin Cheng(程信)目前在北京大学智能学院攻读博士学位,主要研究大模型的高效参数化方法和机制。他同时也在DeepSeek工作,R1、V3的研究都参与了,很有可能是实习生。

  在论文摘要中,DeepSeek提出,条件记忆(conditional memory)将成为下一代稀疏模型中不可或缺的建模原语。这或许意味着DeepSeek-V4有望整合条件记忆机制,实现知识高效检索与推理能力的飞跃。原文出处:DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制” 的相关文章

DeepSeek预测:皇家马德里VS维戈塞尔塔!姆巴佩天神下凡助银河战舰碾压升班

DeepSeek预测:皇家马德里VS维戈塞尔塔!姆巴佩天神下凡助银河战舰碾压升班

  西甲第15轮即将迎来一场焦点战,排名第二的皇家马德里将在伯纳乌迎战中游球队维戈塞尔塔。目前皇马仅落后榜首巴萨1分,此役若能取胜将暂时登顶积分榜。而塞尔塔则位列第12,距离欧战区8分,保...

DeepSeek预测:亚特兰大vs切尔西!蓝军新星埃斯特旺能否轰碎真蓝黑防线?

DeepSeek预测:亚特兰大vs切尔西!蓝军新星埃斯特旺能否轰碎真蓝黑防线?

  欧冠新赛制下的第6轮焦点战,意甲劲旅亚特兰大将在蓝色竞技球场迎战英超豪门切尔西。目前亚特兰大以3胜1平1负积10分排名第10,而切尔西同积10分因净胜球优势暂列第7deepseek。两...

DeepSeek预测:马德里竞技VS西班牙人!格列兹曼率队复仇or米拉再演弑旧主

DeepSeek预测:马德里竞技VS西班牙人!格列兹曼率队复仇or米拉再演弑旧主

  床单军团目前以45分排名第4,仅领先第5名贝蒂斯4分。本赛季主场7胜3平2负的战绩虽位列联赛第4,但近期连续被巴列卡诺3球羞辱、欧冠附加赛遭比甲球队逼平,暴露出防线松动问题(近5场丢1...

1月20日DeepSeek预测:快船vs奇才,哈登率队冲击六连胜,奇才难挡颓势

1月20日DeepSeek预测:快船vs奇才,哈登率队冲击六连胜,奇才难挡颓势

  北京时间1月20日凌晨4点,NBA常规赛将迎来一场东西部对决,华盛顿奇才坐镇主场迎战洛杉矶快船。尽管奇才是联盟传统球队,但本赛季表现糟糕,目前以10胜31负的战绩排名东部第14,而快船...

DeepSeek 暗示:国产芯片有望大规模使用

DeepSeek 暗示:国产芯片有望大规模使用

  DeepSeek 特别在留言区强调:UE8M0 FP8 是针对即将发布的下一代国产芯片设计。   DeepSeek - V3.1 采用国产 UE8M0 FP8 Sca...

AI医疗,迎来DeepSeek时刻了吗?

AI医疗,迎来DeepSeek时刻了吗?

  2025年8月,国家发布《关于深入实施“人工智能+”行动的意见》,在“人工智能+”民生福祉方面,文件提到“探索推广人人可享的高水平居民健康助手,有序推动人工智能在辅助诊疗、健康管理、医...