当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型MODEL1曝光

3个月前 (01-21)Deepseek最新资讯66

  【TechWeb】1月21日消息,DeepSeek的下一代旗舰模型疑似提前曝光。在其官方GitHub代码库的更新中,一个名为“MODEL1”的新模型名称在多个技术文件中频繁出现,引发了人工智能社区的广泛关注。

  根据对代码库的深入挖掘,“MODEL1”的踪迹横跨了114个文件,共计被提及28次。尤为关键的是,它在代码逻辑中与当前已发布的“V32”(即DeepSeek-V3.2模型)并列出现,表明它并非现有模型的简单迭代,而极有可能是一个独立的新模型序列。

  技术分析显示,MODEL1与V3.2在底层架构上存在显著差异。代码对比指出,二者在KV(键值)缓存布局、稀疏性处理方式以及FP8精度解码等核心模块上采用了不同的实现方案。特别是在内存优化方面,MODEL1显示出多处针对性改进,这通常意味着它在处理效率或支持更长上下文方面可能有新的设计目标。

  此前有消息称DeepSeek计划在2026年春节前后发布其下一代重量级模型。因为,不少行业分析人士认为,此次MODEL1在开源代码中意外现身,就如同之前DeepSeek发布的优化残差链接“mHC”和AI记忆模块“Engram”两篇论文中提到的新技术一样,很可能正是为这次发布进行的技术准备。

  目前,DeepSeek官方尚未对此事发表任何公开评论。所有信息均来源于对公开代码的非官方分析,模型的具体技术细节、性能指标及正式名称仍需等待官方的最终揭晓deepseek。原文出处:DeepSeek新模型MODEL1曝光,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型MODEL1曝光” 的相关文章

罗福莉小米首秀:MiMo大模型性能对标DeepSeek,小米AI生态再添核心战力

罗福莉小米首秀:MiMo大模型性能对标DeepSeek,小米AI生态再添核心战力

  罗福莉小米首秀:MiMo大模型性能对标DeepSeek,小米AI生态再添核心战力deepseek。#罗福莉#小米#大模型#AI#MiMo-V2-Flash原文出处:罗福莉小米首秀:Mi...

覆盖品类最多!海尔新增2家卓越级智能工厂

覆盖品类最多!海尔新增2家卓越级智能工厂

  9月11日,2025年度卓越级智能工厂项目名单结束公示,海尔旗下2家工厂获此殊荣,分别是位于山东青岛的高端特种冰箱柔性智能工厂和位于上海的全要素虚实映射的洗衣机智能工厂。...

K时评:DeepSeek R2,翘首以盼

K时评:DeepSeek R2,翘首以盼

  今年年初,DeepSeek 的火爆出圈,引发了AI圈大模型的新一波热潮。Deepseek应用一度登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGP...

全球十大工程成就发布,DeepSeek、英伟达等上榜

全球十大工程成就发布,DeepSeek、英伟达等上榜

  10月13日,由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”,在“2025年世界工程组织联合会全体大会暨全球工程大会”上正式发布。   ...

寒武纪Day 0适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM

寒武纪Day 0适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM

  寒武纪在公众号发文表示,2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。针对本次的De...

打造多元AI算力,推动实现算力普惠 全栈AI,让AI成为创新生产力

打造多元AI算力,推动实现算力普惠 全栈AI,让AI成为创新生产力

  8月23日,2025中国算力大会在山西大同举办。联想集团副总裁、中国基础设施业务群总经理陈振宽受邀在主论坛发表《联想全栈AI 让AI成为创新生产力》主旨演讲,分享了联想八年来在智能化转...