当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

10个月前 (08-20)Deepseek最新资讯499

  昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后deepseek,在 Hugging Face 发布了一款新模型

  从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

  该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!

  整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。原文出处:DeepSeek开源新基础模型,但不是V4,而是V3.1-Base,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源新基础模型,但不是V4,而是V3.1-Base” 的相关文章

AI视频迎来了它的DeepSeek时刻

AI视频迎来了它的DeepSeek时刻

  你是一个非常有创意的普通人,你曾经有一个梦想,希望把自己脑海中的点子都用视觉形态展示,比如拍成动画、电影、电视剧等等。但你苦于资金和资源,无法实现。直到看到PixVerse R1后,你...

“不忘来路,始知归处”红色资源育人实践队 赴云南大理白族自治州支队开展“彩云之约

“不忘来路,始知归处”红色资源育人实践队 赴云南大理白族自治州支队开展“彩云之约

  为积极响应团中央青年志愿者行动指导中心开展“七彩假期”活动的号召,引导新时代青年学生在社会实践中受教育、长才干、作贡献,2025年7月13日至27日,南京师范大学中北学院“不忘来路,始...

沐曦股份即将上市 其下一代国产高端GPU芯片或再现“DeepSeek神话”

沐曦股份即将上市 其下一代国产高端GPU芯片或再现“DeepSeek神话”

  近日,上海证券交易所公告显示,上市审核委员会定于10月24日审议沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)的首发申请。   作为国内高性能GPU产品的领...

金沙江创投朱啸虎:大家低估了DeepSeek的影响力

金沙江创投朱啸虎:大家低估了DeepSeek的影响力

  新浪科技讯 9月20日上午消息,由硅星人与北京中关村科学城创新发展有限公司、北京中关村创业大街科技服务有限公司联合发起的“AI 创造者嘉年华”上,金沙江创投主管合伙人朱啸虎表示,“大家...

招生简章丨拥抱AI系列课程:DeepSeek赋能内部审计智能化转型与实践研修班

招生简章丨拥抱AI系列课程:DeepSeek赋能内部审计智能化转型与实践研修班

  随着大智移云物等新技术的落地应用,我国的内部审计实务经历了审计管理信息化、审计实务数字化、审计作业云化和智能化的发展阶段。很多领先企业充分融合数据、技术、模型和模式,已经步入了审计智能...

刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章

刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章

  简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用 Sinkhorn-Knopp 算法将连接矩阵约束在双拟随机矩阵流...