当前位置:首页 > Deepseek最新资讯 > 正文内容

据最新爆料:DeepSeek V4和姚顺雨的新混元模型,将同时于下月发布

3个月前 (03-14)Deepseek最新资讯56

  【新智元导读】3 月 12 日,据《白鲸实验室》独家爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026 年 4 月)发布。

  OpenRouter 页面显示,Healer Alpha 被描述为具备视觉、听觉、推理与行动能力的前沿全模态模型;

  社区因此迅速将其与尚未发布的新一代国产模型联系起来,据称捕捉到了「系统提示词中要求严格遵守中国法律法规」deepseek

  而就在 3 月 12 日,据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeek V4撞上姚顺雨):

  作为梁文锋打磨已久的多模态大模型,DeepSeek V4 除了代码能力跃升,还会在长期记忆上取得突破。

  拓展阅读:梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

  DeepSeek V4 还将深度适配国产芯片,并有望成为首个完全跑在国产算力生态上的大模型。

  姚顺雨已于 2025 年 12 月出任腾讯总办首席 AI 科学家,同时兼任 AI Infra 部和大语言模型部负责人;

  2026 年 2 月,署名包含姚顺雨的论文 CL-bench 发布,提出一套面向「上下文学习」的新评测基准,继续把腾讯混元的研究焦点推向长上下文与 Agent 可用性。

  早在 2025 年初,姚顺雨就已接受邀请回国;实际上,姚顺雨对新模型的准备早已开始,而不是只有官宣后的不到半年时间。

  今年 1 月末,《晚点LatePost》也已爆料(字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争):

  DeepSeek 的已知研究正向长期记忆、多模态和底层架构延伸,腾讯混元则在上下文学习和真实任务评测上加快补课。

  两条路线很不一样,但都在试图回答同一个问题:下一个阶段的大模型,究竟该怎样真正走进生产环境。原文出处:据最新爆料:DeepSeek V4和姚顺雨的新混元模型,将同时于下月发布,感谢原作者,侵权必删!

标签: deepseek

“据最新爆料:DeepSeek V4和姚顺雨的新混元模型,将同时于下月发布” 的相关文章

牺牲质量换速度?DeepSeek“极速测试版”翻车,用户不满AI变“说教狂”

牺牲质量换速度?DeepSeek“极速测试版”翻车,用户不满AI变“说教狂”

  【TechWeb】2月11日晚间,DeepSeek悄然更新了网页端与App端版本,并开启灰度测试。此次更新最引人注目的突破在于将上下文长度直接拉升至1M(百万)Token,相当于此前能...

DeepSeek R2有望8月下旬发布?内部人士:不属实

DeepSeek R2有望8月下旬发布?内部人士:不属实

  近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。   早在今年4月deepseek,就有传言称,深度求索可能将在5...

百度智能云发布“智慧城轨整体解决方案”,赋能行业智能化升级

百度智能云发布“智慧城轨整体解决方案”,赋能行业智能化升级

  2025年,在中国国际城市轨道交通展览会上,百度智能云正式发布基于大模型的“智慧城轨整体解决方案”。该方案深度融合大模型能力与城市轨道交通核心业务,聚焦运行调度、设备运维、乘客服务与职...

租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂

租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂

  简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用 Sinkhorn-Knopp 算法将连接矩阵约束在双拟随机矩阵流...

君逸数码:AI智能体平台已结合Deepseek等主流大模型 在政务、交通、国央企

君逸数码:AI智能体平台已结合Deepseek等主流大模型 在政务、交通、国央企

  在投资者关系活动中表示,公司面向政企客户推出了自研的AI智能体平台产品,有多模态数据分析、智能知识库管理、精准智能问答、自主执行任务等功能,结合Deepseek等主流大模型deepse...

1月11日DeepSeek预测:热火vs步行者,鲍威尔率队客场轻取残阵步行者

1月11日DeepSeek预测:热火vs步行者,鲍威尔率队客场轻取残阵步行者

  北京时间1月11日早8点,NBA常规赛将迎来东部一场强弱对话——排名第6的热火(20胜17负)客场挑战垫底的步行者(7胜31负)。本赛季两队首次交锋中,热火曾以142-116狂胜对手d...