当前位置:首页 > Deepseek最新资讯 > 正文内容

全球首个混合线性架构万亿参数思考模型开源

4个月前 (02-15)Deepseek最新资讯65

  中国日报2月13日电(记者 程钰)2月13日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。

  在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理deepseek,支持多步规划与工具调用。

  Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

  随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

  目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。原文出处:全球首个混合线性架构万亿参数思考模型开源,感谢原作者,侵权必删!

标签: deepseek

“全球首个混合线性架构万亿参数思考模型开源” 的相关文章

DeepSeek预测:多特蒙德VS亚特兰大!吉拉西火力全开,大黄蜂主场狂蛰真蓝黑

DeepSeek预测:多特蒙德VS亚特兰大!吉拉西火力全开,大黄蜂主场狂蛰真蓝黑

  北京时间2月18日凌晨4点,欧冠1/8决赛附加赛首回合将在威斯特法伦球场打响。德甲豪门多特蒙德(联赛第9)将坐镇主场迎战意甲劲旅亚特兰大(联赛第17)。这是改制后的欧冠首次出现36队联...

2月4日DeepSeek预测:尼克斯vs奇才,布伦森率队延续连胜,奇才主场难挡强

2月4日DeepSeek预测:尼克斯vs奇才,布伦森率队延续连胜,奇才主场难挡强

  华盛顿奇才将在主场迎战纽约尼克斯,这是一场东部第二与倒数第二的较量。奇才作为NBA传统球队,虽然本赛季战绩不佳,但拥有普尔、库兹马等知名球星,仍具备一定关注度。而尼克斯则在布伦森和唐斯...

天天学习丨中南海月刊(2025.12)

天天学习丨中南海月刊(2025.12)

  12月31日晚,习近平主席通过中央广播电视总台和互联网发表二〇二六年新年贺词。习近平主席回顾这一年的难忘历程,细数沉甸甸的收获,向十四亿多人民发出奋进再出发的号召。...

版本更新后“变冷淡”?DeepSeek回应:效率和便捷感等原因叠加

版本更新后“变冷淡”?DeepSeek回应:效率和便捷感等原因叠加

  有媒体对DeepSeek进行测试,提问为何变得“冷漠”,DeepSeek表示,不是故意变冷淡的。可能是几方面原因叠加:一个是效率上的调整。之前很多回复会带比较多的表情和语气词,但后来发...

晨光文具持续四年问鼎“中国品牌年度大奖文具NO.1”

晨光文具持续四年问鼎“中国品牌年度大奖文具NO.1”

  2025年12月17日,由世界经理人集团(World Executive Group)、世界品牌实验室(World Brand Lab)联合主办的2025年“世界经理人峰会”暨“(第二...

3月16日DeepSeek预测:独行侠vs骑士,骑士主场再胜?米切尔对决弗拉格

3月16日DeepSeek预测:独行侠vs骑士,骑士主场再胜?米切尔对决弗拉格

  达拉斯独行侠(22胜45负,西部第12)将客场挑战克利夫兰骑士(41胜26负,东部第4),这是双方3天内第二次交手。两天前骑士以138-105大胜独行侠,将历史交锋连胜纪录扩大到5场。...