当前位置：首页 > Deepseek最新资讯 > 正文内容

全球首个混合线性架构万亿参数思考模型开源

4个月前 (02-15)Deepseek最新资讯65

　　中国日报2月13日电（记者程钰）2月13日，蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T，在长文本生成、数学推理与智能体任务执行上达到开源领先水平，为智能体（Agent）时代的复杂任务处理提供高性能基础支撑。

　　在生成效率上，Ring-2.5-1T在32K以上长文本生成场景中，对比上代模型访存规模降低10倍以上，生成吞吐提升3倍以上。在深度思考能力方面，该模型在国际数学奥林匹克竞赛（IMO 2025）和中国数学奥林匹克（CMO 2025）自测均达到金牌水平（IMO 35分、CMO 105分）。同时，可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理deepseek，支持多步规划与工具调用。

　　Ring-2.5-1T基于Ling 2.5架构，通过优化注意力机制，显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B，但在混合线性注意力架构的支持下，推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比，在1T总参数量下，Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著，且随着生成长度增加，效率优势持续扩大。

　　随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展，Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力，为行业提供了高性能、高效率的智能体时代基础模型新选择。

　　目前，Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。原文出处：全球首个混合线性架构万亿参数思考模型开源，感谢原作者，侵权必删！

标签: deepseek