当前位置:首页 > Deepseek最新资讯 > 正文内容

全球首个混合线性架构万亿参数思考模型开源

2个月前 (02-15)Deepseek最新资讯59

  中国日报2月13日电(记者 程钰)2月13日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。

  在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理deepseek,支持多步规划与工具调用。

  Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

  随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

  目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。原文出处:全球首个混合线性架构万亿参数思考模型开源,感谢原作者,侵权必删!

标签: deepseek

“全球首个混合线性架构万亿参数思考模型开源” 的相关文章

1月13日DeepSeek预测:黄蜂vs快船,伦纳德率队捍卫主场

1月13日DeepSeek预测:黄蜂vs快船,伦纳德率队捍卫主场

  作为NBA近年崛起的青年军,夏洛特黄蜂(14胜25负/东部第12)将做客加密球馆挑战洛杉矶快船(15胜23负/西部第11)。两支胜率不足四成的球队相遇,这场较量或将影响双方冲击附加赛的...

DeepSeek时刻已过去快一年,为何现在才做千问app?阿里千问团队回应

DeepSeek时刻已过去快一年,为何现在才做千问app?阿里千问团队回应

  在科技公司大建 AI 的叙事里,阿里之前更像美国的亚马逊、微软 —— 没有微信、抖音那样的全民流量入口,AI 投入选择偏向企业客户,不断买卡建算力中心,以云计算业务抓住千行百业对 AI...

3月18日DeepSeek预测:活塞vs奇才,东部霸主轻取副班长,康宁汉姆对决普

3月18日DeepSeek预测:活塞vs奇才,东部霸主轻取副班长,康宁汉姆对决普

  华盛顿奇才将在主场迎来底特律活塞的挑战,这是东部第一与倒数第二的悬殊对决。活塞目前以48胜19负高居东部榜首,而奇才仅16胜51负深陷重建泥潭。本赛季双方已交手两次各取一胜,但近期状态...

智谱发布新一代AI模型 加快步伐与DeepSeek展开竞争

智谱发布新一代AI模型 加快步伐与DeepSeek展开竞争

  中国人工智能(AI)企业智谱发布其旗舰模型的升级版本,在DeepSeek预计将会推出新产品之前先行一步,加快步伐与其展开竞争。   智谱在2月11日发布的声明中称,其...

毫无征兆!DeepSeek R1爆更86页论文,这才是真正的Open

毫无征兆!DeepSeek R1爆更86页论文,这才是真正的Open

  【新智元导读】R1论文暴涨至86页!DeepSeek向世界证明:开源不仅能追平闭源,还能教闭源做事!   有网友表示,这次更新堪称一本教科书了!尤其是,关于DeepS...

11月18日热点主线:人工智能、DeepSeek概念领涨三市

11月18日热点主线:人工智能、DeepSeek概念领涨三市

  今日的热点题材概念有:人工智能、DeepSeek概念、华为概念、阿里巴巴概念、抖音概念(字节概念)、百度概念、区块链。   一共有16支个股涨停。...