当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

国产大模型DeepSeek在2024年底的爆红盛况就不再阐述了,彼时市场目光都聚焦在这家新兴AI公司身上。随着大模型私有化部署需求激增,“卖铲人”们(在热门产业或风潮中,通过为相关产业提供设备、工具或...

DeepSeek暴露中国AI虚火!

DeepSeek暴露中国AI虚火!

2025年初凭借亮眼宣传与免费策略迅速占据市场的国产大模型“DeepSeek(深度求索)”,短短数月间用户反馈急剧转向,暴露其核心技术存在重大隐忧——数据真实性存疑、知识库严重滞后、技术可持续性不足等...

AI钉铛智造生产ERP与DeepSeek深度融合,驱动制造业全场景智能革新

AI钉铛智造生产ERP与DeepSeek深度融合,驱动制造业全场景智能革新

当2025 年的曙光划破天际,人工智能已成为重构全球产业格局的核心引擎。在这一历史性进程中,中国工业智能化进程迎来重磅突破 —— 工业制造领域正经历由 AI 技术驱动的深度变革,这场技术革命如同一把金...

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

只有小米手机、苹果国行还没宣布外接大模型计划。蛇年春节以来,一场名为DeepSeek的大模型“飓风”开始席卷科技界,手机公司堪称其中反映最迅速的行业之一。 2月10日,中兴通讯终端事业部总裁...

国网长乐区供电公司:开展DeepSeek办公节能增效培训

国网长乐区供电公司:开展DeepSeek办公节能增效培训

近日,国网长乐区供电公司联合长乐区总工会开展“DeepSeek办公节能增效”专题培训。活动邀请福建省数字经济促进会人工智能专业委员会副主任、秘书长、海峡(福州)职工创新创业创造中心特聘AI导师黄进授课...

deepseek,到底是什么?请不要说“协和语”!

deepseek,到底是什么?请不要说“协和语”!

1945年前的东北,街头巷尾突然响起一阵夹杂着日语的奇怪腔调,大人小孩不得不强行学会“协和语”;而到了2024年,我们发现身边越来越多的科技产品、品牌名开始用洋文,甚至大媒体也不翻译,直接用“deep...