当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

2个月前 (07-10)Deepseek应用场景220

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 自春节以来虽快速蹿红,一度被称为中国版 ChatGPT,它的爆发代表着一种行业信号——国产开源大模型驶入实用赛道,但目前其市占率从2月中旬的高峰7%下降至4月底的3%,使用率下降超5...

完成DeepSeek大模型部署 金美信消费金融AI赋能迈入新阶段

完成DeepSeek大模型部署 金美信消费金融AI赋能迈入新阶段

近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全新阶段。此次技术升级不仅夯实了公司数字化底层能力,更依托生成式AI技术的创新应用,实现办公效率与业务处理...

万达信息:子公司金唐软件携手DeepSeek打造AI智能体金小唐

万达信息:子公司金唐软件携手DeepSeek打造AI智能体金小唐

金融界7月16日消息,有投资者在互动平台向万达信息提问:卫宁健康发布全新架构ai医疗大模型,请问咱们公司是否有什么AI新架构产品发布或者研发?公司回答表示:感谢您对万达信息的关注。万达信息全资子公司金...

DeepSeek下载量暴跌背后:生态转型与长期价值之争

DeepSeek下载量暴跌背后:生态转型与长期价值之争

来源:AI文体通最新调研数据显示,人工智能应用DeepSeek在2025年第二季度的月均下载量同比暴跌72.2%,从第一季度的8111.3万次骤降至2258.9万次,引发市场对其发展前景的广泛担忧。然...

有没有觉得Deepseek最近没那么火了?

有没有觉得Deepseek最近没那么火了?

个问题其实早几天我跟我媳妇讨论过,起因是我觉得现在我用Deepseek越来越少,基本上都不怎么用了,但是我媳妇觉得她用的还是挺多的。所以我们就聊了聊为什么现在觉得Deepseek没那么火了。结果正好今...

"DeepSeek+智能工具训练营开营仪式方案策划报告"

"DeepSeek+智能工具训练营开营仪式方案策划报告"

"DeepSeek+智能工具训练营开营仪式方案策划报告"一、方案背景与目标1.1 产业背景在数字化转型加速推进的当下,人工智能技术已成为驱动政务、教育、传媒等领域变革的核心引擎。D...