当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能

5个月前 (12-04)Deepseek最新资讯143

  IT之家 12 月 4 日消息,科技媒体 Wccftech 昨日(12 月 3 日)发布博文,报道称在“混合专家”模型上,

  IT之家注:混合专家模型(MoE)是一种高效的 AI 大模型架构。它不像传统模型那样在处理每个任务时都动用全部“脑力”(参数),而是像一个专家团队,根据任务类型只激活一小部分最相关的“专家”(参数子集)来解决问题。这样做能显著降低计算成本,提高处理速度。

  就像人脑使用特定区域执行不同任务一样,混合专家模型使用路由器来选择最相关的专家来生成每个 token。

  英伟达为了解决 MoE 模型扩展时遇到的性能瓶颈,采用了“协同设计”(co-design)的策略,该方法整合了 GB200 的 72 芯片配置deepseek、高达 30TB 的快速共享内存、第二代 Transformer 引擎以及第五代 NVLink 高速互联技术。

  通过这些技术的协同工作,系统能够高效地将 Token 批次拆分并分配到各个 GPU,同时以非线性速率提升通信量,从而将专家并行计算(expert parallelism)提升至全新水平,最终实现了性能的巨大飞跃。

  除了硬件层面的协同设计,英伟达还实施了多项全栈优化措施来提升 MoE 模型的推理性能。例如,NVIDIA Dynamo 框架通过将预填充(prefill)和解码(decode)任务分配给不同的 GPU,实现了任务的解耦服务,允许解码阶段以大规模专家并行方式运行。

  同时,系统还采用了 NVFP4 格式,这种数据格式在保持计算精度的同时,进一步提高了性能和效率,确保了整个 AI 计算流程的高效稳定。

  该媒体指出,此次 GB200 NVL72 取得的性能突破,对英伟达及其合作伙伴具有重要意义。这一进展成功克服了 MoE 模型在扩展时面临的计算瓶颈,从而能够满足日益增长的 AI 算力需求,并巩固了英伟达在 AI 服务器市场的领先地位。原文出处:Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍,感谢原作者,侵权必删!

标签: deepseek

“Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能” 的相关文章

梁文锋的量化基金去年取得57%的亮眼回报 为DeepSeek提供坚实资金后盾

梁文锋的量化基金去年取得57%的亮眼回报 为DeepSeek提供坚实资金后盾

  DeepSeek创始人梁文锋旗下的量化对冲基金去年录得逾50%的回报,为这家在投入远低于竞争对手却已撼动全球科技格局的公司进一步充实了潜在“资金弹药”。   咨询机构...

DeepSeek预测:巴列卡诺vs巴塞罗那!巴萨火力全开,亚马尔能否延续神勇?

DeepSeek预测:巴列卡诺vs巴塞罗那!巴萨火力全开,亚马尔能否延续神勇?

  2025-26赛季西甲联赛第3轮,巴列卡诺将在主场迎战巴塞罗那。目前,巴塞罗那以2战全胜积6分的战绩排名联赛第2,而巴列卡诺则以1胜1负积3分排名第8。这场比赛对于双方来说都至关重要,...

10月18日DeepSeek预测:森林狼vs76人,爱德华兹率队客场取胜

10月18日DeepSeek预测:森林狼vs76人,爱德华兹率队客场取胜

  北京时间10月18日07:00,NBA季前赛将迎来一场焦点战,明尼苏达森林狼客场挑战费城76人。森林狼作为西部第6的劲旅,将面对东部排名第13的76人。尽管是季前赛,但两队近期状态迥异...

1月18日DeepSeek预测:步行者vs活塞,东部榜首大战,西亚卡姆对决康宁汉

1月18日DeepSeek预测:步行者vs活塞,东部榜首大战,西亚卡姆对决康宁汉

  北京时间1月18日早8:30,NBA常规赛将上演一场极具看点的对决——东部第一的底特律活塞坐镇主场迎战排名垫底的印第安纳步行者。尽管排名悬殊,但两队近期均取得4胜1负的佳绩,状态火热程...

1月12日DeepSeek预测:雄鹿vs掘金,约基奇缺阵,字母哥率队险胜

1月12日DeepSeek预测:雄鹿vs掘金,约基奇缺阵,字母哥率队险胜

  北京时间1月12日,NBA常规赛将迎来雄鹿客场挑战掘金的焦点战。目前雄鹿以17胜21负位列东部第11,而掘金则以25胜13负高居西部第3。此役对于雄鹿而言是冲击季后赛席位的关键卡位战,...

新春走基层

新春走基层

  从“飞起来”到“用起来” 万亿低空市场加速打开原文出处:新春走基层,感谢原作者,侵权必删!...