当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

1年前 (2025-02-25)Deepseek最新资讯568

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

中航成飞:公司部分内部信息化平台接入了DeepSeek

中航成飞:公司部分内部信息化平台接入了DeepSeek

中航成飞(302132)3月7日在互动平台表示,公司部分内部信息化平台接入了DeepSeek,目前已实现知识问答、流程调度等功能,有助于工作效率的提升,未来公司将不断探索新技术带来新的应用场景。相关搜...

贷款有望“无人”审批 DeepSeek料重塑信贷体系

贷款有望“无人”审批 DeepSeek料重塑信贷体系

凭借高性能、低成本和开源属性,DeepSeek大模型引发金融科技圈的高度关注,多家银行启动了深度研究测试,还有不少银行已完成本地化部署。某城商行董事长向记者直言:“以前由于成本太高,中小银行应用AI技...

DeepSeek能帮我缓解焦虑吗?

DeepSeek能帮我缓解焦虑吗?

原创 程恋雯 人文清华讲坛这两年,社交媒体上已经呈现出“人均心理学家”的态势——关于抑郁和焦虑的讨论屡见不鲜,各类心理学词汇诸如“NPD”“PUA”“讨好型人格”等等被大家批量化地使用和讨论,任何话题...

《殷墟甲骨精粹注译》:一场关于甲骨的“Deepseek”

《殷墟甲骨精粹注译》:一场关于甲骨的“Deepseek”

殷墟甲骨刻辞自一八九九年被发现以来就一直受到学界和社会的关注,其所包含的对中国汉字源流演变、先秦语言文字、殷商历史文化、中国考古发掘等各方面的研究价值颇高。经过前辈学者们一百多年来的努力,我们对殷墟甲...

DeepSeek精准赋能 山大二院探索创建AI医院

DeepSeek精准赋能 山大二院探索创建AI医院

DeepSeek自2024年12月开源以来,凭借“高性能+低成本+开源生态”三重优势,迅速成为全球AI领域热点。近日,山东大学第二医院完成DeepSeek大模型的本地化部署,与自主研发的“智慧体”应用...

联想与沐曦DeepSeek一体机上市首月发货量突破千台

联想与沐曦DeepSeek一体机上市首月发货量突破千台

联想集团与沐曦股份合作的首个国产DeepSeek一体机解决方案发布一个月以来,截至今日(3月7日),其累计发货量已突破千台。(界面新闻)...