当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-24)Deepseek最新资讯213

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!

DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!

DeepSeek V3模型完成小版本升级后,李开复称其将中美AI差距缩小至3个月,某些领域中国甚至已经领先。中国人工智能初创企业DeepSeek近日发布其最新大语言模型DeepSeek-V3-0324...

法律人118个常用DeepSeek提示词,0基础必看!!

法律人118个常用DeepSeek提示词,0基础必看!!

一、合同管理(15个)1.智能起草:生成跨境电商平台服务协议模板,包含数据跨境传输条款和不可抗力情形说明2.条款审核:用《民法典》合同编逐条审查技术开发合同,自动标注权利义务不对等条款(重点核查知识产...

DeepSeek如何助力医疗服务智能化?

DeepSeek如何助力医疗服务智能化?

DeepSeek通过其先进的人工智能技术,为医疗服务智能化提供了有力支持。以下是DeepSeek助力医疗服务智能化的具体方式:一、提升医疗效率快速文献检索:DeepSeek能够快速检索最新的医学文献和...

DeepSeek在水环境监测中的45个应用场景

DeepSeek在水环境监测中的45个应用场景

Deepseek可以写环评、可以做培训、可以搭建知识库。那Deepseek在水环境监测中有哪些应用场景?在这些场景如何发挥他的深度思考的优势?在数据分析应用的三大方向(纵向挖掘、前后贯通、横向关联)可...

中兴通讯AiCube DeepSeek一体机亮相MWC25,助力大模型商业化加速

中兴通讯AiCube DeepSeek一体机亮相MWC25,助力大模型商业化加速

在世界移动通信大会(MWC25巴塞罗那)上,中兴通讯隆重推出了AiCube DeepSeek一体机,为全球企业带来了高效的大模型商业化解决方案,助力千行百业数智化升级。在全球AI技术竞争日益激烈的背景...

第一批用DeepSeek相亲的年轻人,成功脱单了吗?

第一批用DeepSeek相亲的年轻人,成功脱单了吗?

谈恋爱不知怎么办?问问DeepSeek吧来自浙江杭州的女孩美娜,最近有点烦。去年11月,她认识了一位身高180、长相帅气的公务员男性,两个人一见面就擦出了火花,此后经常聊天约会。经过一段时间的相处,双...