当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-25)Deepseek最新资讯219

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

更安全更智能,智慧眼携手华为推出 DeepSeek一体机

更安全更智能,智慧眼携手华为推出 DeepSeek一体机

红网时刻新闻3月20日讯(记者 王娟娟)今日,记者从智慧眼科技股份有限公司(以下简称:智慧眼)了解到,智慧眼与华为携手合作发布了医疗行业全栈国产化的“砭石+DeepSeek双引擎一体机”(以下简称:双...

天融信:公司已发布DeepSeek安全智算一体机

天融信:公司已发布DeepSeek安全智算一体机

新京报贝壳财经讯(记者林子)2月28日,面对投资者询问公司日常是否会借助AI技术辅助工作,赛轮轮胎表示,公司积极探索AI等新技术在相关业务领域的应用,目前公司已私有化部署DeepSeek大模型,目前正...

中国工程院院士张亚勤:无人驾驶将迎来“DeepSeek时刻”|院士上封面

中国工程院院士张亚勤:无人驾驶将迎来“DeepSeek时刻”|院士上封面

封面新闻记者 边雪过去数十年,从沟通、消费、娱乐到生产、交通、商业往来,无不深深烙刻上数字化的印记。在中国工程院院士,清华大学智能产业研究院(AIR)院长张亚勤眼中,数字世界正逐步与物理世界、生物世界...

汉王科技:公司的电纸本全系产品已经接入Deepseek-R1和V3模型

汉王科技:公司的电纸本全系产品已经接入Deepseek-R1和V3模型

有投资者向汉王科技提问, 公司对DEEPSEEK评估完成了吗,现已接入了吗公司回答表示,您好,目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型,除此之外,暂无其他合作。谢谢关注。...

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

人工智能正以前所未有的深度和广度重塑全球经济格局,成为驱动商业升级的核心引擎。在科技与金融深度融合的今天,远东宏信以战略眼光拥抱变革,率先完成DeepSeek大模型的本地化部署,标志着公司在智能化转型...

100个经常用的DeepSeek提示词

100个经常用的DeepSeek提示词

写作与内容生产1. 写一篇关于人工智能伦理的议论文大纲。  2. 生成一段科幻小说的开头,主题是时间旅行。  3. 为环保产品写一段吸引人的广告文案。  4. 将以下技术...