当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

1年前 (2025-02-26)Deepseek最新资讯595

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

近日,中国移动通信集团山东有限公司济南分公司与山东第一医科大学达成合作,成功落地DeepSeek项目,为学校部署DeepSeek-R1“满血”版大模型,标志着山东移动济南分公司在“AI+教育”领域迈出...

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

人工智能正以前所未有的深度和广度重塑全球经济格局,成为驱动商业升级的核心引擎。在科技与金融深度融合的今天,远东宏信以战略眼光拥抱变革,率先完成DeepSeek大模型的本地化部署,标志着公司在智能化转型...

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek为何掀起全球巨浪?春节期间发布的Deepseek-R1在全球引起震动。著名风险投资家马克·安德森 (Marc Andreessen)甚至描述这是“人工智能的人造卫星时刻”——指的是20...

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

原标题:青岛AI企业如何高效拥抱DeepSeek青岛日报/观海新闻记者 孙 欣 周晓峰 杨 光美国当地时间2月17日晚间,马斯克旗下人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布...

加速赋能千行百业,浪潮集团旗下十余款大模型产品全面接入DeepSeek

加速赋能千行百业,浪潮集团旗下十余款大模型产品全面接入DeepSeek

随着DeepSeek-V3等大模型产品凭借更低成本、更强性能引发海内外市场关注,越来越多国产生成式人工智能大模型加入了提质增效的队伍。作为新一代信息技术产业龙头企业,浪潮集团旗下10余款大模型产品目前...

华是科技:已成立人工智能部,在deepseek基础上进行行业应用测试

华是科技:已成立人工智能部,在deepseek基础上进行行业应用测试

金融界4月10日消息,有投资者在互动平台向华是科技提问:董秘您好,近期以deepseek为首的开源模型对贵公司产生了哪些实质影响?贵公司目前的订单如何?今年的业绩展望如何?公司回答表示:公司已成立人工...