当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日发布高性能通用矩阵乘法库

1年前 (2025-02-26)Deepseek最新资讯598

新京报贝壳财经讯（记者罗亦丹）北京时间2月26日，DeepSeek进行了其开源周第三日的发布——DeepGEMM，一个支持密集和MoE（专家混合模型）GEMM（通用矩阵乘法）的FP8 （8位浮点数）GEMM库，为V3/R1训练和推理提供支持。

据了解，通用矩阵乘法是许多高性能计算任务的核心，所以其性能优化也是大模型降本增效的重点。

DeepSeek表示，DeepGEMM在Hopper GPU（一种英伟达GPU架构）上最高可达到1350+FP8TFLOPS（每秒万亿次浮点运算），并且像教程一样简洁，可完全即时编译，其核心逻辑只有约300行代码，且在大多数矩阵尺寸上均优于专家调优的内核，并支持密集布局和两种MoE布局。

标签: DeepSeek

返回列表

上一篇：DeepSeek单日处理量等于镇江全市公务员10年工作量，为何有争议？

下一篇：DeepSeek已经给儿童看病了业内：“D医生”不为建议担责

“DeepSeek开源周第三日发布高性能通用矩阵乘法库” 的相关文章

DeepSeek火了，淘金者失落，卖铲者狂欢

DeepSeek火了，淘金者失落，卖铲者狂欢

今天凌晨，亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型，是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。所以，对于出海企业...

争夺DeepSeek溢出流量！大厂应用端迅速接入用户抱怨：搜的是抖音推的是视频号

争夺DeepSeek溢出流量！大厂应用端迅速接入用户抱怨：搜的是抖音推的是视频号

《科创板日报》2月28日讯（记者黄心怡）开源和低成本的优势，让DeepSeek打破了科技巨头用算力构建起的高墙，也让国内大模型企业感受到了新的竞争压力。目前，国内的互联网巨头正纷纷借势DeepSee...

吉林大学DeepSeek平台正式上线

吉林大学DeepSeek平台正式上线

随着新学期的到来，吉林大学在信息化建设的道路上又迈出了重要步伐——由大数据和网络管理中心、高性能计算中心联合华为公司部署的DeepSeek平台正式上线。该平台依托高性能计算中心的昇腾NPU平台和GPU...

李开复力推DeepSeek！零一万物发布模型一体机，搭载华为GPU

李开复力推DeepSeek！零一万物发布模型一体机，搭载华为GPU

第一家全面拥抱DeepSeek的“六小虎”，出现了！不卖关子，它就是李开复亲任CEO的零一万物。今日正式上线万智企业大模型一站式平台，宣布提供企业级DeepSeek部署定制解决方案。而早在今年2月11...

全面适配！京东云将DeepSeek推理场景性能提升50%

全面适配！京东云将DeepSeek推理场景性能提升50%

央广网北京3月3日消息在DeepSeek为期五天的“开源周”中，其连续开源的五大核心技术（FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统），...

掌趣科技：认为deepseek能助力游戏开发实现行业创新

掌趣科技：认为deepseek能助力游戏开发实现行业创新

金融界3月27日消息，有投资者在互动平台向掌趣科技提问：请问deepseek是否能助力游戏开发，从而实现行业创新，降本增效？公司回答表示：我们认为答案是肯定的。本文源自：金融界...