当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

6个月前 (02-25)Deepseek最新资讯332

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?

马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?

《科创板日报》2月11日讯(记者 黄心怡)今日,阿里巴巴创始人马云再度现身阿里园区。《科创板日报》记者了解到,马云出现在夸克所处的阿里智能信息事业群,与员工交流。今日港股开盘后,阿里股价一度上涨触及1...

至顶AI实验室:DeepSeek完全实用手册V1.5,技术原理·使用技巧·部署进展(PDF版)

至顶AI实验室:DeepSeek完全实用手册V1.5,技术原理·使用技巧·部署进展(PDF版)

好的产品一定是能久经市场考验的,DeepSeek 无疑就是今年最好的产品之一。距离DeepSeek R1发布已经快3个月了,通过微信指数我们可以看到,DeepSeek的热度依然很高。但我们相信,过去的...

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是...

DeepSeek如何助力医疗服务智能化?

DeepSeek如何助力医疗服务智能化?

DeepSeek通过其先进的人工智能技术,为医疗服务智能化提供了有力支持。以下是DeepSeek助力医疗服务智能化的具体方式:一、提升医疗效率快速文献检索:DeepSeek能够快速检索最新的医学文献和...

Deepseek对百度搜索的冲击有多大?

Deepseek对百度搜索的冲击有多大?

纯从技术出发,Deepseek并没有远胜于国内字节豆包,阿里通义和腾讯元宝,或者微软必应集成的ChatGPT,先行用上AI的这波人本身就不会用百度,但这波国家带动的热度炒作让更多普通人用上新一代的人工...

官宣!海信电视正式接入DeepSeek

官宣!海信电视正式接入DeepSeek

2月11日,海信电视宣布正式接入DeepSeek,并支持满血R1和V3版本自由切换,成为行业首个搭载深度思考智能体的电视品牌。目前,海信电视正在进行用户终端的升级发布,预计3-5天内,所有搭载智能体的...