当前位置:首页 > Deepseek最新资讯 > 正文内容

后R1时代:DeepSeek发展的三大阶段

6个月前 (10-16)Deepseek最新资讯301

  ,还是以基础模型 DeepSeek V3-Base 为基座,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。

  8月21日,Deep在发布V3.1的同时,也宣布了在国产芯片适配方面的新进展。V3.1采用UE8M0 FP8缩放格式训练,为对即将发布的下一代国产芯片设计。

  此前,国内芯片企业仅有较少支持了FP8数据格式,多数芯片仅能支持FP16格式。FP8虽然可以提升计算速度和降低存储需求deepseek,但是由于计算精度不高,容易损失数据信息,所以V3以前的大模型训练中多会选用BF16或FP32/TF32精度进行数据计算和存储。DeepSeek是首个在开源超大规模大模型中成功落地FP8混合精度训练的公司,推动了FP8技术的规模化应用,也极大地提升了市场对H20等支持FP8格式芯片的需求。

  UE8M0 FP8是对FP8格式的深度优化。该格式仅表示非负数(U代表Unisigned,无符号),尾数位为0(M0,尾数位为0),8个比特全部用来表示指数(E8,指数位占8位),Scale通过对数据进行分块缩放,保持其能够在FP8表示的范围内。UE8M0 FP8作为FP8格式的变体,通过减少数据存储和传输的损耗,能最大限度利用硬件计算能力,弥补国产芯片在HBM等高速内存带宽方面的不足,从而实现国产大模型和国产芯片协同设计的优化,对于国产化芯片的应用起到积极的推动作用。

  9 月发布的 V3.2-Exp,基于 V3.1-Terminus 构建,引入了新的注意力机制 DSA,在保持模型性能的稳定的同时,在训练推理效率方面有了较大的提升,带来了模型较大幅度的降价。

  考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性,也将促进应用端实现更多功能的落地。

  在国产适配方面进度明显加快。在V3.2-Exp发布的当天,国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配。这是继V3.1采用UE8M0 FP8实现国产大模型和芯片协同设计的优化以后,国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。

  同时值得注意的是DeepSeek还同时开源TileLang和CUDA两个版本的算子。TileLang是一种采用类Python语法的领域专用语言(DSL),于2025年1月由北大计算机学院杨智团队开源,旨在实现硬件调度与开发者算法逻辑的解耦,从而降低GPU编程的技术门槛,同时通过分层设计来实现不同技术背景开发者,从简单上手到深度优化的不同需求。由于TileLang可以实现对不同硬件平台的支撑,极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题。

  DeepSeek选用TileLang这个新兴AI编程语言,再次体现了其强大的创新精神,同时为国产大模型软硬件生态建立起到了极大的推动作用。原文出处:后R1时代:DeepSeek发展的三大阶段,感谢原作者,侵权必删!

标签: deepseek

“后R1时代:DeepSeek发展的三大阶段” 的相关文章

DeepSeek预测:热刺VS切尔西!伦敦德比火药味十足,范德芬或成关键先生助热

DeepSeek预测:热刺VS切尔西!伦敦德比火药味十足,范德芬或成关键先生助热

  2025-26赛季英超第10轮即将上演一场伦敦德比,目前排名第3的热刺将在托特纳姆热刺球场迎战排名第9的切尔西。这场比赛对双方争夺欧战席位至关重要,热刺目前积17分,仅落后榜首阿森纳5...

越过 L3 直达 L4,小鹏就是中国智驾的 DeepSeek

越过 L3 直达 L4,小鹏就是中国智驾的 DeepSeek

  3 月 2 日是元宵节的前一天,正月十四,严格来说还在春节里。广州前天下了场雨,早上雾锁珠江,直到下午都没散尽。小鹏科技园里,沿路站着几位手执很多把伞等雨的保安,注视媒体老师们鱼贯进入...

宇树科技、DeepSeek等上榜!美国《时代》周刊评出2025“最佳发明”

宇树科技、DeepSeek等上榜!美国《时代》周刊评出2025“最佳发明”

  美国《时代》周刊近日刊发题为《2025年最佳发明》的文章,其中,宇树科技、深度求索(DeepSeek)、小米、联想、   机器人领域,宇树科技研发的R1机器人颠覆了传...

11月15日DeepSeek预测:勇士vs马刺,库里对决文班亚马,马刺主场险胜

11月15日DeepSeek预测:勇士vs马刺,库里对决文班亚马,马刺主场险胜

  11月15日10:30,NBA常规赛将上演西部焦点战——金州勇士客场挑战圣安东尼奥马刺。目前马刺以8胜3负高居西部第三,而勇士7胜6负暂列第九。双方两天前刚打出125-120的高分对决...

11月6日DeepSeek预测:76人vs骑士,马克西对决米切尔,骑士主场险胜

11月6日DeepSeek预测:76人vs骑士,马克西对决米切尔,骑士主场险胜

  北京时间11月6日早8点,NBA常规赛将迎来一场东部焦点战,克利夫兰骑士坐镇主场迎战费城76人。目前76人以5胜2负高居东部第二,骑士则以4胜3负位列第七。本场比赛对双方排名至关重要,...

阿里千问APP上线次日即冲进苹果App Store总榜前四 排名超越DeepSe

阿里千问APP上线次日即冲进苹果App Store总榜前四 排名超越DeepSe

  本报讯 (记者梁傲男)11月18日,阿里巴巴新推出的AI应用千问APP,在公测上线次日便迅速冲入苹果App Store免费应用总榜第四位,排名超越DeepSeek。其火爆人气一度导致服...