当前位置:首页 > Deepseek最新资讯 > 正文内容

中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510

8个月前 (10-14)Deepseek最新资讯329

  DeepSeek在年初发布了R1以后,受到了各界普遍关注。后续来看,DeepSeek并没有如期发布更先进的模型R2,而是在进行更多小版本的更新换代。结合每个阶段的发展重点,我们将其划分为3个主要的发展阶段。

  阶段一:性能提升。DeepSeek在3月推出的V3-0324和5月推出的R1-0528,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。

  阶段二:实现混合推理架构、Agent能力提升、与国产芯片协同优化。从8月以后,DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势,推出了V3.1和V3.1-Terminus,Agent能力有了较大提升,思考效率也有提升。V3.1采用UE8M0FP8缩放格式训练,针对即将发布的下一代国产芯片设计,实现国产大模型和国产芯片协同设计的优化deepseek,对国产化芯片的应用起到积极的推动作用。

  阶段三:提效降价,国产适配加速。9月发布的V3.2-Exp,基于V3.1-Terminus构建,引入了新的注意力机制DSA,在保持模型性能的稳定的同时,在训练推理效率方面有了较大的提升,带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性,也将促进应用端实现更多功能的落地。DeepSeek新兴AI编程语言选用TileLang这个新兴AI编程语言,可以实现对不同硬件平台的支撑,极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题,为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天,国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配,国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。原文出处:中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-251014,感谢原作者,侵权必删!

标签: deepseek

“中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510” 的相关文章

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

  该框架创新性地将评估模型置于核心位置。通过强化学习训练的CriticLeanGPT模型,能像数学专家一样精准判断形式化代码是否贴合原始语义,配合迭代优化机制,让生成的定理证明既符合语法...

腾讯姚顺雨:中国AI需要走出榜单束缚,像DeepSeek注重坚持正确的事

腾讯姚顺雨:中国AI需要走出榜单束缚,像DeepSeek注重坚持正确的事

  1月10日,AGI-Next前沿峰会上,腾讯CEO办公室首席科学家姚顺雨连线发言,分享自己观察到中国AI大模型行业的现象。他举例DeepSeekdeepseek,表示希望大家能走出“榜...

新突破!DeepSeek推出新模型,科创AIETF(588790)红盘震荡

新突破!DeepSeek推出新模型,科创AIETF(588790)红盘震荡

  流动性方面,科创AIETF盘中换手1.96%,成交1.17亿元。拉长时间看,截至11月27日,科创AIETF近1年日均成交3.90亿元,排名可比基金第一。   11月...

DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本

DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本

  据介绍,DeepSeek-OCR 参数量约3B ,是对“光学二维映射压缩”技术在长文本上下文处理中的可行性的一次初步探索deepseek。   模型核心由 DeepE...

经济发展和社会发展相辅相成协调并进

经济发展和社会发展相辅相成协调并进

  3月6日下午,习近平总书记在看望参加全国政协十四届四次会议的农工党、九三学社、医药卫生界、社会福利和社会保障界委员,并参加联组会,听取意见和建议时强调:“到2035年建成健康中国是中共...

iQOO Z10 Turbo+ 正式发布

iQOO Z10 Turbo+ 正式发布

  旗舰双芯火力全开,造就最强性能表现。iQOO Z10 Turbo+ 搭载最新一代 3nm 全大核架构天玑 9400+ 旗舰平台,具备行业最强手游图形渲染性能的 Immortalis-G...