当前位置:首页 > Deepseek最新资讯 > 正文内容

中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510

6个月前 (10-14)Deepseek最新资讯326

  DeepSeek在年初发布了R1以后,受到了各界普遍关注。后续来看,DeepSeek并没有如期发布更先进的模型R2,而是在进行更多小版本的更新换代。结合每个阶段的发展重点,我们将其划分为3个主要的发展阶段。

  阶段一:性能提升。DeepSeek在3月推出的V3-0324和5月推出的R1-0528,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。

  阶段二:实现混合推理架构、Agent能力提升、与国产芯片协同优化。从8月以后,DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势,推出了V3.1和V3.1-Terminus,Agent能力有了较大提升,思考效率也有提升。V3.1采用UE8M0FP8缩放格式训练,针对即将发布的下一代国产芯片设计,实现国产大模型和国产芯片协同设计的优化deepseek,对国产化芯片的应用起到积极的推动作用。

  阶段三:提效降价,国产适配加速。9月发布的V3.2-Exp,基于V3.1-Terminus构建,引入了新的注意力机制DSA,在保持模型性能的稳定的同时,在训练推理效率方面有了较大的提升,带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性,也将促进应用端实现更多功能的落地。DeepSeek新兴AI编程语言选用TileLang这个新兴AI编程语言,可以实现对不同硬件平台的支撑,极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题,为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天,国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配,国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。原文出处:中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-251014,感谢原作者,侵权必删!

标签: deepseek

“中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510” 的相关文章

美媒称要向DeepSeek学习

美媒称要向DeepSeek学习

  【#美媒称要向DeepSeek学习#】#东南亚成中国微短剧核心粉丝区# “中国变酷了!”2025年,谈及中国的海外吸引力与好感度,“酷炫中国”成为外媒高频评价词。这一年,中国文化创意之...

国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.5%!DeepS

国产AI王者归来!科创人工智能ETF(589520)盘中拉升2.5%!DeepS

  。这是时隔4年之后,华为麒麟芯片首次公开展示。此外,余承东宣布鸿蒙5.0系统设备数突破1400万。   iPhone 17发售在即,开源证券指出,随着关税问题落地、苹...

厦大学生干部朋友圈狂喷国乒冠军,校方连夜查人!

厦大学生干部朋友圈狂喷国乒冠军,校方连夜查人!

  厦门大学外文学院日语专业的高材生陈笑郎(网名“向阳花”)狂喷两名国乒球员?!刚在乒超联赛厦门站当完志愿者,转头就在朋友圈和小红书彻底疯狂。   陈笑郎在乒超厦门站担任...

住建部GBT50500-2024《建设工程工程量清单计价标准》解析及DeepSe

住建部GBT50500-2024《建设工程工程量清单计价标准》解析及DeepSe

  2024年12月30日住建部正式发布《建设工程工程量清单计价标准》GB/T50500-2024,新版《清单计价标准》的出台将为工程造价精细化管理带来一场新的革命,同时也给各单位相关管理...

DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待

DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待

  2025年1月20日 DeepSeek-R1 的发布,港恒生科技指大涨了一波deepseek,最高涨幅约47%原文出处:DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待...

科创100ETF华夏(588800)涨超1.8%,DeepSeek最新模型降价5

科创100ETF华夏(588800)涨超1.8%,DeepSeek最新模型降价5

  消息面上,9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型,并表示,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Ex...