当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新版本模型:优化推理效率,API降价超50%

8个月前 (09-30)Deepseek最新资讯351

  值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

  据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

  据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

  在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

  DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

  除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前deepseek,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

  此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

  《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

  DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。原文出处:DeepSeek发布新版本模型:优化推理效率,API降价超50%,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新版本模型:优化推理效率,API降价超50%” 的相关文章

11月3日 DeepSeek预测 灰熊vs猛龙:莫兰特率队客场险胜 巴雷特难救主

11月3日 DeepSeek预测 灰熊vs猛龙:莫兰特率队客场险胜 巴雷特难救主

  作为NBA国际化标杆的多伦多猛龙(2胜4负/东部第11)将坐镇主场,迎战孟菲斯灰熊(3胜3负/西部第9)。此役对双方而言都是关键的卡位战——猛龙若败将跌至东部倒数第三,而灰熊取胜则可跻...

整个AI村都在等 DeepSeek V4 开饭!我最近很担心一上来就凉

整个AI村都在等 DeepSeek V4 开饭!我最近很担心一上来就凉

  可说实话,我心里最近总有个疙瘩总有些忐忑:看着国内外不断地、快速地迭代翻新的大模型战场,我担心   按照DeepSeek的惯例、按业界的普遍预期,DeepSeek是应...

科学圆桌会·趣谈2025 药理学家:这一年,国产创新药正在经历“DeepSeek

科学圆桌会·趣谈2025 药理学家:这一年,国产创新药正在经历“DeepSeek

  身为医药人,站在2025年岁末,有一种格外强烈的感慨:从被业界誉为“中国创新药元年”的2015年算起,十年磨一剑,国产创新药正在经历“DeepSeek时刻”:以长期积累的创新努力迎来产...

2025百度热搜影响力报告发布:九三阅兵、哪吒2、DeepSeek R1上榜

2025百度热搜影响力报告发布:九三阅兵、哪吒2、DeepSeek R1上榜

  上证报中国证券网讯(记者 罗茂林)日前,百度热搜与中国广视索福瑞媒介研究(CSM)联合发布《2025百度热搜影响力报告》。报告显示,九三阅兵、《哪吒2》中国票房第一、DeepSeek...

用科技守护大国粮仓 中储粮集团科技成果亮相第二十一届中国国际粮油产品及设备技术展

用科技守护大国粮仓 中储粮集团科技成果亮相第二十一届中国国际粮油产品及设备技术展

  2025年10月30日至11月1日,第二十一届中国国际粮油产品及设备技术展示交易会在杭州大会展中心成功举办。展会期间,中储粮集团系统呈现近年来在新仓型、智能化检测仪器设备、自动化仓储作...

两会声音丨全国人大代表何小鹏:期待开启属于智驾领域的“DeepSeek时刻”

两会声音丨全国人大代表何小鹏:期待开启属于智驾领域的“DeepSeek时刻”

  “全自动驾驶会加速落地,并实现从L2到L4的跨越,我们期待开启属于智驾领域的‘DeepSeek时刻’。”何小鹏介绍,小鹏汽车从有图到无图,从规则驱动到端到端量产,再到第二代VLA新范式...