当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新版本模型:优化推理效率,API降价超50%

7个月前 (09-30)Deepseek最新资讯349

  值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

  据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

  据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

  在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

  DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

  除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前deepseek,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

  此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

  《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

  DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。原文出处:DeepSeek发布新版本模型:优化推理效率,API降价超50%,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新版本模型:优化推理效率,API降价超50%” 的相关文章

DeepSeek新一代模型引爆AI应用,创业板软件ETF华夏(159256)大涨

DeepSeek新一代模型引爆AI应用,创业板软件ETF华夏(159256)大涨

  A股股指盘中震荡上扬,创业板指跌幅收窄,盘面上, Sora概念、快手概念、小红书概念、AI预料涨幅居前,油气开采及服务、青海、保险、煤炭开采加工跌幅居前。创业板软件ETF华夏(1592...

11月17日DeepSeek预测:开拓者vs独行侠,残阵独行侠难挡开拓者双星?

11月17日DeepSeek预测:开拓者vs独行侠,残阵独行侠难挡开拓者双星?

  北京时间11月17日早8:30,NBA常规赛将迎来一场西部内战——波特兰开拓者客场挑战达拉斯独行侠。作为联盟传统劲旅的独行侠本赛季深陷泥潭,目前以3胜10负排名西部倒数第二,而青年军开...

DeepSeek V3.1: 显存带宽降50%,FP8技术推理吞吐提升2.3倍,

DeepSeek V3.1: 显存带宽降50%,FP8技术推理吞吐提升2.3倍,

  国产算力突破:DeepSeek V3.1显存带宽降50%,FP8技术推理吞吐提2.3倍;2025年市场规模破200亿,国产芯片渗透率30%deepseek。原文出处:DeepSeek...

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

  AI圈,不同的公司似乎都有着自己独特的发布节奏,比如OpenAI和Google喜欢相互“狙击”,在国内被津津乐道的,可能要属DeepSeek的“节前上新”。   一张...

新京报2025智慧生活年度案例揭晓,海信空调好空气管家斩获“年度家电智能体创新案

新京报2025智慧生活年度案例揭晓,海信空调好空气管家斩获“年度家电智能体创新案

  1月29日,新京报“2025智慧生活年度榜单颁奖盛典”在北京举行,由海信好空气管家、AI美食管家、AI洗护管家共同组成的海信AI生活管家凭借三大智能体创新与主动服务场景创新,斩获“年度...

DeepSeek崩了引热议 官方深夜回应:网页API已恢复

DeepSeek崩了引热议 官方深夜回应:网页API已恢复

  据了解,2025年伊始,来自中国的AI大模型DeepSeek凭借其突破性进展迅速走红,各行各业都在积极拥抱DeepSeek。   1月27日,Deepseek应用登顶...