当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

1年前 (2025-03-25)DeepSeek技术交流630

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

DeepSeek助力贵阳贵安营商环境再上新台阶

DeepSeek助力贵阳贵安营商环境再上新台阶

3月7日上午,贵阳贵安DeepSeek部署应用新闻发布会举行。贵阳市投资促进局副局长秦军介绍了DeepSeek赋能贵阳贵安招商引资、完善配套服务,优化营商环境的做法和取得成效。贵阳市数智化推进招商引资...

海尔消费金融部署DeepSeek,客服质检效率显著提升

海尔消费金融部署DeepSeek,客服质检效率显著提升

随着人工智能技术的飞速发展,金融行业的数字化转型步伐也在不断加快。海尔消费金融作为行业内的佼佼者,率先引入了前沿的AI模型DeepSeek,以提升客服质检效率,进一步优化客户体验。DeepSeek作为...

上海车展:宝马等车企宣布引入DeepSeek,是噱头还是刚需?

上海车展:宝马等车企宣布引入DeepSeek,是噱头还是刚需?

DeepSeek再度成为汽车行业的关键词之一。在2025年上海车展期间,宝马、吉利、东风等十多家车企密集宣布深化DeepSeek等AI大模型技术应用,其中宝马在车展首日公布年内“上车”计划,引发行业热...

DeepSeek-Prover-V2:AI 数学推理新王者,88.9% 通过率设新标杆

DeepSeek-Prover-V2:AI 数学推理新王者,88.9% 通过率设新标杆

IT之家 5 月 1 日消息,深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,...

推荐大家阅读这本书:《DeepSeek全攻略 人人需要的AI通识课》

推荐大家阅读这本书:《DeepSeek全攻略 人人需要的AI通识课》

该书以对话问答的形式,将复杂的AI技术概念转化为易于理解的通俗语言,从基础知识到应用实践,从理论讲解到案例分析,深入浅出地介绍了AI技术的核心原理和应用方法,为大家提供了全面的AI通识认知框架。值得一...

DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?

DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?

春节期间,国产大模型DeepSeek-R1的横空出世,一度让人们看到了“降本增效”的曙光。DeepSeek-R1以更低的成本和算力需求,实现了世界一流的模型性能,打破了大模型领域“烧钱买芯片”的传统路...