当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

3个月前 (03-25)DeepSeek技术交流281

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

人福医药:将关注DeepSeek等前沿技术的发展与应用

人福医药:将关注DeepSeek等前沿技术的发展与应用

金融界3月27日消息,有投资者在互动平台向人福医药提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的...

DeepSeek加持的AlphaGPT,助力高文律师事务所全面拥抱AI

DeepSeek加持的AlphaGPT,助力高文律师事务所全面拥抱AI

2025年初,中国团队精心雕琢的通用大模型DeepSeek凭借其创新的架构优化以及深入的数据挖掘技术,在逻辑推理、多轮对话和知识搜索等关键领域大放异彩,其为诸多垂直领域,特别是法律行业的智能化转型,开...

后DeepSeek时代:六小虎向左,BAT向右

后DeepSeek时代:六小虎向左,BAT向右

相比BAT等大厂可以卸下心理包袱,选择自研与开源两条腿走路的路线,以智谱为代表的“六小虎”们,则必须押注在自家大模型的底层技术能力上。原创ⓒ新熵作者丨茯神 编辑丨思原 主编丨九黎DeepSeek给AI...

从理论到实操,郓城政协DEEPSEEK+AI培训助力企业提效创新

从理论到实操,郓城政协DEEPSEEK+AI培训助力企业提效创新

大众网记者 李效谨 通讯员 赵考壮 马春娟 郓城报道“AI技术的发展日新月异,正深刻改变着我们的工作与生活。我们要主动学习AI、用好AI,才能让这项技术真正为我们服务。”近日,在郓城县政协举办的“人工...

杭州联通助力DeepSeek成功接入建德政务信创云,“智”启政务新篇

杭州联通助力DeepSeek成功接入建德政务信创云,“智”启政务新篇

国产人工智能大模型DeepSeek以其领先技术实力崛起,成为引领技术革新的先锋力量。该模型不仅以超凡的智能交互能力重塑人机协作的边界,更以卓越的计算性能突破传统AI的桎梏,开创了智能认知的新纪元。杭州...

中航成飞:公司部分内部信息化平台接入了DeepSeek

中航成飞:公司部分内部信息化平台接入了DeepSeek

中航成飞(302132)3月7日在互动平台表示,公司部分内部信息化平台接入了DeepSeek,目前已实现知识问答、流程调度等功能,有助于工作效率的提升,未来公司将不断探索新技术带来新的应用场景。相关搜...