当前位置:首页 > DeepSeek技术交流 > 正文内容

外界热议:DeepSeek又变强了!

1年前 (2025-03-27)DeepSeek技术交流639

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。

不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。

在回答《环球时报》记者有关DeepSeek-V3新版本有哪些能力提升时,DeepSeek表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。

清华大学新闻学院、人工智能学院教授沈阳25日对《环球时报》记者表示,DeepSeek-V3-0324不仅是V3系列的一次迭代,更是中国AI技术崛起的又一力证。其在性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。未来,DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势,同时在中美竞争和社区生态中寻找平衡。沈阳认为,DeepSeek-V3-0324的发布看似是一次“小更新”,但其性能跳跃表明该团队可能在为后续重大版本(如传言中的DeepSeek-R2或V4)铺路。

路透社今年2月底引述3名知情人士的说法宣称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过,外媒的相关传言并没有得到DeepSeek公司的证实与回应。


沈阳表示,DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配,同时其开源模式或引发西方厂商的连锁动作,例如推出更强闭源模型。2025年可能是中美AI竞争的分水岭。

沈阳认为,在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界关注包括DeepSeek在内的中国头部大模型是不是最终也会出现这种合并的趋势。“这种可能是存在的,因为对于用户来说,并不关心大模型在回应自身问题时用的是什么类型的模型,更关心大模型能不能给出更为智能、合理的参考答案。”

(来源:环球时报)


“外界热议:DeepSeek又变强了!” 的相关文章

阿木尔林业局举办DeepSeek交流培训会

阿木尔林业局举办DeepSeek交流培训会

近日,阿木尔林业局举办DeepSeek交流培训会,进一步探索人工智能技术赋能林业局高质量发展的新路径,全面提升干部职工人工智能应用水平,全局60余名相关工作人员参加培训。此次培训由3名业务骨干分别就如...

“AI+”行动提速!中国人寿持续布局DeepSeek

“AI+”行动提速!中国人寿持续布局DeepSeek

人工智能是新一轮科技革命和产业变革的重要驱动力,近期DeepSeek强势“出圈”,在业界引发广泛关注,也成为全国两会热词。中国人寿集团推动各成员单位接入DeepSeek人工智能平台,在智能协同、智能客...

省市县三级联动“信访+DeepSeek”创新工作新闻发布会举行

省市县三级联动“信访+DeepSeek”创新工作新闻发布会举行

大众网记者 朱铜辉 济宁报道5月30日,省市县三级联动“信访+DeepSeek”创新工作新闻发布会在曲阜市融媒体中心举行。近年来,曲阜市将“和为贵”传统文化精髓融入信访实践,整合省市县三级资源,作为“...

医保局接入DeepSeek!问不倒的“医保明白人”来了

医保局接入DeepSeek!问不倒的“医保明白人”来了

(人民日报健康客户端记者 周学津)继医疗企业和医院接入DeepSeek后,多地医保局也相继跟上,推动医保服务智能化升级。2月以来,山东省青岛市、广东省深圳市、北京市丰台区等多地医保上线了医保智能服务。...

DeepSeek能干什么?搜论文、学代码……多所高校接入的DeepSeek“满血版”有哪些神奇之处?

DeepSeek能干什么?搜论文、学代码……多所高校接入的DeepSeek“满血版”有哪些神奇之处?

新学期,多所高校掀起了智能化革新浪潮。中国人民大学、华东师范大学、北京邮电大学等高校正式接入了DeepSeek“满血版”。这个拥有6710亿参数的“超级大脑”,正在以每周迭代的领域知识和强大的“思维链...

慧博AI大模型接入DeepSeek:从重构投研生态到输出私有化部署能力

慧博AI大模型接入DeepSeek:从重构投研生态到输出私有化部署能力

慧博智能投研终端日前正式接入深度求索(DeepSeek)大模型,这被视为金融数智化之路上的一个新坐标。“这次升级意义重大,不仅标志着金融投研工具从数据聚合迈向智能推演的新阶段,而且揭示了AI如何通过‘...