当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!

5个月前 (12-03)Deepseek最新资讯160

  12月1日,国产大模型厂商DeepSeek正式发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。其中,V3.2版已全面上线至网页端、App和API,正式取代之前的测试版本;而Speciale版则作为临时API向社区开放,用于评测和研究。

  DeepSeek-V3.2主打日常使用,重点提升了推理能力与输出效率。据小事哥了解,在公开的推理类Benchmark中,DeepSeek-V3.2表现已接近GPT-5,仅略低于Google的Gemini-3.0-Pro。相比Kimi-K2-Thinking,它的输出更短,节省了大量计算资源和等待时间。这让它在问答、代码生成和多轮对话等场景中表现更加稳定。

  而Speciale版本可以说是DeepSeek的一次极限挑战。它在V3.2的基础上,加入了更强的推理和数学证明能力,结合了DeepSeek-Math-V2的定理验证模块。这个模型不仅能更好地理解复杂指令,还在多个国际顶级竞赛中取得出色成绩。

  据官方披露,Speciale版模型在2025年的IMO(国际数学奥林匹克)、CMO(中国数学奥林匹克)、ICPC全球总决赛和IOI信息学奥赛中均获得金牌。特别是在ICPC和IOI比赛中,其成绩甚至超过绝大多数人类选手,分别达到第二名和第十名的水平。

  不过,DeepSeek也坦言,Speciale版模型虽然强大,但资源消耗极高,目前仅供科研使用,不建议用于日常对话或写作。它暂时也不支持工具调用功能。

  但在标准版V3.2中,DeepSeek首次实现了“思考”和“工具调用”的结合。以往大模型在进入思考模式后往往无法调用工具,这次V3.2打破了这个限制,用户可以在模型推理的同时使用外部工具,比如搜索、计算器等。这项功能对提升Agent任务表现非常关键deepseek,比如在多步规划、复杂问答中更灵活。

  DeepSeek还公布了它们的训练方法。他们自研了一种大规模Agent训练数据合成方式,生成了超过1800个环境和8.5万个复杂指令任务。这类“难解答、易验证”的任务大幅提升了模型泛化能力。原文出处:DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!” 的相关文章

全面认识把握中国经济高质量发展的确定性

全面认识把握中国经济高质量发展的确定性

  当今世界变乱交织,发展环境动荡不安,确定性日益成为全球的稀缺资源。习近平总书记指出,面对复杂的外部环境,要坚定信心,坚定不移办好自己的事,坚定不移扩大高水平对外开放,着力稳就业、稳企业...

老板电器荣膺第一财经“历久出新典范”奖,以AI烹饪伙伴引领行业革新

老板电器荣膺第一财经“历久出新典范”奖,以AI烹饪伙伴引领行业革新

  当“历久弥新”成为企业穿越周期的核心命题,总有品牌能在坚守与突破中找到平衡——近日,在《第一财经》举办的“未来商业秀年度盛典”上,中国高端厨电品牌老板电器凭借其深厚的品牌积淀、卓越的创...

1月1日 DeepSeek预测:尼克斯vs马刺 东西部次席巅峰对决 布伦森文班亚

1月1日 DeepSeek预测:尼克斯vs马刺 东西部次席巅峰对决 布伦森文班亚

  2026年元旦夜,AT&T中心将迎来一场东西部次席的强强对话——23胜9负的尼克斯客场挑战同为23胜9负的马刺。两支胜率71.9%的球队将在攻防两端展开全面较量,胜负或将影响分...

11月17日DeepSeek预测:勇士vs鹈鹕,库里率队客场轻取鹈鹕

11月17日DeepSeek预测:勇士vs鹈鹕,库里率队客场轻取鹈鹕

  11月17日,NBA常规赛将迎来一场西部对决deepseek,新奥尔良鹈鹕将在主场迎战金州勇士。目前鹈鹕以2胜10负的战绩排名西部垫底,而勇士则以8胜6负暂列西部第8。这场比赛对于两支...

DeepSeek论文发表16天后,国内团队已经写出了模型的「生物字典」

DeepSeek论文发表16天后,国内团队已经写出了模型的「生物字典」

  今年 1 月,DeepSeek 发布了一项名为 Engram(条件记忆)的技术,在大模型圈子里掀起不小波澜。   具体做法是:把常见的 N-gram,比如「人工智能」...

淘宝上的DeepSeek卖9块9,真魔幻

淘宝上的DeepSeek卖9块9,真魔幻

  要知道别看DeepSeek的风,已经过去半年了,但是现在,你有时候还是有可能会见着这个可能会让你PTSD的玩意的。   我第一反应,这是什么菩萨,居然自己部了Deep...