当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek双模型发布:一位是“话少助手” 一位是“偏科天才”

6个月前 (12-04)Deepseek最新资讯171

  12月1日,DeepSeek(深度求索公司)同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。在公开推理测试中,V3.2水平达到了开放人工智能公司(OpenAI)今年8月推出的大模型GPT-5水平,略低于谷歌(Google)的Gemini3 Pro,国产大模型再一次吸引全球目光。

  “简单来说,区别于聊天机器人式大模型,DeepSeek-V3.2更像一位‘话少活好’的助手。”DCCI互联网研究院院长、中国社会科学院大学数字中国研究院特聘研究员刘兴亮解释道,这位助手主打高性价比与日常使用,具备更强的推理能力和智能体(Agent)能力,未来有望成为“数字劳动力”,完成自动生成报表、编写代码等复杂工作。

  而V3.2-Speciale更像一位“偏科”的科研天才,专攻高难度数学问题求解、学术研究逻辑验证、编程竞赛解题等,旨在将开源模型推理能力推向极致。

  工业和信息化部信息通信经济专家委员会委员盘和林表示,新模型有两个质的突破:引用DSA(领域专用架构)和思考型工具调用技术。

  盘和林用了一个形象的比喻解释DSA技术:“如果把大模型比作图书管理员,以往旧模型在找书时,每次都要从头一本一本找deepseek,词元消耗多且效率低。而DSA让它只需检索最关键信息,可以大幅缩小书架寻找范围,进而提升效率、降低消耗。”

  思考型工具调用技术,则瞄准大模型“一思考手就停”的短板。“此前大模型多限于单轮问答,无法像人类一样,在解决复杂问题时进行多轮思考和查阅资料。”盘和林说,“这项新技术让模型得到指令后,能先思考再调用代码执行、数据库查询等工具接口,然后根据结果继续思考、再次调用,如此交替反复,并保留记录供后续推理使用。”

  “这是DeepSeek首次将思考融入工具使用,改变了以往模型依赖人‘喂’数据的发展范式,实现AI的自我训练和进化。”盘和林说。

  过去一年,大语言模型快速发展,以Google、OpenAI等为代表的闭源社区在复杂任务中表现得愈发优越,而开源社区受制于架构、资源分配及智能体能力等方面的关键缺陷,与闭源社区性能差距进一步扩大。

  刘兴亮认为,新模型缩小了当前开源模型与闭源模型间的差距,证明了闭源大模型的巅峰并非不可逾越,为我国乃至全球开源大模型的发展注入强心剂。

  盘和林表示,从今年初发布R1大模型,以深度思考模式和超低成本预算实现中国人工智能发展弯道超车后,DeepSeek的发展主线始终聚焦实用性和泛化能力,让“赶超闭源”从美好愿景变为闭源厂商的现实压力。“最重要的是,DeepSeek为全球开发者提供了一个强大、可控且经济的模型底座,助力大语言模型融入千行百业、形成商业闭环。”他说。

  同时,盘和林也提醒,新模型为大语言模型带来了新的治理难题。“需警惕工具调用风险,以及学术造假、自动化生成代码漏洞、产业不公平竞争等挑战,推动开源模型向‘少说话多办事更安全’跃升。”

  据悉,DeepSeek的官方网页端、App和API(应用程序编程接口)均已更新为正式版DeepSeek-V3.2,但Speciale版本目前仅以临时API服务形式开放,供社区评测与研究。原文出处:DeepSeek双模型发布:一位是“话少助手” 一位是“偏科天才”,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek双模型发布:一位是“话少助手” 一位是“偏科天才”” 的相关文章

DeepSeek、阿里云AI编程能力进化,全球科技巨头密集投入 为何AI编程是A

DeepSeek、阿里云AI编程能力进化,全球科技巨头密集投入 为何AI编程是A

  8月21日,DeepSeek正式上线DeepSeek-V3.1,支持多种Code Agent框架,开发者可以自己搭建智能体,官方将之称为迈向Agent时代的第一步。...

1月8日DeepSeek预测:公牛vs活塞,东部榜首大战,康宁汉姆率队捍卫主场

1月8日DeepSeek预测:公牛vs活塞,东部榜首大战,康宁汉姆率队捍卫主场

  北京时间1月8日早8点,NBA常规赛将上演一场东部焦点战,目前高居东部第一的底特律活塞(27胜9负)将在小凯撒球馆迎战排名第九的芝加哥公牛(17胜19负)deepseek。尽管两队排名...

DeepSeek时刻已过去快一年,为何现在才做千问app?阿里千问团队回应

DeepSeek时刻已过去快一年,为何现在才做千问app?阿里千问团队回应

  在科技公司大建 AI 的叙事里,阿里之前更像美国的亚马逊、微软 —— 没有微信、抖音那样的全民流量入口,AI 投入选择偏向企业客户,不断买卡建算力中心,以云计算业务抓住千行百业对 AI...

分平台AI搜索排名优化指南:DeepSeek豆包百度AI等专属方案+优质机构

分平台AI搜索排名优化指南:DeepSeek豆包百度AI等专属方案+优质机构

  当前AI搜索市场呈现“平台差异化竞争”格局,DeepSeek、豆包、百度AI、ChatGPT、Gemini五大平台因算法逻辑、语义偏好、合规边界不同,对GEO(生成式引擎优化)的适配要...

Deepseek和宇树科技亮相,第四届数贸会9月在杭州召开

Deepseek和宇树科技亮相,第四届数贸会9月在杭州召开

  日,浙江省商务厅举办第四届全球数字贸易博览会发布会,浙江省商务厅副厅长胡真舫表示,本届数贸会围绕   第四届数贸会展览布局采用“1+5+7”架构,即:1个主题展区以及...

对话中关村科金总裁喻友平:DeepSeek热潮之后,To B需求正回归理性

对话中关村科金总裁喻友平:DeepSeek热潮之后,To B需求正回归理性

  过去两年,大模型在中国经历了从技术快速突破到产业加速落地的转折。资本和算力的集中投入推动了模型能力的提升,但真正进入企业日常并产生持续价值的,还取决于在具体行业场景中的应用深度。金融、...