当前位置:首页 > Deepseek最新资讯 > 正文内容

性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

8个月前 (08-21)Deepseek最新资讯344

  据介绍,DeepSeek-V3.1具备128K超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。

  不仅如此,DeepSeek-V3.1拥有更强的Agent(智能体)能力,通过Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。

  比如,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1均大幅领先DeepSeek-R1-0528。

  另外,DeepSeek-V3.1思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下deepseek,各项任务的平均表现与R1-0528 持平。

  对于DeepSeek R2发布延迟的原因,DeepSeek总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有8月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。原文出处:性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快,感谢原作者,侵权必删!

标签: deepseek

“性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快” 的相关文章

10月28日DeepSeek预测:篮网vs火箭,杜兰特率队终结连败,托马斯难救主

10月28日DeepSeek预测:篮网vs火箭,杜兰特率队终结连败,托马斯难救主

  北京时间10月28日早8点,NBA常规赛将迎来一场焦点战,休斯顿火箭坐镇主场迎战布鲁克林篮网。两支球队新赛季均未尝胜绩,火箭0胜2负西部垫底,篮网0胜3负东部倒数第一。此役对于双方而言...

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

  AI圈,不同的公司似乎都有着自己独特的发布节奏,比如OpenAI和Google喜欢相互“狙击”,在国内被津津乐道的,可能要属DeepSeek的“节前上新”。   一张...

DeepSeek开源新模型

DeepSeek开源新模型

  在GitHub()上可以看到其最新模型名为DeepSeek-OCR,还是一款OCR(光学字符识别)模型,该模型的参数量为3B。   DeepSeek 表示,DeepS...

DeepSeek预测:切尔西vs阿斯顿维拉,蓝军主场能否终结维拉十连胜?内托PK

DeepSeek预测:切尔西vs阿斯顿维拉,蓝军主场能否终结维拉十连胜?内托PK

  圣诞赛程迎来焦点对决,排名第4的切尔西将在斯坦福桥迎战第3名阿斯顿维拉。蓝军目前积29分(8胜5平4负),距离欧冠区仅差7分;而维拉36分(11胜3平3负)紧咬榜首阿森纳,两队近5次交...

每日互动基于DeepSeek打造智能问数助手Data Agent已在千万级APP

每日互动基于DeepSeek打造智能问数助手Data Agent已在千万级APP

  AI应用时代为APP带来了新机遇,同时也对运营增长提出了新的要求,这也使得高效、智能的数据分析成为刚需。每日互动(个推)依托深厚的数据智能积累,将大数据与AI大模型深度融合,对个推用户...

宏杉科技闪耀东博会!荣登“中国AI出海未来独角兽企业TOP100榜单”,开启全球

宏杉科技闪耀东博会!荣登“中国AI出海未来独角兽企业TOP100榜单”,开启全球

  9月17-21日,第22届中国—东盟博览会在广西南宁国际会展中心召开,60个国家约3200家企业参展,展示中国同东盟国家合作的最新成果。作为AI存储领军企业,宏杉科技携新一代AI存储亮...