性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快
据介绍,DeepSeek-V3.1具备128K超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。
不仅如此,DeepSeek-V3.1拥有更强的Agent(智能体)能力,通过Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。
比如,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1均大幅领先DeepSeek-R1-0528。
另外,DeepSeek-V3.1思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下deepseek,各项任务的平均表现与R1-0528 持平。
对于DeepSeek R2发布延迟的原因,DeepSeek总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有8月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。原文出处:性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快,感谢原作者,侵权必删!