当前位置:首页 > Deepseek最新资讯 > 正文内容

性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

3小时前Deepseek最新资讯12

  据介绍,DeepSeek-V3.1具备128K超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。

  不仅如此,DeepSeek-V3.1拥有更强的Agent(智能体)能力,通过Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。

  比如,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1均大幅领先DeepSeek-R1-0528。

  另外,DeepSeek-V3.1思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下deepseek,各项任务的平均表现与R1-0528 持平。

  对于DeepSeek R2发布延迟的原因,DeepSeek总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有8月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。原文出处:性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快,感谢原作者,侵权必删!

标签: deepseek

“性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快” 的相关文章

deepseek关联公司公布大语言模型部署方法专利

deepseek关联公司公布大语言模型部署方法专利

  天眼查App显示,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利近日公布。摘要显示,该发明涉及人工智能领域,有益效果在于将...

DeepSeek-V3.1正式发布!云计算ETF汇添富(159273)冲高回落!

DeepSeek-V3.1正式发布!云计算ETF汇添富(159273)冲高回落!

  今日(8.21),大盘全天冲高回落,热门题材全线下挫。同类规模领先的云计算ETF汇添富(159273)小幅收跌0.36%,全天成交额超6500万元,较昨日放量。资金面上,云计算ETF汇...

429元 诺基亚宣布HMD 3210巴萨版上市:巴萨Logo深度定制 支持Dee

429元 诺基亚宣布HMD 3210巴萨版上市:巴萨Logo深度定制 支持Dee

  HMD 3210AI巴萨版搭载Deepseek的AI助手,可通过AI助手询问职场、生活、学习等方面问题。   HMD 3210AI巴萨版采用2.4英寸IPS屏,配备2...

斯基拉:切尔西签下哈维-西蒙斯,双方签约7+1年

斯基拉:切尔西签下哈维-西蒙斯,双方签约7+1年

  北京时间7月31日,记者斯基拉报道,切尔西签下荷兰中场哈维-西蒙斯。斯基拉表示这是独家消息:交易已经达成,莱比锡中场哈维-西蒙斯加盟切尔西,双方签约至2032年,附带一年续约选项。哈维...

陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek

陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek

  国内 AI 领域科学家、清华大学电子工程系副教授代季峰,与创新企业家、慈善家、天桥脑科学研究院创始人陈天桥联手筹备一家致力于打造通用人工智能(AGI)新公司一事,引发广泛关注。...

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

  消息面上,Eventbrite平台出售DeepSeek-R2门票,窗口期为8月16日至8月31日,但具体日期尚未官宣。Eventbrite是美国知名在线活动策划服务平台,主营业务为在线...