当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

1个月前 (05-29)Deepseek最新资讯189

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

Honda宣布深度携手Momenta、DeepSeek、宁德时代,开启智电时代新篇章

Honda宣布深度携手Momenta、DeepSeek、宁德时代,开启智电时代新篇章

4月23日,第二十一届上海国际汽车工业展览会正式开幕。本田技研工业(中国)投资有限公司,联合广汽本田汽车有限公司,和东风本田汽车有限公司携最新电动化和智能化成果,共同亮相上海国家会展中心6.2号馆。本...

国家能源集团全面接入DeepSeek系列模型

国家能源集团全面接入DeepSeek系列模型

近日,在开普云的助力下,国家能源集团全面接入DeepSeek系列模型。这一举措标志着国家能源集团在智能化转型的道路上率先迈出了重要一步,成为首个在内容安全领域接入DeepSeek大模型的央企。(证券时...

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

每经AI快讯,有投资者在投资者互动平台提问:请问贵司有没有Deepseek概念?汉王科技(002362.SZ)4月10日在投资者互动平台表示,目前公司的电纸本全系产品已经接入Deepseek-R1和V...

亚信科技助力广东联通全面接入DeepSeek,以国产AI赋能湾区转型

亚信科技助力广东联通全面接入DeepSeek,以国产AI赋能湾区转型

亚信科技助力广东联通全面接入DeepSeek,以国产AI赋能湾区转型###  近日,亚信科技依托自主研发的渊思·通用人工智能与认知增强平台(TAC MaaS)助力广东联通AI应用全面接入DeepSee...

思想者 | 金耀辉:DeepSeek破局,中国式创新如何改变AI未来?

思想者 | 金耀辉:DeepSeek破局,中国式创新如何改变AI未来?

【编者按】今年年初DeepSeek的出圈,让人看到国产大模型的巨大潜力。技术正以惊人的速度改变着人们的生活和工作方式,而如何认知技术正在成为互联网时代的“必修课”。在上海交通大学电信学院长聘教授金耀辉...

互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?

互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?

“那是最美好的时代,那是最糟糕的时代;那是智慧的年头,那是愚昧的年头……”一百多年前,狄更斯在《双城记》开篇写下的句子,精准描绘出两次工业革命交替之际希望与危机并存的矛盾局面。如今,在人工智能的浪潮中...