当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行

9个月前 (09-18)Deepseek最新资讯328

  9月18日,梁文锋作为通讯作者,带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

  《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

  DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。最终它学会了推理——逐步解决问题并揭示这些步骤——更有可能得出正确答案。这使得DeepSeek-R1能够自我验证和自我反思,在给出新问题的答案之前检查其性能,从而提高其在编程和研究生水平科学问题上的表现。

  据悉,DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

  在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

  DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之deepseek,更没有专门的蒸馏环节。

  今年1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行业,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAIo1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

  伴随AI大模型行业的日新月异,DeepSeek已经更新出R1以外的新版本,但万众期待的R2尚未面世。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。

  据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

  当时,DeepSeek表示,DeepSeek-V3.1使用UE8M0FP8Scale的参数精度。UE8M0FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。相关表态,一度带动国产芯片算力股价迎来飙升。原文出处:DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行” 的相关文章

DeepSeek预测:国米VS那不勒斯巅峰对决!劳塔罗率队3-1复仇 意甲榜首大

DeepSeek预测:国米VS那不勒斯巅峰对决!劳塔罗率队3-1复仇 意甲榜首大

  意甲第20轮即将上演火星撞地球的榜首大战!领头羊国际米兰坐镇梅阿查迎战第三名那不勒斯,两队仅差4分的微妙局势让这场比赛充满看点。作为本赛季意甲进攻最犀利的球队(场均2.11球),国米在...

DeepSeek预测:富勒姆vs阿森纳!枪手火力全开,哲凯赖什能否再破农场主防线

DeepSeek预测:富勒姆vs阿森纳!枪手火力全开,哲凯赖什能否再破农场主防线

  英超第8轮即将上演一场伦敦德比,排名第14的富勒姆将在克拉文农场球场迎战领头羊阿森纳。富勒姆目前2胜2平3负积8分,距离降级区仅有4分优势;而阿森纳则以5胜1平1负积16分的战绩领跑积...

DeepSeek预测:卡利亚里vs尤文图斯!伊尔迪兹7球领衔,斑马军团客场碾压?

DeepSeek预测:卡利亚里vs尤文图斯!伊尔迪兹7球领衔,斑马军团客场碾压?

  意甲第21轮即将迎来一场看似实力悬殊的对决——排名第16的卡利亚里主场迎战第4的尤文图斯。主队目前仅积19分,距离降级区仅5分优势,而客队则以39分紧咬欧冠区。卡利亚里本赛季21球(联...

AI应用爆发!软件50ETF(159590)放量大涨超5%,早盘获实时净申购20

AI应用爆发!软件50ETF(159590)放量大涨超5%,早盘获实时净申购20

  软件50ETF(159590)大涨超5%,成交额巨幅放量!资金面上,开盘30分钟左右即获超2200万元净申购!   软件50ETF(159590)标的指数权重股多数飘...

DeepSeek R2有望8月下旬发布?内部人士:不属实

DeepSeek R2有望8月下旬发布?内部人士:不属实

  近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。   早在今年4月deepseek,就有传言称,深度求索可能将在5...

GPT-5危了!DeepSeek开源世界首个奥数金牌AI,正面硬刚谷歌

GPT-5危了!DeepSeek开源世界首个奥数金牌AI,正面硬刚谷歌

  【新智元导读】沉寂许久的DeepSeek又回来了!今天,DeepSeekMath-V2重磅登场,一举夺下IMO 2025金牌,实力媲美甚至超越了谷歌的IMO金牌模型,开源AI再次扳回一...