当前位置:首页 > Deepseek最新资讯 > 正文内容

谷歌研究:DeepSeek推理模型通过“脑内群聊”提升智能

4个月前 (01-21)Deepseek最新资讯84

  据量子位,谷歌最新研究发现,DeepSeek-R1等顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,如外向deepseek、严谨、多疑等。这些人格在模型解题过程中展开激烈的社交与辩论,类似“左右脑互搏”,从而让模型越吵越聪明。研究显示,在面对高难度任务时,这种内部冲突会更加激烈,而在简单任务时则明显减少。

  团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,这些模型的推理过程充满对话感,内部分裂出的虚拟角色性格迥异且覆盖更多解题角度。例如,创意型角色提出新颖思路,批判型角色挑错补漏,执行型角色负责落地验证。这种多角色互动并非开发人员刻意设计,而是模型在追求推理准确率过程中自发形成的。

  研究人员借助稀疏自编码器SAE,成功“监听”到AI的脑内群聊。通过提取模型隐藏层神经元的激活数值,并利用SAE的稀疏约束机制,将复杂信号拆解为独立的对话语义特征,进而识别出不同的内部逻辑实体,并打上虚拟角色标签,解码了AI内部的多角色对话行为。

  实验发现,推理模型的对话式行为出现频率显著高于普通指令模型。有趣的是,当强化模型的对话特征,放大“哦!”这类表达惊讶或转折的话语标记时,模型在算术推理任务中的准确率显著提升。此外,在强化学习训练中,模型会自发学会用对话式思考,且先经过多智能体对话数据微调的模型,在推理训练中的进步速度远快于直接训练或用独白式推理数据微调的模型。

  这一发现呼应了人类演化生物学中的社会脑假说,即大脑的进化是为了应对复杂的社交关系和群体互动需求。如今,AI也通过与不同“人格”的社交互动来提升智能。原文出处:谷歌研究:DeepSeek推理模型通过“脑内群聊”提升智能,感谢原作者,侵权必删!

标签: deepseek

“谷歌研究:DeepSeek推理模型通过“脑内群聊”提升智能” 的相关文章

中国创新药的“DeepSeek时刻”来临

中国创新药的“DeepSeek时刻”来临

  中国创新药企凭借七年来政策、资本和人才的积累,迎来“DeepSeek时刻”,在研发能力和临床数据质量上已达到国际先进水平,成为跨国药企争相合作的对象。   创新药“质...

卓易信息:公司目前在国内使用对接的是经过数据集微调的Qwen系列大模型以及Dee

卓易信息:公司目前在国内使用对接的是经过数据集微调的Qwen系列大模型以及Dee

  近期claude4.10已经发布,chatgpt5也即将发布,贵司的IDE产品是否会与上述大模型合作并受益?尊敬的投资者,您好!公司目前在国内使用对接的是经过我们数据集微调的Qwen系...

锐评|DeepSeek迎来“Nature时刻”,中国范儿就是这么大大方方

锐评|DeepSeek迎来“Nature时刻”,中国范儿就是这么大大方方

  “同行评审”在学术界属于常见且必要的论文审查程序,为何此次《自然》单独将其提出,并以“打破空白”来高度评价DeepSeek?事实上,自ChatGPT起,全球范围内大模型发展就犹如一场“...

直播带货激发图书消费潜力 出版社加速拓展市场新空间

直播带货激发图书消费潜力 出版社加速拓展市场新空间

  中金易云近日发布的一份报告显示,2025年上半年图书市场码洋为468.19亿,同比下降9.64%,降幅较一季度有所扩大。在各类图书零售渠道中,短视频电商渠道依旧是唯一正增长的渠道,增速...

破解AI“安全与性能”难题!DeepSeek-R1-Safe基础大模型在华为全联

破解AI“安全与性能”难题!DeepSeek-R1-Safe基础大模型在华为全联

  9月18日,华为全联接大会2025在上海盛大开幕。会上,华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。在中国工程院院士陈...

DeepSeek预测:利物浦VS狼队!红军主场狂轰滥炸,埃基蒂克领衔屠杀副班长

DeepSeek预测:利物浦VS狼队!红军主场狂轰滥炸,埃基蒂克领衔屠杀副班长

  英超第18轮将迎来一场实力悬殊的较量——排名第5的利物浦坐镇安菲尔德迎战垫底狼队。红军目前与欧冠区仅净胜球差距(29分),而狼队17轮仅积2分深陷降级区。本赛季利物浦场均进球1.65个...