当前位置:首页 > Deepseek最新资讯 > 正文内容

算力不够,智慧来凑?Deepseek们正在摆脱算力崇拜

3个月前 (01-26)Deepseek最新资讯61

  在科技圈,硅谷一直有一种“造物主”般的傲慢。从大模型诞生那天起,OpenAI的 CEO奥特曼就给全世界洗脑了一套暴力美学:智能等于算力,算力等于显卡,显卡等于成功。

  近日, Google的一项研究发现,DeepSeek的R1和阿里云的qwq-32B模型,竟然能够模仿人类的集体智能。

  简单说,在处理难题时,不再是一个人在战斗,而是在内部演化出了一个“思想社会”。其中不同人格特征和领域专业知识的相互作用产生了更强大的能力。

  大模型行业从不缺“堆料者”,但能让 Google 弯下腰来研究底层逻辑的,寥寥无几。这不仅是技术的胜利,更是中国企业在算力围堵下,硬生生走出的一条“暴力效率主义”血路。

  长期以来,硅谷的大模型发展路径高度趋同甚至单一:堆最贵的卡,组最多的集群,投入最激进的资本。

  从 GPT-3 到 GPT-4,再到 GPT-4o,这条路线被一次次验证有效。Meta 为了 Llama 3 囤积了数十万张 GPU,微软与 OpenAI 推进的“星际门”项目,投资规模动辄以千亿美元计,覆盖算力、数据中心、电力基础设施等全链条。这种打法并不复杂,本质上是通过资源冗余换取确定性领先。

  换句话说,当算力足够便宜、资本足够充裕时,工程效率往往并非首要约束,真正重要的是“规模先到位”。

  但 Google 这份研究揭开了另一个真相:DeepSeek 们之所以强,不是因为它们比 OpenAI 更能烧钱,而是它们更懂“省钱”。

  研究指出,DeepSeek 等中国模型的能力跃迁,并非来自算力规模的指数级扩张,而是来自推理阶段内部结构的重构。

  这些模型在面对复杂指令时,并不是沿着单一生成路径一路向前,而是会在内部并行展开多种解题策略,并通过持续的内部比较、博弈与修正,逐步收敛到更稳定的答案。

  这种近似“多代理协商”的模式,并不追求单次推理速度的极限,却显著降低了单位算力下的错误率与返工成本。在算力受限的环境中,这种“少走弯路”的能力,往往比“跑得更快”更重要。

  正是在这一背景下,MoE与 GRPO等技术路径开始在国内模型中被高度重视。MoE 通过将模型能力拆分给不同“专家模块”,避免了每一次推理都全模型启动;GRPO 则通过分组对比和相对优化,提升模型在推理阶段的稳定性和可控性。

  如果说硅谷仍在押注“重装推进”的工业化路线,那么中国模型更像是在修炼一套轻量而高效的技术体系。通过结构、策略和调度上的精细设计,对冲算力劣势。

  这种“算法效率主义”并非理想主义,而是一种典型的生存型进化。当资源不再无限供给,效率本身就会从加分项,转变为最核心、也最难复制的竞争壁垒。

  在 Google 的研究案例中,被反复引用的中国模型,并不是声量最大、发布会最密集的玩家,而是 DeepSeek和阿里通义千问。这并非简单的“技术偶然”,而是中国 AI 竞争的“分水岭”已经出现了。

  过去两年,国内大厂们沉迷于参数对标、榜单排名和在发布会上“吊打 GPT-4”,忙着在朋友圈晒各种看不懂的榜单,这些能在短期内赢得更多注意力。

  但从基础研究和工程演化的角度看,这种竞争方式的边际价值正在快速下降。真正进入全球研究视野的,反而是那些持续在模型架构、推理效率和成本结构上做“脏活累活”的团队。

  DeepSeek 背靠幻方量化,其技术团队长期浸泡在金融工程语境中,对算力成本、延迟控制和稳定性有着近乎苛刻的要求。在量化交易领域,算力从来不是无限变量,“如何用更少计算得到更可靠结论”本身就是核心能力。

  因此,DeepSeek 从一开始就没有将重心放在应用层叙事上,而是持续死磕推理成本与模型结构。即便没有万卡集群,只要架构足够聪明,依然可以逼近前沿能力。

  通过持续开源模型底座,阿里将模型训练、评测和场景验证的一部分成本,转化为全球开发者的协同实验。这种做法短期内看似削弱了“独占优势”,但从长期看,却显著加快了模型在真实复杂场景中的演化速度。

  在这种开放体系中,模型更容易暴露问题,也更快完成修正,从而在模拟“集体智慧”与复杂决策方面走得更远。

  反观某些还沉溺于做“套壳应用”或只顾着买流量的大厂,护城河正在变得摇摇欲坠。应用层的繁荣,建立在底层能力外包的基础之上,一旦底层模型的差距被拉开,应用层的优势往往难以长期维持。

  互联网行业从不缺跨界者,但真正成功的寥寥无几。因为底层逻辑一旦错位,再多的产品包装也只是阶段性繁荣。

  在 AI 领域,如果不能在算法或架构层贡献新的认知与方法论,那么竞争最终只会被压缩到应用层的价格战与内卷之中,而这,恰恰是最容易被后来者颠覆的地带。

  Google 的这项研究,最细思极恐的地方在于:如果 AI 内部已经能模拟“集体智慧”,那么人类精英的价值还剩下多少?

  研究提到,DeepSeek R1 等模型展现出的“内部辩论”能力,本质上,这意味着人类组织中大量依赖流程协作的岗位,将不可避免地被重新定义。

  过去,一个大型企业的重大决策deepseek,往往需要多个部门参与:市场调研、战略分析、风险评估、财务测算……

  对于字节跳动、美团、百度这类高度依赖数据与算法的公司而言,这意味着从“人机协作”向“机机协作”的过渡。

  马斯克曾多次强调:“未来所有的工作都将由 AI 完成,除非你想为了兴趣而工作。”当中国 AI 提前摸到了“集体智慧”的门槛,这种预测正加速从科幻变为现实。原文出处:算力不够,智慧来凑?Deepseek们正在摆脱算力崇拜,感谢原作者,侵权必删!

标签: deepseek

“算力不够,智慧来凑?Deepseek们正在摆脱算力崇拜” 的相关文章

1月21日DeepSeek预测:太阳vs76人,布克对决马克西,太阳客场险胜

1月21日DeepSeek预测:太阳vs76人,布克对决马克西,太阳客场险胜

  北京时间1月21日,NBA常规赛将迎来一场焦点对决,西部第七的菲尼克斯太阳队客场挑战东部第五的费城76人队。两支球队目前都处于季后赛席位争夺的关键阶段,这场比赛对双方来说都至关重要。...

千亿美金涌入中国科技股!“DeepSeek时刻”引爆价值重估

千亿美金涌入中国科技股!“DeepSeek时刻”引爆价值重估

  (交易型开放式指数基金)在纳斯达克上市,其前十大重仓股囊括了从阿里巴巴、腾讯控股、小米集团到   一场由华尔街主导的做多中国科技股浪潮正扑面而来。在这场资本盛宴的背后...

之维安科技等3家公司共同申请大气应急系统相关专利,基于DeepSeek应急处理大

之维安科技等3家公司共同申请大气应急系统相关专利,基于DeepSeek应急处理大

  1月23日消息,国家知识产权局信息显示,成都之维安科技股份有限公司、四川省环境信息中心、四川省环境应急与事故调查中心申请一项名为“基于DeepSeek的大气污染源影响的应急处理系统及方...

DeepSeek预测:乌迪内斯vs罗马!戴维斯VS苏莱巅峰对决,红狼客场1球险胜

DeepSeek预测:乌迪内斯vs罗马!戴维斯VS苏莱巅峰对决,红狼客场1球险胜

  意甲第23轮即将上演一场中游与上游的较量——排名第10的乌迪内斯坐镇弗留利球场迎战欧冠区劲旅罗马(第3)。主队近期状态飘忽不定,而客队则在双线作战中保持稳定输出deepseek。本场比...

苹果再增两家合作大模型厂商,“终端-模型”关系正重新定义

苹果再增两家合作大模型厂商,“终端-模型”关系正重新定义

  2月4日,苹果公司宣布,将在旗下旗舰编程工具Xcode中引入智能体编程功能,首次原生集成Anthropic的Claude智能体和OpenAI的Codex代码工具。  ...

DeepSeek-R1登上《自然》封面,AI大模型从“黑箱”走向透明

DeepSeek-R1登上《自然》封面,AI大模型从“黑箱”走向透明

  9月17日深夜,今年1月引发全球轰动的开源AI大模型DeepSeek-R1,在经过8个多月严格的同行评审之后,登上国际顶尖学术期刊《自然》杂志封面,成为全球首个经过同行评审的大语言模型...