当前位置:首页 > Deepseek最新资讯 > 正文内容

微博自研模型VibeThinker:仅15亿参数、7800美元训练成本,性能对标

5个月前 (11-19)Deepseek最新资讯211

  当整个AI行业陷入“参数竞赛”的狂热时,微博AI交出了一份出乎意料的答卷,为沸腾的大模型战场开辟了一条充满想象力的新路径。

  近日,微博正式发布首个自研开源大模型VibeThinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶尖数学竞赛基准测试上击败了参数量是其数百倍的,高达6710亿的DeepSeek R1模型。

  更令人瞩目的是,其单次“后训练”的成本仅7800美元,对比DeepSeek-R1和MiniMax-M1等成本直接降低了几十倍。这一突破不仅重新定义了大模型的技术评价标准,更有望推动AI产业从“规模竞赛”转向“效率革命”。

  在AI发展史上,参数量曾被视为衡量模型能力的核心指标。行业普遍认为,复杂推理能力需要1000亿以上参数才能涌现,而小模型则因无法处理高难度问题被视为“天生不足”。

  但如果从小模型入手,通过巧妙的训练策略,能否挖掘出隐藏的推理能力?微博自研开源大模型VibeThinker,给出了行业一个肯定的答案。

  当大多数AI厂商仍遵循着“规模扩大即智能提升”的 Scaling Law法则时,微博AI研发人员转而优化模型结构和训练范式,并创新提出了“频谱到信号原理”(SSP)方法训练,创造出了一个仅拥有15亿参数的“轻量级选手”,但在AI竞技场上战胜了超越其数百倍体量的“巨人”。

  VibeThinker一经发布,立即引起了全球AI研究界的广泛关注,因其在一系列涵盖数学、编码的权威基准测试中,交出了一份出乎意料的答卷:

  VibeThinker雄辩地证明,通过精巧的算法设计和训练策略,一个小规模模型完全有潜力在复杂的逻辑推理任务上,达到甚至超越那些体量庞大数百倍的巨型模型,更为AI产业的成本结构、技术路线和资本布局带来了全新的思考路径。

  需要说明的是,VibeThinker目前发布的版本尚处于实验性版本,其研发重点主要集中于极大强化小模型复杂数学与竞赛编程等方面的能力,其在日常聊天等能力还没有做过针对性训练优化,所以暂不适合作为日常聊天工具进行互动,更适用于数学和代码等高智能应用场景。

  训练成本一直是制约AI技术普及的关键瓶颈,VibeThinker的成就不仅在于惊艳的性能,更在于其极致的成本效益。

  根据公开数据,2025年主流大模型单次后训练(Post-Training)成本普遍在数十万美元级别。上海AI企业MiniMax于今年6月发布的M1模型,使用512块H800 GPU训练三周,租赁成本约53.5万美元,创始人发文表示:“第一次感觉到大山不是不能翻越。”

  今年9月,AI初创公司DeepSeek(深度求索)的论文登上《自然》杂志。论文首次揭示了训练R1的成本:仅为29.4万美元。这不包括DeepSeek公司在开发R1所基于的基础LLM上花费的约600万美元,但总成本仍然远低于竞争对手模型被认为花费的数千万美元。

  在这样的行业背景下,VibeThinker整个后训练过程(包括SFT和RL阶段)总共只花费了约3900个GPU小时deepseek。按照当时的市场租赁价格,总计算成本仅7800美元。

  这也意味着,其用不到8000美元的成本,达到了需要花费30万甚至50万美元才能企及的性能水平,成本效益比达到了惊人的30到60倍。

  这种成本上的显著优势,也意味着强大的AI推理能力不再是少数科技巨头的专利,技术资源得以普惠,更多中小型公司、研究机构和大学,都有机会参与到前沿AI创新开发中来,极大地促进了AI研究的普惠化,推动整个行业朝着更开放、更多元、更具活力的方向发展。

  微博积极拥抱人工智能发展趋势,全面促进AI技术在多项业务场景的落地。2024年,微博自主研发“知微”大语言模型,并成功通过备案,更陆续推出微博智搜、内容总结、AI互动号等前沿功能,优化用户体验,提升内容生产和互动效率。

  一是微博智搜,它通过深度分析平台内海量优质内容,构建可信知识图谱,实现“精准捕捉用户需求、理解情感与场景”的突破性体验,6月智搜月活跃用户突破5000万;

  二是评论罗伯特,作为AI互动账号,它从毒舌风格起步,逐渐进化出温情与聪明版本,成为广大用户“又爱又恨”的交流对象,全网粉丝近200万,展现了AI评论助手的另一种可能性。

  立足于自研大模型VibeThinker,微博的未来规划凸显了鲜明的“数据赋能”路径。公司计划深度融合其在心理等垂直领域积累的独特数据资产,目标是打造一个更洞悉公众情绪、更能服务社会化需求的专属模型。微博不仅是在优化一个大模型,更是在解锁其数据生态的深层价值,以提供更精准、更懂用户心理状态的下一代社交服务。

  VibeThinker的强大技术能力,或将成为驱动微博AI应用“多点开花”的核心引擎,深度融入平台全业务生态。未来,VibeThinker有望在微博智搜等核心AI产品中落地,不仅能持续提升用户使用体验,更有望打破场景边界,裂变出兼具社交属性与智能服务的 下一个“社交超级生态”。

  此外,VibeThinker的技术突破有望大幅降低微博AI应用成本。无论是智能搜索的算力损耗,还是实时互动场景的AI响应成本,都将得到高效优化,让平台在规模化投入AI能力时无需承担过高的资源压力,进一步释放微博的生态创新能力,为用户带来更丰富、更便捷的智能体验。原文出处:微博自研模型VibeThinker:仅15亿参数、7800美元训练成本,性能对标千亿级模型,感谢原作者,侵权必删!

标签: deepseek

“微博自研模型VibeThinker:仅15亿参数、7800美元训练成本,性能对标” 的相关文章

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路

  AI圈,不同的公司似乎都有着自己独特的发布节奏,比如OpenAI和Google喜欢相互“狙击”,在国内被津津乐道的,可能要属DeepSeek的“节前上新”。   一张...

DeepSeek预测:佛罗伦萨VS那不勒斯!孔蒂不败神话遭终结?德布劳内率队冲击

DeepSeek预测:佛罗伦萨VS那不勒斯!孔蒂不败神话遭终结?德布劳内率队冲击

  意甲第3轮焦点战,佛罗伦萨将在弗兰基球场迎战领头羊那不勒斯。主队目前2轮皆平(进球1/失球1)排名第12,场均仅0.5个进球的效率位列联赛倒数第四。反观孔蒂执教的那不勒斯两战全胜且一球...

2月27日DeepSeek预测:奇才vs老鹰,老鹰主场再擒奇才?特雷杨缺阵成变数

2月27日DeepSeek预测:奇才vs老鹰,老鹰主场再擒奇才?特雷杨缺阵成变数

  北京时间2月27日早8:30,华盛顿奇才(16胜41负,东部第13)将造访州立农业球馆挑战亚特兰大老鹰(29胜31负,东部第9)。这是两队三天内第二次交手,在2月25日的对决中,老鹰以...

DeepSeek R2发布延期,技术难题与芯片适配成关键挑战

DeepSeek R2发布延期,技术难题与芯片适配成关键挑战

  近日,关于DeepSeek R2模型迟迟未能发布的问题引发了广泛关注。有消息称,在研发过程中,DeepSeek遭遇了一系列技术挑战,尤其是在使用华为昇腾芯片进行训练时出现了持续性难题,...

年度人才报告: AI产品经理岗位量增幅369%

年度人才报告: AI产品经理岗位量增幅369%

  中国日报12月15日电(记者 李佳颖)近日,脉脉高聘发布《2025年度人才迁徙报告》(以下简称《报告》)。《报告》显示,2025年1-10月,人才求职压力增加,新经济行业整体人才供需比...

DeepSeek优化排名新策略:GEO技术助力企业成为AI推荐首选

DeepSeek优化排名新策略:GEO技术助力企业成为AI推荐首选

  一家中型企业的市场总监最近碰到个扎心事儿:过去俩月在传统搜索引擎上砸的钱,几乎没换来半个新客户。后来一查才发现,超过一半的目标客户早改了习惯 —— 想找推荐,直接问 DeepSeek...