当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

8个月前 (10-10)Deepseek最新资讯335

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

QuestMobile:2025年6月DeepSeek月活降至1629.5万

QuestMobile:2025年6月DeepSeek月活降至1629.5万

  QuestMobile数据显示,其月活跃用户规模从2025年3月的1936.1万降至6月的1629.5万,下滑趋势明显。   而对5月流失用户的追踪揭示了他们的去向:...

英媒:印度为什么诞生不了Nvidia或DeepSeek?

英媒:印度为什么诞生不了Nvidia或DeepSeek?

  今年,DeepSeek 从默默无闻中崭露头角,其大型语言模型被誉为中国的“斯普尼克号时刻”。它彰显了中国在硬件和软件领域的雄心。   然而,在印度,这一突破既令人沮丧...

DeepSeek预测:莱切vs国际米兰!蓝黑军团碾压小辣椒?劳塔罗剑指射手王!

DeepSeek预测:莱切vs国际米兰!蓝黑军团碾压小辣椒?劳塔罗剑指射手王!

  意甲第26轮即将上演一场实力悬殊的较量——排名第17的莱切将在维亚德尔马雷球场迎战榜首国际米兰。主队目前仅领先降级区3分,而客队则以7分优势领跑积分榜deepseek。小辣椒本赛季仅打...

11月30日DeepSeek预测:凯尔特人vs森林狼,布朗与爱德华兹巅峰对决,绿

11月30日DeepSeek预测:凯尔特人vs森林狼,布朗与爱德华兹巅峰对决,绿

  NBA常规赛即将迎来一场东西部中游球队的焦点对决,波士顿凯尔特人将客场挑战明尼苏达森林狼。两支球队目前战绩相同(10胜8负),但凯尔特人在历史交锋中以4-1占据绝对优势。本场比赛的结果...

DeepSeek下一代技术提前曝光,线上消费ETF基金(159793)翻红上涨

DeepSeek下一代技术提前曝光,线上消费ETF基金(159793)翻红上涨

  在ACL2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本...

刚刚,DeepSeek又探索新架构了,开源OCR 2

刚刚,DeepSeek又探索新架构了,开源OCR 2

  当时 DeepSeek-OCR 的出世,引起了大家对视觉压缩的关注与讨论,而这一次,DeepSeek 对视觉编码下手了。   可以说,刚刚发布的 DeepSeek-O...