当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

6个月前 (10-10)Deepseek最新资讯331

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

12月29日DeepSeek预测:国王vs湖人,东契奇率队捍卫主场,湖人险胜国王

12月29日DeepSeek预测:国王vs湖人,东契奇率队捍卫主场,湖人险胜国王

  北京时间12月29日,NBA常规赛将迎来一场西部对决,洛杉矶湖人将在主场迎战萨克拉门托国王。湖人目前以19胜10负的战绩排名西部第五,而国王则以8胜23负的战绩排名西部第十四。本场比赛...

12月29日DeepSeek预测:76人vs雷霆,亚历山大率队捍卫主场

12月29日DeepSeek预测:76人vs雷霆,亚历山大率队捍卫主场

  北京时间12月29日凌晨4:30,NBA常规赛将迎来一场焦点对决,东部第六的费城76人(16胜13负)客场挑战西部第一的俄克拉荷马雷霆(26胜5负)。尽管76人作为历史豪门拥有恩比德、...

DeepSeek发布两款新模型,AI产业链景气趋势持续验证,科创创业人工智能ET

DeepSeek发布两款新模型,AI产业链景气趋势持续验证,科创创业人工智能ET

  同一日,可灵AI正式发布其全新产品“可灵O1”,定位为首个大一统的多模态创作工具。可灵O1基于全新的视频和图像模型,整合文字deepseek、视频、图片、主体等多模态输入,将所有生成和...

IDC最新报告:百度AI搜索登顶国内最佳通用AI搜索

IDC最新报告:百度AI搜索登顶国内最佳通用AI搜索

  也是中方相应环球南方呼声、助力弥合数字和智能鸿沟、匆匆进人工智能向善普惠成长的实际行径。星火·政务底座可实现政务常识问答、案牍天生、表格智能阐发等场景化使用,人工智能在带来前所未有机遇...

堪比DeepSeek时刻!在美中国科技ETF六周连吸金,中国成股票投资首选市场

堪比DeepSeek时刻!在美中国科技ETF六周连吸金,中国成股票投资首选市场

  截至9月19日当周,美国交易的中国科技股ETFKraneShares金瑞中证中国互联网ETF(KWEB)连续第六周获得资金流入,创下今年2月DeepSeek时刻以来的最长纪录。不过最新...

美媒称要向DeepSeek学习

美媒称要向DeepSeek学习

  【#美媒称要向DeepSeek学习#】#东南亚成中国微短剧核心粉丝区# “中国变酷了!”2025年,谈及中国的海外吸引力与好感度,“酷炫中国”成为外媒高频评价词。这一年,中国文化创意之...