当前位置:首页 > Deepseek最新资讯 > 正文内容

“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快

4个月前 (12-17)Deepseek最新资讯114

  12月17日,在2025小米“人车家全生态合作伙伴大会”上,有“天才少女”之称的罗福莉,完成了加入小米之后的首次公开演讲,并详述了小米在大模型领域的最新进展。

  公开资料显示,罗福莉是一位95后AI研究者,硕士期间曾在国际顶级会议ACL上发表多篇论文,毕业后加入阿里巴巴达摩院,主导开发了多语言预训练模型VECO。之后,罗福莉转战DeepSeek,是MoE大模型DeepSeek-V2的关键开发者之一。2024年年底,有报道称,罗福莉被小米集团创始人雷军以千万年薪挖走,或将担任小米AI实验室的大模型团队负责人。

  “大模型通过语言的爆发,通过Scaling(扩展)算力和数据,从而理解了人类的思维和对世界的理解。”

  此次公开演讲中,罗福莉以小米MiMo大模型负责人亮相。她表示,小米从语言出发,构建了全新一代面向Agent(智能体)的基座模型——MiMo-V2-Flash。

  “MiMo-V2-Flash的总参数为309B,激活参数只有15B。但它的代码能力和Agent能力在世界级公开公正的评估榜单上,已经进入了全球开源模型Top 1-2的行列。”

  罗福莉表示,基本上,MiMo-V2-Flash大部分评估基准已经超过或者与DeepSeek-V3、Kimi、Qwen等模型相当,而这些模型的总参数量通常是MiMo-V2-Flash的两倍到三倍。

  据罗福莉介绍,在推理价格和推理速度方面,MiMo-V2-Flash比DeepSeek-V3.2,更便宜一点,但推理速度大概是其的三倍。“再比如Gemini 2.5 Pro,虽然综合性能相当,且推理速度差不多,但Gemini 2.5 Pro的推理成本比 MiMo-V2-Flash贵了整整20倍。”

  目前,MiMo-V2-Flash已经开源了所有模型权重,并同步了技术报告细节,提供了API供开发者接入Web Coding IDE。

  “虽然现在的大模型能聊天、能写代码,但我相信大家还是不放心把身边复杂的任务交给它。我认为真正的下一代智能体系统,不应该只是一个语言模拟器,而是需要跟世界共存。”

  罗福莉表示,下一代智能体必须具备两个潜能:第一,从“回答问题”变成“完成任务”。这不仅需要记忆、推理、规划能力,更需要一个Omni(全模态)的感知能力。有了这个基础,模型才能无缝嵌入到像眼镜这样的智能终端,融入我们的生活流deepseek

  第二,构建物理模型。现有大模型本质上是用算力的“暴力美学”攻克了顶层的语言和第二层的强化学习,但跳过了中间对世界的感知和模拟,以及底层的实体交互。这就是为什么大模型能做奥数、模仿莎士比亚,却不懂重力等物理法则,经常产生具身幻觉。

  因此,AI进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型。这意味着AI能力的本质跨越——不仅仅是看懂画面,而是理解背后的物理规律;不仅仅是处理文本,而是推演世界的运作逻辑。

  小米集团总裁卢伟冰表示,具体到今年,预计小米研发投入将达到320-330亿元,2026年预计投入约400亿。

  据卢伟冰介绍,今年4月以来,小米陆续推出了Xiaomi MiMo语言、多模态、语音系列基座大模型,并面向全球开发者开源;11月,小米还发布了智能家居未来探索方案Xiaomi Miloco和具身大模型MiMo-Embodied,同样面向全球开发者全面开源。

  小米专为物联网领域定制的轻量化操作系统Xiaomi Vela,开源版本openvela此前已在GitHub、Gitee、GitCode三大平台全面开源,目前,openvela全球合作伙伴已突破100家,深度赋能1500个种类产品,搭载Xiaomi Vela系统设备数已超过1.6亿台。

  此外,小米全球月活跃用户数达到7.42亿;硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家;软件生态方面,小米全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿。

  在此基础上,小米汽车CarIoT宣布已向汽车行业全面开放,为汽车厂商和硬件制造伙伴提供统一的生态硬件接口、车载生态件产品。原文出处:“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快三倍,感谢原作者,侵权必删!

标签: deepseek

““天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快” 的相关文章

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

  【新智元导读】DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器deepseek。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像...

机器人会颠勺,口味不“翻车”!厨纪让天下没有难做的中餐

机器人会颠勺,口味不“翻车”!厨纪让天下没有难做的中餐

  一日三餐,四方食事。餐饮这一绑定着千家万户的烟火产业,是中国消费市场中活力最足、体量最大的赛道之一。iiMedia Research(艾媒咨询)发布的《2025-2026年中国食品风味...

拆解一品威客平台AI引擎:如何精准匹配创意需求

拆解一品威客平台AI引擎:如何精准匹配创意需求

  在创意经济蓬勃发展的今天,每天有不少企业创意需求与服务商在数字平台中擦肩而过。云南个体户如何精准找到上海的设计师?贵州初创企业如何高效对接北京开发团队?一品威客平台的AI智能匹配引擎,...

Deepseek推荐全国旅游百强区第63名:浙江绍兴市越城区

Deepseek推荐全国旅游百强区第63名:浙江绍兴市越城区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

DeepSeek预测:皇家马德里VS瓦伦西亚!姆巴佩11球领跑,银河战舰主场碾压

DeepSeek预测:皇家马德里VS瓦伦西亚!姆巴佩11球领跑,银河战舰主场碾压

  西甲第11轮焦点战,领头羊皇家马德里坐镇伯纳乌迎战深陷降级区的瓦伦西亚。银河战舰目前9胜1负积27分领跑,场均轰入2.2球的火力冠绝联赛;而蝙蝠军团仅2胜3平5负deepseek,最近...

住建部GBT50500-2024《建设工程工程量清单计价标准》解析及Deepse

住建部GBT50500-2024《建设工程工程量清单计价标准》解析及Deepse

  2024年12月30日住建部正式发布《建设工程工程量清单计价标准》GB/T50500-2024,新版《清单计价标准》的出台将为工程造价精细化管理带来一场新的革命,同时也给各单位相关管理...