当前位置:首页 > Deepseek最新资讯 > 正文内容

“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快

6个月前 (12-17)Deepseek最新资讯116

  12月17日,在2025小米“人车家全生态合作伙伴大会”上,有“天才少女”之称的罗福莉,完成了加入小米之后的首次公开演讲,并详述了小米在大模型领域的最新进展。

  公开资料显示,罗福莉是一位95后AI研究者,硕士期间曾在国际顶级会议ACL上发表多篇论文,毕业后加入阿里巴巴达摩院,主导开发了多语言预训练模型VECO。之后,罗福莉转战DeepSeek,是MoE大模型DeepSeek-V2的关键开发者之一。2024年年底,有报道称,罗福莉被小米集团创始人雷军以千万年薪挖走,或将担任小米AI实验室的大模型团队负责人。

  “大模型通过语言的爆发,通过Scaling(扩展)算力和数据,从而理解了人类的思维和对世界的理解。”

  此次公开演讲中,罗福莉以小米MiMo大模型负责人亮相。她表示,小米从语言出发,构建了全新一代面向Agent(智能体)的基座模型——MiMo-V2-Flash。

  “MiMo-V2-Flash的总参数为309B,激活参数只有15B。但它的代码能力和Agent能力在世界级公开公正的评估榜单上,已经进入了全球开源模型Top 1-2的行列。”

  罗福莉表示,基本上,MiMo-V2-Flash大部分评估基准已经超过或者与DeepSeek-V3、Kimi、Qwen等模型相当,而这些模型的总参数量通常是MiMo-V2-Flash的两倍到三倍。

  据罗福莉介绍,在推理价格和推理速度方面,MiMo-V2-Flash比DeepSeek-V3.2,更便宜一点,但推理速度大概是其的三倍。“再比如Gemini 2.5 Pro,虽然综合性能相当,且推理速度差不多,但Gemini 2.5 Pro的推理成本比 MiMo-V2-Flash贵了整整20倍。”

  目前,MiMo-V2-Flash已经开源了所有模型权重,并同步了技术报告细节,提供了API供开发者接入Web Coding IDE。

  “虽然现在的大模型能聊天、能写代码,但我相信大家还是不放心把身边复杂的任务交给它。我认为真正的下一代智能体系统,不应该只是一个语言模拟器,而是需要跟世界共存。”

  罗福莉表示,下一代智能体必须具备两个潜能:第一,从“回答问题”变成“完成任务”。这不仅需要记忆、推理、规划能力,更需要一个Omni(全模态)的感知能力。有了这个基础,模型才能无缝嵌入到像眼镜这样的智能终端,融入我们的生活流deepseek

  第二,构建物理模型。现有大模型本质上是用算力的“暴力美学”攻克了顶层的语言和第二层的强化学习,但跳过了中间对世界的感知和模拟,以及底层的实体交互。这就是为什么大模型能做奥数、模仿莎士比亚,却不懂重力等物理法则,经常产生具身幻觉。

  因此,AI进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型。这意味着AI能力的本质跨越——不仅仅是看懂画面,而是理解背后的物理规律;不仅仅是处理文本,而是推演世界的运作逻辑。

  小米集团总裁卢伟冰表示,具体到今年,预计小米研发投入将达到320-330亿元,2026年预计投入约400亿。

  据卢伟冰介绍,今年4月以来,小米陆续推出了Xiaomi MiMo语言、多模态、语音系列基座大模型,并面向全球开发者开源;11月,小米还发布了智能家居未来探索方案Xiaomi Miloco和具身大模型MiMo-Embodied,同样面向全球开发者全面开源。

  小米专为物联网领域定制的轻量化操作系统Xiaomi Vela,开源版本openvela此前已在GitHub、Gitee、GitCode三大平台全面开源,目前,openvela全球合作伙伴已突破100家,深度赋能1500个种类产品,搭载Xiaomi Vela系统设备数已超过1.6亿台。

  此外,小米全球月活跃用户数达到7.42亿;硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家;软件生态方面,小米全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿。

  在此基础上,小米汽车CarIoT宣布已向汽车行业全面开放,为汽车厂商和硬件制造伙伴提供统一的生态硬件接口、车载生态件产品。原文出处:“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快三倍,感谢原作者,侵权必删!

标签: deepseek

““天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快” 的相关文章

DeepSeek将发布具备强劲编程能力的下一代旗舰AI模型

DeepSeek将发布具备强劲编程能力的下一代旗舰AI模型

  格隆汇1月9日|据两位知情人士透露,中国AI初创公司DeepSeek预计将在未来几周内推出其具有强大编程能力的下一代AI模型。这款名为V4的新模型是DeepSeek在2024年12月发...

DeepSeek预测:布莱顿vs曼城!哈兰德能否轰爆海鸥防线?预测3-1蓝月军团

DeepSeek预测:布莱顿vs曼城!哈兰德能否轰爆海鸥防线?预测3-1蓝月军团

  英超第3轮即将上演一场看似悬殊的对决——排名18的布莱顿主场迎战第6的曼城。但翻开历史交锋,海鸥军团近5次面对蓝月亮竟取得2胜2平1负!上赛季更是客场2-2逼平曼城,主场2-1爆冷取胜...

DeepSeek助力算力与算法平权,AI界聚焦高质量数据集 数博会

DeepSeek助力算力与算法平权,AI界聚焦高质量数据集 数博会

  “DeepSeek的开源推动了算力和算法的平权,但数据平权仍面临挑战。”北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏在接受《中国经营报》记者采访时指出,高质量数...

DeepSeek预测:西汉姆联vs热刺!铁锤帮主场恐遭血洗,约翰逊+库杜斯双星闪

DeepSeek预测:西汉姆联vs热刺!铁锤帮主场恐遭血洗,约翰逊+库杜斯双星闪

  英超第4轮即将迎来一场伦敦德比,西汉姆联将在主场迎战热刺。目前,西汉姆联排名第16,积3分,而热刺排名第4,积6分。这场比赛对于双方来说都至关重要,尤其是西汉姆联,他们需要在主场止住颓...

12月4日DeepSeek预测:马刺vs魔术,文班亚马缺阵魔术主场占优

12月4日DeepSeek预测:马刺vs魔术,文班亚马缺阵魔术主场占优

  NBA常规赛迎来一场东西部强强对话,奥兰多魔术将在主场迎战圣安东尼奥马刺。魔术作为东部知名球队,目前以13胜8负排名东部第五,而马刺则以14胜6负位列西部第四。本场比赛的胜负将对两队的...

2025年10月deepseek关键词排名优化推荐:市场报告与评测列表

2025年10月deepseek关键词排名优化推荐:市场报告与评测列表

  当企业在2025年第四季度冲刺全年KPI时,DeepSeek、豆包、通义千问等生成式引擎的日均调用量已突破30亿次,关键词可见度直接决定流量入口。工信部《生成式AI搜索生态白皮书》显示...