当前位置:首页 > Deepseek最新资讯 > 正文内容

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

8个月前 (08-14)Deepseek最新资讯440

  Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

  说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

  结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

  就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

  这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

  他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

  最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

  通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。

  最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

  离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众。

  而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。

  从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

  相较于主流的大语言模型,主打开源、小快灵的Mistraldeepseek,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

  同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

  截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。原文出处:被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了,感谢原作者,侵权必删!

标签: deepseek

“被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了” 的相关文章

一场睡眠科技共创,慕思AI破局智能感知与交互

一场睡眠科技共创,慕思AI破局智能感知与交互

  中国睡眠研究会发布的《2025年中国睡眠健康调查报告》显示,中国超3亿人存在睡眠障碍,其中约1.5亿人需积极干预,而且,睡不着、睡不醒、睡不好等睡眠障碍问题,呈现出年轻化的趋势。...

刚刚,DeepSeek发布更新

刚刚,DeepSeek发布更新

  DeepSeek更新日志显示,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上...

2025百度热搜影响力报告发布:九三阅兵、哪吒2、DeepSeek R1上榜

2025百度热搜影响力报告发布:九三阅兵、哪吒2、DeepSeek R1上榜

  上证报中国证券网讯(记者 罗茂林)日前,百度热搜与中国广视索福瑞媒介研究(CSM)联合发布《2025百度热搜影响力报告》。报告显示,九三阅兵、《哪吒2》中国票房第一、DeepSeek...

腾讯云上线DeepSeek-V3.1模型API,智能体开发平台和 TI 平台同步

腾讯云上线DeepSeek-V3.1模型API,智能体开发平台和 TI 平台同步

  8月22日,腾讯云上线DeepSeek-V3.1版本,企业和开发者可以通过腾讯云直接调用新版模型的API接口,获得稳定优质的服务。同时,腾讯云智能体开发平台(ADP)也接入了新版模型,...

没有商业模式--DeepSeek最坚固的“护城河”

没有商业模式--DeepSeek最坚固的“护城河”

  在全球AI巨头都被资本裹挟着必须赚钱的时候,DeepSeek是唯一一个可以不计成本、不看脸色、只为AGI梦想狂奔的“自由人”。幻方量化(去年回报率53%)超级“印钞机”兜底之下,Dee...

首个国际物流AI操作系统 CargoWareX 发布,开创物流供应链全链路、多角

首个国际物流AI操作系统 CargoWareX 发布,开创物流供应链全链路、多角

  WallTech发布行业首款AI驱动的全球物流平台CargoWareX,以“超级控制塔”模式颠覆传统协作,实现全球多角色在线协同、全链路实时可视,标志着国际物流迈入AI时代。...