当前位置:首页 > Deepseek最新资讯 > 正文内容

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

2个月前 (02-24)Deepseek最新资讯67

  2.4万个虚假账号,与Claude进行了约1600万次交互,用来抽取模型能力训练自家模型。Anthropic称,这种行为并非正常使用,而是系统化、工业级的能力提取。他们形容为“hydra cluster”,即一个网络同时管理大量账号,请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力。

  所谓“蒸馏”(distillation),是AI领域常见的训练方法。简单来说,就是利用一个性能更强的“教师模型”生成输出数据,再用这些数据训练一个“学生模型”,从而在参数规模更小、成本更低的情况下复现部分能力。

  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。

  此次争议的焦点在于方式与规模。Anthropic称,这三家公司通过共享支付方式、代理服务和批量化请求结构,系统性抽取Claude在推理能力deepseek、思维链输出、Agent工具使用以及编程能力等方面的表现。

  具体而言,DeepSeek被指进行超过15万次交互,侧重推理能力与思维链数据;Moonshot AI约340万次交互,聚焦Agent能力与工具调用;MiniMax数量最大,约1300万次交互,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标。

  Anthropic表示,他们通过行为识别与异常检测模型发现这一模式,并强调这种行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。

  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,发帖直言, Anthropic 本身也曾因训练数据问题饱受争议,并讽刺称:“你偷来的东西被偷了?”

  据悉,此前,2023年Elon Musk就曾对Anthropic蒸馏其它大模型公司的数据进行嘲讽。

  需要指出的是,Anthropic此前确实曾卷入过关于训练数据来源的版权诉讼,并支付了巨额赔偿,目前相关争议仍处于法律与舆论层面的博弈中。

  并且就在事件发生不久后,Elon Musk又转载一AI科技业内人士的帖子称,Anthropic公司没有得到任何人的同情。他们利用公共数据构建的封闭模式攫取价值,并招致我们目前所见的监管俘获。他们既想继续利用现有数据,又想通过特殊规则来保护自身利润。并直言到,当技术具有如此颠覆性时,这种模式无疑是有害且具有腐蚀性的。

  围绕本次指控,行业内部也出现不同声音。一部分观点认为,本次争议的重点并不在蒸馏技术本身,而在具体实施方式。如果确实存在大量虚假账号、批量化请求、结构化提取模型核心能力的行为,且绕过服务条款或地区限制,那么问题已超出技术范畴,可能涉及商业合规与不正当竞争。

  也有创作者和评论者表达更为情绪化的观点,声称他们并不在乎其它公司对 Claude 进行“蒸馏”的做法。并且有评论认为,大模型本身建立在互联网公开数据之上,训练数据来源长期处于版权争议之中。在这种背景下,再以“能力被蒸馏”为由指责竞争对手,难免被解读为“贼喊抓贼”。如果AI公司可以在未经明确授权的情况下使用互联网内容训练模型,那么当模型能力被“蒸馏”迁移时,批评者的立场显得并不牢固。

  从商业常识角度看,若存在绕过平台规则、大规模抽取核心能力的行为,确实容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前尚缺乏清晰的法律标准。

  这场黑色幽默之下,问题的关键也指向:蒸馏本身是行业常规技术,用强模型输出训练弱模型,本质上并不罕见。但当规模扩大到数千万次调用、并以虚假账号批量操作时,它究竟是正常竞争,还是违规抽取?

  事实上,包括 OpenAI 在内的多家头部企业,也曾在不同场景中采用蒸馏技术进行模型优化。区别在于,内部蒸馏与基于竞品输出训练模型之间,是否存在明确边界,目前仍缺乏统一标准。

  当模型能力可以通过输出被“迁移”时,问题的核心早已不在技术本身,而在规则如何界定:什么属于合理使用,什么构成系统性能力抽取?巨头之间互相蒸馏的边界,仍然有待进一步厘清。原文出处:Anthropic声称被Deepseek蒸馏!马斯克为啥怼?,感谢原作者,侵权必删!

标签: deepseek

“Anthropic声称被Deepseek蒸馏!马斯克为啥怼?” 的相关文章

DeepSeek预测:巴黎圣日耳曼VS雷恩!姆巴佩接班人PK法甲射手王,3-1血

DeepSeek预测:巴黎圣日耳曼VS雷恩!姆巴佩接班人PK法甲射手王,3-1血

  法甲第15轮即将上演欧冠区卡位战!卫冕冠军巴黎圣日耳曼坐镇王子公园球场迎战黑马雷恩,这场价值6分的对决将直接影响下赛季欧战席位归属。让我们用数据拆解这场焦点大战!  ...

1月30日DeepSeek预测:国王vs76人,76人主场力克国王,恩比德马克西

1月30日DeepSeek预测:国王vs76人,76人主场力克国王,恩比德马克西

  北京时间1月30日,NBA常规赛将迎来一场东西部对决,费城76人将在主场迎战萨克拉门托国王。76人目前以25胜21负的战绩排名东部第6,而国王则以12胜36负的战绩排名西部第14。本场...

DeepSeek V4计划10月到来:实现100万文本理解,国产AI芯片训练

DeepSeek V4计划10月到来:实现100万文本理解,国产AI芯片训练

  这几年各大厂商都在研发最新的AI模型,对于国内厂商来说,毫无疑问DeepSeek最受大家的欢迎deepseek,在今年年初凭借DeepSeek R1引爆全网,不过毕竟AI模型日新月异,...

2月4日DeepSeek预测:掘金vs活塞,约基奇对决康宁汉姆,活塞主场险胜

2月4日DeepSeek预测:掘金vs活塞,约基奇对决康宁汉姆,活塞主场险胜

  NBA常规赛即将迎来一场东西部强强对话,东部领头羊活塞将在主场迎战西部第三的掘金。两支球队近期状态火热,活塞以36胜12负高居东部第一,而掘金则以33胜17负位列西部第三。本场比赛不仅...

小摩:AI和DeepSeek的崛起提升三大电讯商潜力 首选中国电信

小摩:AI和DeepSeek的崛起提升三大电讯商潜力 首选中国电信

  摩根大通发布研报称,中国电讯业营运商的股价在2019年至2024年间表现超过恒指,差距达到双位数,而本年迄今的表现优于市场deepseek。该行指出,前三大电信营运商不仅提供具吸引力的...

DeepSeek回应变冷淡,技术升级与用户需求调整所致

DeepSeek回应变冷淡,技术升级与用户需求调整所致

  【#DeepSeek回应被指冷淡#】#DeepSeek变冷淡系多种原因造成# 2月13日,国产AI助手DeepSeek因技术升级被用户吐槽“变冷淡”,相关话题#Deepseek被指变冷...