当前位置:首页 > Deepseek最新资讯 > 正文内容

外媒:DeepSeek启发全球AI公司创建更便宜模型

1年前 (2025-03-03)Deepseek最新资讯541

据英国《金融时报》2日消息,包括OpenAI、微软和Meta在内的全球领先人工智能(AI)公司正在转向利用“蒸馏”技术,以创建对消费者和企业来说更便宜的人工智能模型。

报道称,中国的DeepSeek运用“蒸馏”技术创建出强大且高效的人工智能模型后,该技术引起广泛关注。报道认为,最新的进展使行业专家相信,对寻求以经济高效的方式打造应用程序的初创企业来说,这项技术将带来越来越多的益处。

Meta首席AI科学家杨立昆表示,“我们将使用(蒸馏)技术,并立即将其应用到产品中。这就是开源的全部理念。只要过程是开放的,你就能从每个人的进步中获益。”

IBM研究院负责人工智能模型的副总裁考克斯表示,大多数企业不需要庞大的模型来运行其产品,经过“蒸馏”的模型已经足够强大,可以用于客户服务聊天机器人,或在手机等较小的设备上运行。

《金融时报》指出,“蒸馏”也意味着,模型制造者花费数十亿美元来提升人工智能系统的能力时,面临着被竞争对手迅速赶上的局面。

“在一个瞬息万变的世界里……你可能会花费大量资金,采用困难的方式完成工作,但这个领域的其他人会迅速跟上。这是一种有趣而棘手的商业格局。”考克斯说

来源:中国新闻网


“外媒:DeepSeek启发全球AI公司创建更便宜模型” 的相关文章

中国军工迎来DeepSeek时刻?重视内外需双循环景气周期

中国军工迎来DeepSeek时刻?重视内外需双循环景气周期

近期,军工板块成为了市场资金聚焦与追捧的热点。随着年报和一季报的陆续披露,军工板块业绩底部特征愈发明显。展望后续,随着订单逐步落地并完成交付,其业绩有望实现逐季回升。在内需稳步增长以及军贸需求不断释放...

DeepSeek V3模型重磅升级!腾讯/微美全息加速AI大模型“上车”多场景落地

DeepSeek V3模型重磅升级!腾讯/微美全息加速AI大模型“上车”多场景落地

获悉,3月25日,中国人工智能初创公司深度求索DeepSeek宣布V3版本升级,实测表现远超预期。目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度...

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是D...

DeepSeek对话满了怎么办:全面解决方案指南

DeepSeek对话满了怎么办:全面解决方案指南

DeepSeek对话满了怎么办:全面解决方案指南一、引言DeepSeek作为一款功能强大的人工智能对话模型,凭借其高效的对话生成、信息分析和任务执行能力,在企业和个人用户中广受欢迎。然而,随着使用频率...

开箱即用AI力!华为云MaaS解锁DeepSeek-R1-0528超能推理

开箱即用AI力!华为云MaaS解锁DeepSeek-R1-0528超能推理

小更新,大智慧,新版DeepSeek-R1-0528模型正式开源,该模型在数学推理、代码生成等关键能力上实现显著突破,已成为开源领域高性能推理模型的新标杆。目前华为云已针对该模型完成了基于昇腾AI云服...

湘江新区多领域拥抱DeepSeek,“解锁”发展新路径

湘江新区多领域拥抱DeepSeek,“解锁”发展新路径

红网时刻新闻记者 王娟娟 长沙报道随着DeepSeek的爆火,一场围绕人工智能大模型的产业变革正悄然兴起。在新技术浪潮来袭之际,湘江新区拥抱DeepSeek的热情高涨。当政务遇上DeepSeek,将带...