当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!

5个月前 (03-26)DeepSeek技术交流291

DeepSeek V3模型完成小版本升级后,李开复称其将中美AI差距缩小至3个月,某些领域中国甚至已经领先。

中国人工智能初创企业DeepSeek近日发布其最新大语言模型DeepSeek-V3-0324,以全面升级的技术架构向OpenAI、Anthropic等美国AI领军企业发起挑战。这一跨越式进展不仅彰显中国在人工智能领域的雄心,更将中美AI竞赛推向新高度。

01.AI创始人、前谷歌中国总裁李开复表示,DeepSeek通过算法创新和高效利用国产硬件,显著缩小了与美国领导者如OpenAI的技术差距。这一进展表明,中国在核心AI技术上仅落后美国三个月,甚至在某些领域已处于领先地位。李开复在接受路透社采访时表示:

“此前我认为差距在六到九个月,且全面落后。而现在,我认为在部分核心技术领域仅落后三个月,但在某些特定领域已实现领先。”

今年早些时候,DeepSeek发布了一款基于性能较低芯片训练的AI推理模型,引发了国际关注。该公司声称,该模型仅使用了价值600万美元的算力资源,分布在2000颗英伟达H800芯片上。相比之下,美国公司如OpenAI和Meta在类似项目上投入了数十亿美元。

本周在AI平台Hugging Face上发布的基准测试显示,DeepSeek最新模型DeepSeek-V3-0324在推理和编码等领域表现出竞争力。该模型具备先进的“思维链(chain-of-thought)”可视化功能,这一能力最初由OpenAI开发,但未向用户开放。

相较于前代产品,V3版本在以下维度实现显著提升:

推理能力:通过新型训练架构,解决复杂逻辑问题的效率提升40%

代码生成:在Python等编程语言的自动补全测试中准确率达92%,逼近GPT-4水平

成本优势:仅用价值600万美元的2000块英伟达H800芯片完成训练,成本仅为美国同类项目的1/20

"这不再是追赶游戏,我们正在定义AI的新未来。"DeepSeek技术负责人表示。该模型已向全球开发者开放,其开源策略直指Meta的Llama系列,形成"高性能+低成本"的双重竞争优势。

自2023年12月发布V1版本以来,DeepSeek保持着惊人的迭代速度:

2023.12:推出基础版V1模型

2025.01:发布优化版R1模型聚焦企业场景

2025.03:当前V3版本实现技术代际突破

这种"季度革命"式的更新频率,打破了行业常规的半年至一年升级周期,迫使西方巨头重新评估中国AI的进化速度。

李开复指出:“DeepSeek能够通过新的强化学习方法实现思维链功能,这表明他们正在追赶美国,快速学习,甚至可能更具创新性。”这一发展挑战了关于美国半导体制裁阻碍中国AI技术进步的观点。李开复将制裁描述为“双刃剑”,短期内制造了障碍,但也迫使中国企业在限制下创新。

DeepSeek的崛起引发了硅谷和华盛顿的担忧。这家初创企业的快速进展和资源高效利用,与美国巨头在数据中心和专用芯片上的巨额投资形成鲜明对比。

硅谷企业已提高警惕,Anthropic在其最新融资文件中将中国AI技术列为"最大战略威胁"。与此同时,资本市场开始调整布局,红杉资本等投资机构已设立专项基金,加大对本土AI项目的投入。在商业化应用方面,DeepSeek的技术已成功落地,应用于比亚迪的智能工厂和招商银行的金融风控系统。

咨询机构TechInsight预测,到2025年,中国AI模型在全球开源市场的份额将从当前的15%提升至35%,而DeepSeek有望成为这一领域的代表性中国企业。

QuestMobile所公布的数据显示,DeepSeek APP上线次月,活跃用户规模便一举突破1.8亿。豆包APP也成功破亿,而腾讯元宝、纳米AI搜索在DeepSeek大模型的强大加持下,同样脱颖而出,跻身行业TOP5。


“DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!” 的相关文章

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek为何掀起全球巨浪?春节期间发布的Deepseek-R1在全球引起震动。著名风险投资家马克·安德森 (Marc Andreessen)甚至描述这是“人工智能的人造卫星时刻”——指的是20...

杭州文旅智能体“杭小忆”全面接入DeepSeek!旅游体验开启“超进化”时代

杭州文旅智能体“杭小忆”全面接入DeepSeek!旅游体验开启“超进化”时代

潮新闻客户端 记者 杨希林3月1日,全国首个城市级文旅智能体杭小忆,全面接入DeepSeek-R1。此次升级,杭州城市大脑智能中枢以“隐形桥梁”之姿,实现DeepSeek-R1在政务信创环境的部署应用...

DeepSeek价格下调,API调用错峰时段降幅最高达75%

DeepSeek价格下调,API调用错峰时段降幅最高达75%

经快讯,2月26日,DeepSeek API开放平台宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:Deep...

潮评丨“DeepSeek首次用于地震国际救援”,带给我们三重启示

潮评丨“DeepSeek首次用于地震国际救援”,带给我们三重启示

潮新闻客户端 评论员 王彬图源:央视新闻今天,话题#DeepSeek7小时攻克缅甸救灾语言关#登上热搜榜,引发网友关注。咋回事呢?近日发生的缅甸7.9级地震,灾情牵动人心。在救援行动中,一项由中国团队...

商络电子:公司正计划引入DeepSeek大模型

商络电子:公司正计划引入DeepSeek大模型

商络电子在互动平台表示,公司正计划引入Deepseek大模型,搭建私有化的AI平台,应用于数据的分析和预测,为公司提供辅助决策能力;另外将AI能力无缝对接通用业务场景,用于提升公司整体效率和能力。(本...

上海中小幼学生开学:“用DeepSeek赶作业”受关注,他们怎么看?

上海中小幼学生开学:“用DeepSeek赶作业”受关注,他们怎么看?

 2月17日,上海约225万名中小学生和幼儿迎来了春季新学期第一天。为了迎接新年后的首次相聚,中小学和幼儿园精心做了各项准备,和孩子们来一场双向奔赴的开学之约。  澎湃新闻记者注意到,开学前几天是疯狂...