当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek激活“芯”机遇

1年前 (2025-02-17)Deepseek最新资讯543

本土AI生态小伙伴正在朝着DeepSeek“集结”时,海外AI芯片商也快速行动起来。位于美国加州的AI芯片厂商 Cerebras已经接入了DeepSeek-R1 大语言模型,其CEO 在接受采访时表示,公司已经被运行R1大模型的订单压垮。

  上海证券报记者统计,除了华为昇腾、沐曦、燧原科技、海光信息等十几家本土云端AI芯片厂商宣布适配或上架DeepSeek模型服务外,中星微、云天励飞等在端侧AI也积极接入DeepSeek模型。

  在多位业内人士看来,DeepSeek的真正意义是推动降低端侧AI应用成本,打开了端侧应用的想象空间,从而开启AI普惠时代。在此逻辑下,整个智能硬件产业在AI化中,进入新一轮成长周期,云侧和端侧AI芯片商将率先受益。

  记者注意到,或许是为抢抓AI产业机遇,本土GPU(图形处理器)公司陆续开启IPO辅导。最新案例是,2月7日,GPU公司格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月以来第5家本土GPU芯片公司进入IPO辅导阶段。

  云侧AI芯片商积极适配DeepSeek

  DeepSeek的朋友圈已经扩大到了海外芯片商。

  位于美国加州的AI 芯片厂商 Cerebras于2月10日对媒体表示,其已经运行了DeepSeek-R1 大语言模型。Cerebras曾推出用于AI的晶圆级芯片,单芯片峰值算力达到125 PFLOPS,搭配片外内存可以实现最高1.2PB的内存容量。

  国内AI生态圈小伙伴纷纷朝其聚拢,本土GPU公司更是纷纷响应部署。在云侧AI领域,已经有华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯、芯动力等十几家GPU芯片企业,相继宣布适配或上架DeepSeek大模型服务。

  以海光信息为例,公司于2月5日宣布,其技术团队成功完成DeepSeek V3和R1模型、DeepSeek-Janus-Pro多模态大模型与海光DCU(深度计算单元)的适配,并正式上线。公司表示,因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,技术团队的主要工作是进行精度验证和持续的性能优化。本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力,专注于结合视觉与语言理解能力,旨在处理更复杂的跨模态任务。

  对本土AI芯片企业来说,DeepSeek既是机遇,也是挑战,完成对其模型的适配,会推动企业算力和数据中心互联能力迈上一个新台阶。

  就机遇来说,在本土主流AI芯片公司基本完成对DeepSeek蒸馏版小模型的兼容支持后,此前可运行Llama、Qwen等常见模型的平台,便可直接无修改地运行DeepSeek蒸馏版小模型。这意味着,随着DeepSeek的应用爆发,芯片厂新一轮的市场竞争将拉开帷幕,部分公司有望脱颖而出。

  而在挑战方面,DeepSeek满血版的V3和R1拥有6710亿参数,对硬件要求大幅提升且需要额外的推理框架支持,需在推理的解码部分部署320个GPU,这种“超节点”式部署对本土芯片商是全新的挑战。

  一位知名AI创业者观察到,由于新的挑战,目前仅有约一半的本土芯片商成功上线运行了满血版。

  推理AI芯片商抢抓先机

  Cerebras的CEO 安德鲁·费尔德曼在接受采访时表示,公司已经被R1的订单压垮。其表示,DeepSeek对人工智能的影响不仅在当下,更在于将刺激出更大的AI系统。随着成本的降低,市场正在变得越来越大。

  多家机构也持类似观点。花旗分析师Laura Chen的团队表示,DeepSeek的出现,推动AI技术的低成本化和边缘化,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向,将重塑半导体行业格局。银河证券也在研报中称,DeepSeek推动本土AI芯片适配,助力供应链升级,端侧小模型或将遍地开花,进一步带动国产算力的需求。

  云天励飞、中星微等本土AI芯片厂商也在端侧积极适配DeepSeek大模型。

  比如,2月8日,中星微技术宣布旗下星光智能系列AI芯片、解决方案全面融合DeepSeek大模型能力,通过“XPU芯片+大模型”的双引擎驱动,在行业应用、知识管理、边缘计算等领域实现技术突破。

  早在2月5日,云天励飞宣布,春节期间,云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1系列大模型的适配,可以交付客户使用。DeepSeek V3/R1 671B MoE等大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。

  云天励飞在接受记者采访时表示,AI计算分为训练和推理两个环节,根据应用场景可以分为云端和边缘。AI云端训练市场是被英伟达垄断,但是在边缘推理领域,比如用于机器人、无人机、无人车的芯片,在全球领域都还没有形成垄断的格局。边缘AI推理芯片是值得本土芯片厂商关注、大力追赶和抢占的方向。

  GPU公司陆续启动IPO

  本土GPU公司(包括高性能技术和图形图像)正在陆续开启IPO辅导。最新案例是,2月7日,格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月第5家进入IPO辅导的GPU公司。

  官网介绍,格兰菲成立于2020年,其致力于通过提供GPU和AMOLED显示驱动解决方案,帮助客户在计算机软硬件、自动驾驶、网络游戏、智能办公等领域解决各种潜在挑战,满足客户多样化需求。

  据记者统计,自2024年8月以来,还有燧原科技、壁仞科技、摩尔线程、沐曦等本土GPU芯片公司开启了IPO辅导,拟在A股上市。燧原科技等四家公司也均宣布,完成了对DeepSeek大模型的接入和适配。

  一位半导体业内人士表示,以DeepSeek为代表的AI大模型带动GPU市场快速增长,但GPU研发投入巨大,能率先获得二级市场支持的公司,将更有望抓住产业发展机遇。

  多家A股公司也在布局GPU相关领域。比如,青云科技、弘信电子等选择了牵手燧原科技,科华数据与天数智芯签署了战略合作协议,四川长虹、中贝通信、科大讯飞等则采用华为AI芯片昇腾910B。


“DeepSeek激活“芯”机遇” 的相关文章

除了不能当女婿,DeepSeek比董宇辉差到哪了?

除了不能当女婿,DeepSeek比董宇辉差到哪了?

原创 薛亚萍 字母榜“DeepSeek推荐”正在成为年轻人新的消费决策仪式。打开购物APP之前,在北京工作的白领刘雪先去寻求DeepSeek的帮助:“我27岁,敏感肌,请你帮我推荐几款适合我的防晒霜”...

广州津虹YY直播深度融合 DeepSeek,“YYDS”打造智能社区新生态

广州津虹YY直播深度融合 DeepSeek,“YYDS”打造智能社区新生态

DeepSeek热度攀升,广州津虹携“YYDS”开启智能社区新篇在当今科技飞速发展的时代,开源大模型领域风起云涌,DeepSeek作为其中的重要产品,凭借其卓越的技术优势与出色的性能表现,犹如一颗璀璨...

崆峒山景区正式接入DeepSeek大模型

崆峒山景区正式接入DeepSeek大模型

近日,平凉崆峒山景区正式上线了智游崆峒AI小助手,将崆峒山智慧旅游服务平台成功接入深度求索(DeepSeek)大模型,通过AI技术深度挖掘崆峒山的道源文化底蕴,为游客打造更智能、更沉浸的文旅新体验。智...

DeepSeek宣布开源优化并行策略

DeepSeek宣布开源优化并行策略

Deepseek于开源周第四天宣布开源优化并行策略,其中DualPipe——包括一种用于V3/R1训练中计算-通信重叠的双向管道并行算法;EPLB——一种用于V3/R1的专家并行负载平衡器;以及分析V...

平安健康与DeepSeek深度融合,加速医疗智能化进程

平安健康与DeepSeek深度融合,加速医疗智能化进程

2025年初,全球AI领域迎来了一场革命性的技术突破,开源大模型DeepSeek迅速崛起,成为众多企业竞相部署的关键技术。在中国市场,平安健康作为互联网医疗领域的领军企业,宣布已完成DeepSeek的...

DeepSeek能干啥 探索全能数据分析平台的潜力

DeepSeek能干啥 探索全能数据分析平台的潜力

标题:DeepSeek能干啥?探索全能数据分析平台的潜力关键词:DeepSeek,数据分析,智能工具,大数据,企业决策,AI分析描述:DeepSeek作为一款先进的数据分析工具,凭借其强大的数据处理能...