当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek激活“芯”机遇

6个月前 (02-17)Deepseek最新资讯275

本土AI生态小伙伴正在朝着DeepSeek“集结”时,海外AI芯片商也快速行动起来。位于美国加州的AI芯片厂商 Cerebras已经接入了DeepSeek-R1 大语言模型,其CEO 在接受采访时表示,公司已经被运行R1大模型的订单压垮。

  上海证券报记者统计,除了华为昇腾、沐曦、燧原科技、海光信息等十几家本土云端AI芯片厂商宣布适配或上架DeepSeek模型服务外,中星微、云天励飞等在端侧AI也积极接入DeepSeek模型。

  在多位业内人士看来,DeepSeek的真正意义是推动降低端侧AI应用成本,打开了端侧应用的想象空间,从而开启AI普惠时代。在此逻辑下,整个智能硬件产业在AI化中,进入新一轮成长周期,云侧和端侧AI芯片商将率先受益。

  记者注意到,或许是为抢抓AI产业机遇,本土GPU(图形处理器)公司陆续开启IPO辅导。最新案例是,2月7日,GPU公司格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月以来第5家本土GPU芯片公司进入IPO辅导阶段。

  云侧AI芯片商积极适配DeepSeek

  DeepSeek的朋友圈已经扩大到了海外芯片商。

  位于美国加州的AI 芯片厂商 Cerebras于2月10日对媒体表示,其已经运行了DeepSeek-R1 大语言模型。Cerebras曾推出用于AI的晶圆级芯片,单芯片峰值算力达到125 PFLOPS,搭配片外内存可以实现最高1.2PB的内存容量。

  国内AI生态圈小伙伴纷纷朝其聚拢,本土GPU公司更是纷纷响应部署。在云侧AI领域,已经有华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯、芯动力等十几家GPU芯片企业,相继宣布适配或上架DeepSeek大模型服务。

  以海光信息为例,公司于2月5日宣布,其技术团队成功完成DeepSeek V3和R1模型、DeepSeek-Janus-Pro多模态大模型与海光DCU(深度计算单元)的适配,并正式上线。公司表示,因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,技术团队的主要工作是进行精度验证和持续的性能优化。本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力,专注于结合视觉与语言理解能力,旨在处理更复杂的跨模态任务。

  对本土AI芯片企业来说,DeepSeek既是机遇,也是挑战,完成对其模型的适配,会推动企业算力和数据中心互联能力迈上一个新台阶。

  就机遇来说,在本土主流AI芯片公司基本完成对DeepSeek蒸馏版小模型的兼容支持后,此前可运行Llama、Qwen等常见模型的平台,便可直接无修改地运行DeepSeek蒸馏版小模型。这意味着,随着DeepSeek的应用爆发,芯片厂新一轮的市场竞争将拉开帷幕,部分公司有望脱颖而出。

  而在挑战方面,DeepSeek满血版的V3和R1拥有6710亿参数,对硬件要求大幅提升且需要额外的推理框架支持,需在推理的解码部分部署320个GPU,这种“超节点”式部署对本土芯片商是全新的挑战。

  一位知名AI创业者观察到,由于新的挑战,目前仅有约一半的本土芯片商成功上线运行了满血版。

  推理AI芯片商抢抓先机

  Cerebras的CEO 安德鲁·费尔德曼在接受采访时表示,公司已经被R1的订单压垮。其表示,DeepSeek对人工智能的影响不仅在当下,更在于将刺激出更大的AI系统。随着成本的降低,市场正在变得越来越大。

  多家机构也持类似观点。花旗分析师Laura Chen的团队表示,DeepSeek的出现,推动AI技术的低成本化和边缘化,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向,将重塑半导体行业格局。银河证券也在研报中称,DeepSeek推动本土AI芯片适配,助力供应链升级,端侧小模型或将遍地开花,进一步带动国产算力的需求。

  云天励飞、中星微等本土AI芯片厂商也在端侧积极适配DeepSeek大模型。

  比如,2月8日,中星微技术宣布旗下星光智能系列AI芯片、解决方案全面融合DeepSeek大模型能力,通过“XPU芯片+大模型”的双引擎驱动,在行业应用、知识管理、边缘计算等领域实现技术突破。

  早在2月5日,云天励飞宣布,春节期间,云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1系列大模型的适配,可以交付客户使用。DeepSeek V3/R1 671B MoE等大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。

  云天励飞在接受记者采访时表示,AI计算分为训练和推理两个环节,根据应用场景可以分为云端和边缘。AI云端训练市场是被英伟达垄断,但是在边缘推理领域,比如用于机器人、无人机、无人车的芯片,在全球领域都还没有形成垄断的格局。边缘AI推理芯片是值得本土芯片厂商关注、大力追赶和抢占的方向。

  GPU公司陆续启动IPO

  本土GPU公司(包括高性能技术和图形图像)正在陆续开启IPO辅导。最新案例是,2月7日,格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月第5家进入IPO辅导的GPU公司。

  官网介绍,格兰菲成立于2020年,其致力于通过提供GPU和AMOLED显示驱动解决方案,帮助客户在计算机软硬件、自动驾驶、网络游戏、智能办公等领域解决各种潜在挑战,满足客户多样化需求。

  据记者统计,自2024年8月以来,还有燧原科技、壁仞科技、摩尔线程、沐曦等本土GPU芯片公司开启了IPO辅导,拟在A股上市。燧原科技等四家公司也均宣布,完成了对DeepSeek大模型的接入和适配。

  一位半导体业内人士表示,以DeepSeek为代表的AI大模型带动GPU市场快速增长,但GPU研发投入巨大,能率先获得二级市场支持的公司,将更有望抓住产业发展机遇。

  多家A股公司也在布局GPU相关领域。比如,青云科技、弘信电子等选择了牵手燧原科技,科华数据与天数智芯签署了战略合作协议,四川长虹、中贝通信、科大讯飞等则采用华为AI芯片昇腾910B。


“DeepSeek激活“芯”机遇” 的相关文章

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

金磊 发自 凹非寺量子位 | 公众号 QbitAI要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处...

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已...

昇腾+DeepSeek大模型助力职业院校低成本打造AI实训标杆

昇腾+DeepSeek大模型助力职业院校低成本打造AI实训标杆

随着移动互联技术、云计算和人工智能等新兴技术的快速发展及其在各行业的广泛应用,各职业高校教育正面临新的机遇与挑战,职业院校作为培养应用型和技术型人才的重要阵地,亟需探索高效、高质量的实训课程新模式。在...

阿里通义千问与DeepSeek开源两款新模型

阿里通义千问与DeepSeek开源两款新模型

钛媒体App 3月26日消息,阿里通义千问与DeepSeek均于昨日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B,DeepSeek则将此前热门的“基...

DeepSeek鲶鱼效应,掀起AI上车狂潮|封面故事:AI汽车赛道起跑

DeepSeek鲶鱼效应,掀起AI上车狂潮|封面故事:AI汽车赛道起跑

汽车纵横全媒体最近DeepSeek狂潮席卷全球,掀起了新一轮汽车行业企业AI热潮。它打破了传统大模型依赖大算力的路径,加速AI技术普及和普惠。AI赋能汽车全价值链,已成为驱动汽车智能化变革的核心引擎和...

DeepSeek、Manus相继火了,产业政策怎样“抢时间”?

DeepSeek、Manus相继火了,产业政策怎样“抢时间”?

“经济主题记者会,快变成科技主题记者会了。”今年全国两会期间,证监会主席吴清开玩笑说,这两天,谁要是不说说DeepSeek,好像就不太时髦似的。话音未落,又一款国产AI产品Manus横空出世,迅速走红...