当前位置:首页 > Deepseek最新资讯 > 正文内容

罕见!DeepSeek、寒武纪同步重磅发布

8个月前 (09-30)Deepseek最新资讯370

  DeepSeek官方微信号9月29日18:07发文称,“今天,我们正式发布 DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,欢迎广大用户体验测试并向我们反馈意见。”

  DeepSeek表示,“在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。目前API的模型版本为DeepSeek-V3.2-Exp,访问方式保持不变。”

  仅仅4分钟后,即18:11deepseek,寒武纪旗下的微信公众号“寒武纪开发者”发布文章称:“2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。”

  寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化。

  寒武纪称,公司一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。

  此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。

  “依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。”寒武纪强调。

  在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度协同。这表明,或许早在DeepSeek-V3.2发布之前,寒武纪就在技术方面与DeepSeek进行沟通,并启动相关适配研发工作。原文出处:罕见!DeepSeek、寒武纪同步重磅发布,感谢原作者,侵权必删!

标签: deepseek

“罕见!DeepSeek、寒武纪同步重磅发布” 的相关文章

2025年度字词揭晓:“韧”“深度求索(DeepSeek)”当选

2025年度字词揭晓:“韧”“深度求索(DeepSeek)”当选

  联合主办的“汉语盘点2025”活动,12月19日在京揭晓2025“年度字词”。经网友推荐、语料库大数据提取和专家评议,2025年度国内字为“韧”,年度国内词为“深度求索(DeepSee...

1月16日DeepSeek预测:黄蜂vs湖人,东契奇率队主场复仇,詹姆斯冲击30

1月16日DeepSeek预测:黄蜂vs湖人,东契奇率队主场复仇,詹姆斯冲击30

  北京时间1月16日11:30,NBA常规赛将迎来一场东西部球队的较量,夏洛特黄蜂客场挑战洛杉矶湖人。作为联盟最具观赏性的年轻球队之一,黄蜂近期状态起伏不定,而湖人则坐拥詹姆斯和东契奇的...

六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王

六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王

  上周六(10月18日),美国人工智能研究实验室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上举办了一场活动——给六个顶级模型一万美元的真金白银,让它们下场交易,而且...

宇树科技冲 IPO,DeepSeek 竟成“隐藏赢家”?

宇树科技冲 IPO,DeepSeek 竟成“隐藏赢家”?

  宇树科技在社交平台上说,打算在2025年10到12月之间,向证券交易所提交上市申请,到时候公司的运营数据都会公开。   当时市场就猜它可能要准备上...

国际期刊发表DeepSeek大规模推理模型训练方法 揭示AI背后的科学

国际期刊发表DeepSeek大规模推理模型训练方法 揭示AI背后的科学

  中新网北京9月18日电 (记者 孙自法)作为一家专注于大语言模型(LLM)和通用人工智能(AGI)技术的中国公司,DeepSeek(深度求索)今年早些时候发布的开源人工智能(AI)模型...

[JR热议]电竞小说角色“简茸”被指融梗,作者声称无原型不知道GSL

[JR热议]电竞小说角色“简茸”被指融梗,作者声称无原型不知道GSL

  最近,电竞题材小说《我行让我上》作者酱子贝声称小说角色“无原型”,却遭到大众质疑,认为主角“简茸”融梗知名电竞选手Uzi,还融合了选手刘青松(Crisp)的特点,直接就是引发wb各家粉...