当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

7个月前 (09-30)Deepseek最新资讯403

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

DeepSeek回应风格调整称非故意变冷淡,因效率与边界感优化

DeepSeek回应风格调整称非故意变冷淡,因效率与边界感优化

  【#DeepSeek回应更新后变冷淡#】近日,国产AI助手DeepSeek被大量用户吐槽风格突变,变冷淡,从原本细腻共情变为不称昵称、文风生硬带“登味”,共情能力下降。...

使用量激增致算力不足,Kimi建议网友先用DeepSeek

使用量激增致算力不足,Kimi建议网友先用DeepSeek

  近日,知名大模型聚合平台OpenRouter数据显示,从上个月Kimi发布并开源Kimi K2.5模型以来,模型在总榜及多个分榜持续排名第一。近期由于使用量激增,有用户反映遇到Kimi...

华尔街交易员回顾2025年:关税牵动神经、美股剧烈震荡、DeepSeek爆火

华尔街交易员回顾2025年:关税牵动神经、美股剧烈震荡、DeepSeek爆火

  那是4月2日周三的晚上,美国总统唐纳德·特朗普出现在白宫玫瑰园,手里举着一块很大的牌子deepseek,上面列着他对世界各国征收的惩罚性关税。华尔街很快意识到,特朗普这次是动真格的,他...

2月25日DeepSeek预测:奇才vs老鹰,老鹰主场力擒奇才,约翰逊全面爆发

2月25日DeepSeek预测:奇才vs老鹰,老鹰主场力擒奇才,约翰逊全面爆发

  北京时间2月25日早8:30,NBA常规赛将迎来一场东部对决,华盛顿奇才队客场挑战亚特兰大老鹰队。两支球队目前分别位列东部第13和第9,虽然排名差距明显,但近期状态相似,都是2胜3负。...

DeepSeek V4读秒:Kimi 游向浅滩,智谱借壳暖春

DeepSeek V4读秒:Kimi 游向浅滩,智谱借壳暖春

  在 DeepSeek-R1 发布一周年之际,《新立场》注意到,DeepSeek 在 GitHub 上更新了大量FlashMLA代码。在114个文件中,一个标有MODEL1的未知大型模型...

DeepSeek-V3.1模型于日前发布 AI主题投资热度升温

DeepSeek-V3.1模型于日前发布 AI主题投资热度升温

  中证网讯 近期,国产大模型厂商DeepSeek推出V3.1版本,受到市场热议。有基金人士认为,国内AI(人工智能)产品或正迎来新拐点,不妨关注港股科技30ETF(513160)及其联接...