当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

8个月前 (09-30)Deepseek最新资讯408

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

DeepSeek预测:尤文图斯VS科莫!斑马军团主场复仇or升班马继续黑马神话?

DeepSeek预测:尤文图斯VS科莫!斑马军团主场复仇or升班马继续黑马神话?

  北京时间2月21日晚22:00,意甲第26轮将上演一场极具看点的对决——排名第5的尤文图斯坐镇安联球场迎战第6名科莫deepseek。目前两队仅相差4分,这场价值6分的欧战卡位战将直接...

接近DeepSeek人士确认:DeepSeek-R2在8月内并无发布计划

接近DeepSeek人士确认:DeepSeek-R2在8月内并无发布计划

  格隆汇8月13日|据腾讯科技,近日市场再度传出深度求索(DeepSeek)下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。对此deepseek,接近De...

DeepSeek遵循新规,AI生成内容添加明确标识以保用户知情权

DeepSeek遵循新规,AI生成内容添加明确标识以保用户知情权

  【TechWeb】在《人工智能生成合成内容标识办法》及相应国家标准于2025年9月1日起施行的大背景下,DeepSeek公司积极响应政策要求,发布了一项关于AI生成合成内容标识的重要公...

智启消费新未来 量化派:AI时代实体经济的赋能者

智启消费新未来 量化派:AI时代实体经济的赋能者

  截至2025年11月,累计有611款生成式人工智能服务完成备案、306款相关应用或功能完成登记。这组数据不仅是国产生成式AI产业规模持续壮大的直接印证,更标志着我国人工智能发展已进入“...

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压Deep

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压Deep

  总的来说,Qwen3-Max-Preview有以下几大亮点:性能更强、知识更广、更擅长对话deepseek、任务处理、指令遵循。   比如,在一个杯子流体模拟中,Ge...

数字赋能 智绘普法 ——以“3C工作法”打造汕头烟草普法数字人项目

数字赋能 智绘普法 ——以“3C工作法”打造汕头烟草普法数字人项目

  汕头市烟草专卖局创新 “3C 普法工作法”,以数字人技术为核心,融合多模态 AI、法律知识图谱及 AR/VR 技术,打造潮汕文化特色普法体系。全场景覆盖(Comprehensive)形...