当前位置:首页 > Deepseek最新资讯 > 正文内容

每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R

2个月前 (02-21)Deepseek最新资讯59

  IT之家 2 月 21 日消息,科技媒体 Wccftech 昨日(2 月 20 日)发布博文,报道称 AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,

  在 AI 算力竞争日益激烈的当下,延迟已成为制约智能体(Agentic)应用的核心瓶颈。不同于 Cerebras 或 Groq 试图通过集成 SRAM 来加速的路径,成立仅 2.5 年的初创公司 Taalas 选择了更为激进的 ASIC(专用集成电路)路线。

  IT之家援引博文介绍,该公司研发出一种能将任意 AI 模型转化为定制硅片的平台,其核心逻辑在于“融合计算与存储”,直接将特定 LLM 的神经网络映射到硅片电路中,在 DRAM 级密度下完成所有计算。

  这种设计彻底摒弃了 HBM(高带宽内存)、复杂封装及昂贵的散热系统,从物理层面消除了数据传输的“内存墙”障碍。

  然而,巨大的芯片面积仅容纳了 80 亿参数的模型,这与当前万亿参数的前沿模型相比显得“容量有限”deepseek。这表明,为了实现极致的硬连线速度,Taalas 在单位面积的参数密度上做出了巨大妥协,这也是该技术路线面临的主要物理限制之一。

  尽管参数密度不高,但 HC1 的性能表现极具颠覆性。官方数据显示,相比现有的高端算力基础设施,Taalas 方案的每秒 Token 生成数(TPS)提升了 10 倍,同时生产成本降低至 20 分之一。

  为了解决单芯片容量不足的问题,Taalas 采用了集群化扩展策略。在针对 DeepSeek R1 模型的测试中,通过 30 芯片的集群配置,实现了高达 12000 TPS / User 的吞吐速度(据公司称,GPU 目前的技术约为每人每秒 200 个 tokens)。这一数据意味着在实时交互和复杂推理任务中,用户将获得近乎零延迟的体验。

  TPS 是衡量大语言模型生成速度的关键指标,代表模型每秒能输出多少个文本单位(Token)。相当于打字员的打字速度,TPS 越高,AI 回复得越快,用户等待时间越短。

  该媒体指出 Taalas 的技术路线虽然诱人,但商业模式面临独特挑战。由于模型权重被“硬连线”在硅片中,芯片一旦制造完成便无法更改模型参数。

  这意味着客户必须为特定的模型版本(如 Llama 3.1 或 DeepSeek R1)购买专用硬件,一旦算法迭代,硬件可能面临淘汰风险。原文出处:每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录,感谢原作者,侵权必删!

标签: deepseek

“每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R” 的相关文章

DeepSeek-V3.2正式版及高计算版发布

DeepSeek-V3.2正式版及高计算版发布

  DeepSeek方面介绍,企业推出DeepSeek-V3.2模型,该模型在保持卓越推理能力和智能体性能的同时,实现了高计算效率的平衡deepseek。   公开资料显...

DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制

DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制

  【#DeepSeek又开源了# 梁文锋署名新论文发布,实习生挑大梁】智东西1月13日报道,昨晚,DeepSeek又开源了,还发布一篇新论文。这次,他们提出了一种全新的“条件记忆”机制—...

146 万、丹东市公安局 DeepSeek 70B 部署大单

146 万、丹东市公安局 DeepSeek 70B 部署大单

  根据工作需要及建设符合相关数据安全要求。丹东市公安局拟采购 2 套适合中(小)场景应用的 DeepSeek 70B 运行环境。...

2月25日DeepSeek预测:奇才vs老鹰,老鹰主场力擒奇才,约翰逊全面爆发

2月25日DeepSeek预测:奇才vs老鹰,老鹰主场力擒奇才,约翰逊全面爆发

  北京时间2月25日早8:30,NBA常规赛将迎来一场东部对决,华盛顿奇才队客场挑战亚特兰大老鹰队。两支球队目前分别位列东部第13和第9,虽然排名差距明显,但近期状态相似,都是2胜3负。...

A股第二波“DeepSeek冲击”,人工智能AIETF(515070)持仓股协创

A股第二波“DeepSeek冲击”,人工智能AIETF(515070)持仓股协创

  摩根大通称,DeepSeek V3.2发布标志中国AI市场迎第二波“DeepSeek冲击”,意味着以中国国内适中的价格即可获得接近前沿模型的开源推理能力,利好中国AI生态的大多数利益相...

更大更薄更有核!“年轻人的第一套智能家电”海信大薄荷2.0登陆AWE2026

更大更薄更有核!“年轻人的第一套智能家电”海信大薄荷2.0登陆AWE2026

  当“家的主导权”交棒至年轻人手中,家电消费正全面向套系化、智能化升级,年轻人购买的不仅是一套家电,更是背后的情绪价值与生活质感——既渴望用一个指令“硬控”全屋家电,又追求与家装完美适配...