当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V4下周上线?原生多模态架构 技术报告同步开放

2个月前 (03-01)Deepseek最新资讯67

  据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在硬件适配方面,DeepSeek为国产算力提供深度支持,DeepSeek致力于优化V4模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速AI模型“推理”环节靠拢本土芯片。

  据一位直接了解相关计划的人士透露,DeepSeek预计在发布V4版本的同时,发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。

  截至发稿,DeepSeek官方尚未对V4的任何信息进行正式回应或确认,所有信息均来媒体爆料,详细信息多集中在正在进行秘密测试的简化版本V4 Lite(精简版)上。据《科创板日报》综合的消息,关于V4 Lite:

  其代号为“sealion-lite”,拥有100万(1M)个tokens的上下文窗口,相比V3系列的128K有近8倍提升,理论上可一次处理如《三体》全集体量的长文本;

  泄露的测试示例显示,V4 Lite能用极简代码(如54行)生成高质量的SVG图像(如Xbox手柄),在代码优化和视觉还原度上被认为超越了DeepSeek V3.2、Claude Opus 4.6等模型,这暗示了其空间推理和结构化输出能力的提升。

  回顾DeepSeek的模型迭代之路,该公司的优化路径十分清晰——提升推理能力、平衡模型性能与推理效率,为大模型“降本”。

  DeepSeek已发布的主要模型是两条技术路线的代表:追求极致综合性能的V系列“全能助手”和专注于复杂推理的R系列“解题专家”。

  2024年5月,DeepSeek V2发布,被视作DeepSeek的首次重大突破,其研究团队提出了多头潜在注意力(MLA)机制deepseek,大幅降低推理时的显存占用和成本,以极低的推理费用出圈,确立了混合专家模型(MoE)的技术路线。

  2024年12月推出的V3是DeepSeek的重要里程碑,其高效的MoE架构确立了强大的综合性能基础。此后,V3系列通过小版本更新不断打磨,不断提升用户体验和模型Agent能力¬¬。

  其中,2025年8月发布的DeepSeek-V3.1,是一个里程碑式的更新,首次将V3和R1的能力融合到一个模型中,支持思考模式和非思考模式的自由切换,在SWE-bench等基准上比前代提升超40%;2025年12月推出的V3.2,是DeepSeek首个将深度思考与工具使用无缝融合的版本,推理能力达到GPT-5水平,在H800集群上,128K序列长度的推理成本显著降低:预填充阶段每百万token成本从0.7美元降至0.2美元,解码阶段从2.4美元降至0.8美元,这一定价使其成为当时同级别模型中长文本推理成本最低的选择之一。

  2025年1月发布的R1,是其首代专用推理模型,首次证明通过大规模强化学习(RL)能激发模型的推理能力,通过强化学习,该模型在解决数学问题、代码编程等复杂推理任务上表现卓越,并首创了“深度思考”模式,性能对标OpenAI最强模型o1,但推理成本(仅为约560万美元)不到其十分之一。

  可以看出,在大家等待V4期间,DeepSeek一直没有停下脚步,另外,其在多模态能力上的布局比V4更早。从技术演进来看,DeepSeek早在2023年的V3系列和2024年的V2版本中就已经开始布局和实现多模态能力。2025年初发布的Janus系列更是专门的、功能强大的多模态模型。原文出处:DeepSeek V4下周上线?原生多模态架构 技术报告同步开放,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V4下周上线?原生多模态架构 技术报告同步开放” 的相关文章

朱啸虎:DeepSeek被低估,没有它整个人类就危险了,AI很可能被几个私有公司

朱啸虎:DeepSeek被低估,没有它整个人类就危险了,AI很可能被几个私有公司

  朱啸虎:DeepSeek被低估,没有它整个人类就危险了,AI很可能被几个私有公司控制 #DeepSeek#人工智能#A   朱啸虎:DeepSeek被低估deepse...

1月18日DeepSeek预测湖人vs开拓者:詹姆斯单核带队能否终结连败?

1月18日DeepSeek预测湖人vs开拓者:詹姆斯单核带队能否终结连败?

  北京时间1月18日11点,NBA常规赛将迎来湖人(24胜15负,西部第6)与开拓者(20胜22负,西部第9)的焦点战。湖人近期遭遇4战3负的低迷,而开拓者则在主场取得2连胜,此役胜负将...

凝聚统战“向心力” 绘就发展“同心圆”——金华联通2025年统战工作纪实

凝聚统战“向心力” 绘就发展“同心圆”——金华联通2025年统战工作纪实

  2025年,中国联通浙江金华市分公司党委(下称金华联通)将统战工作作为推动企业高质量发展的“强大法宝”,通过强化思想引领、搭建建言平台、锻造人才梯队等一系列务实举措,成功将公司党内外智...

1月26日DeepSeek预测:猛龙vs雷霆,亚历山大率队捍卫主场

1月26日DeepSeek预测:猛龙vs雷霆,亚历山大率队捍卫主场

  北京时间1月26日,NBA常规赛将迎来一场东西部强队对话,多伦多猛龙客场挑战俄克拉荷马雷霆。作为东部老牌劲旅,猛龙目前以28胜19负排名东部第四,而青年军雷霆则以37胜9负的联盟最佳战...

Deepseek推荐全国旅游百强区第59名:甘肃兰州市城关区

Deepseek推荐全国旅游百强区第59名:甘肃兰州市城关区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

  NBA常规赛即将迎来一场东部对决,克利夫兰骑士队将客场挑战纽约尼克斯队。作为上赛季东部第四的强队,骑士在新赛季首战中将面对状态火热的尼克斯,这场比赛无疑充满看点。  ...