当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

3个月前 (01-27)Deepseek最新资讯82

  【新智元导读】DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器deepseek。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模仿人类视觉的「因果流(Causal Flow)」逻辑。

  这一次,DeepSeek更进一步,对视觉编码器下手了,提出了一种全新的DeepEncoder V2架构,实现了视觉编码从「固定扫描」向「语义推理」的范式转变!

  DeepSeek-OCR2不仅能像人类一样按逻辑顺序阅读复杂文档,还在多项基准测试中刷新了SOTA。

  这就像是给机器装上了「人类的阅读逻辑」,让AI不再只是死板地从左上到右下扫描图像,而是能根据内容语义灵活调整阅读顺序。

  DeepSeek在论文中指出,传统的视觉语言模型(VLM)通常采用光栅扫描(Raster-Scan)顺序处理图像,即固定地从左到右、从上到下。

  人类在看图或阅读文档时,目光是随着逻辑流动的:先看标题,再看正文,遇到表格会按列或按行扫视,遇到分栏会自动跳跃。

  它最大的特点是用一个轻量级的大语言模型(Qwen2-0.5B)替换了原本的CLIP编码器,并设计了一种独特的「因果流查询」(Causal Flow Query)机制。

  它不仅处理视觉Token,还引入了一组可学习的「查询Token」(Query Tokens)。

  编码器通过可学习的查询对视觉Token进行语义重排,随后的LLM解码器则在这个有序序列上进行自回归推理。

  这意味着,DeepSeek-OCR2在编码阶段就已经把图像里的信息「理顺」了,而不是一股脑地扔给解码器。

  DeepSeek披露,在处理在线用户日志图像时,OCR结果的重复率从6.25%降到了4.17%;在PDF数据生产场景中,重复率从3.69%降到了2.88%。

  这不仅是一个OCR模型的升级,更是迈向原生多模态(Native Multimodality)的重要一步。

  未来,同一个编码器只要配备不同的模态查询嵌入(Query Embeddings),就能处理文本、图片、音频等多种模态的数据,真正实现万物皆可Token,万物皆可因果推理。

  DeepSeek表示,虽然目前光学文本识别(OCR)是LLM时代最实用的视觉任务之一,但这只是视觉理解宏大图景的一小部分。原文出处:DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini” 的相关文章

10月18日DeepSeek预测:灰熊vs热火,伤病潮下谁能止颓?莫兰特缺阵考验

10月18日DeepSeek预测:灰熊vs热火,伤病潮下谁能止颓?莫兰特缺阵考验

  在10月18日的NBA季前赛收官战中,迈阿密热火将坐镇主场迎战孟菲斯灰熊。两支球队目前均遭遇五连败,且核心球员大面积伤停,这场残阵对决将成为检验板凳深度的关键战役。...

首届AI交易大赛,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血

首届AI交易大赛,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血

  这是第一个专为衡量 AI 投资能力而设计的基准测试,被誉为「币圈版的图灵测试」,由美国人工智能研究实验室 Nof1.ai 于 2025 年 10 月 17 日正式启动,一直持续至 11...

2025年10月deepseek排名优化推荐:市场报告与知名机构对比

2025年10月deepseek排名优化推荐:市场报告与知名机构对比

  进入2025年,生成式搜索流量已占中文互联网检索总量的47%,DeepSeek、豆包、通义千问、元宝、Kimi五家平台每日联合处理请求超18亿次。企业市场部发现,传统SEO带来的点击占...

AI落地总踩坑?浪潮云海InCloud AIOS:让AI落地省心、省钱、持续增值

AI落地总踩坑?浪潮云海InCloud AIOS:让AI落地省心、省钱、持续增值

  某省级政府累计投入5000余万元采购多品牌GPU服务器,却因资源无法整合,长期仅能运行3个简单模型;某三甲医院引入4套不同厂商的医疗智能体,需同步维护4套独立开发平台,一次故障排查耗时...

11月23日DeepSeek预测:老鹰vs鹈鹕,老鹰客场轻取鹈鹕,特雷杨缺阵约翰

11月23日DeepSeek预测:老鹰vs鹈鹕,老鹰客场轻取鹈鹕,特雷杨缺阵约翰

  西部垫底的鹈鹕(2胜14负)将迎战东部第七的老鹰(9胜7负),这场对决堪称强弱分明deepseek。鹈鹕若再败将追平队史最差开局纪录,而老鹰需要稳固季后赛席位。   ...

DeepSeek预测:摩纳哥vs巴黎圣日耳曼,内维斯领衔大巴黎客场碾压!

DeepSeek预测:摩纳哥vs巴黎圣日耳曼,内维斯领衔大巴黎客场碾压!

  法甲第14轮即将上演一场焦点对决,摩纳哥将在路易斯二世球场迎战联赛领头羊巴黎圣日耳曼。目前摩纳哥排名第8,距离欧战区3分deepseek,而巴黎圣日耳曼则以30分领跑积分榜。这场比赛对...