当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek后又一神作！清华校友出手，终结ResNet十年统治？

5个月前 (01-02)Deepseek最新资讯95

　　【新智元导读】2026年架构革命的枪声已经打响！ResNet用十年证明了「加法捷径」能救训练，但也暴露了「只加不减」的天花板。DeepSeek新年王炸之后，普林斯顿和UCLA新作DDL让网络学会忘记、重写和反转deepseek。

　　斯坦福著名教授Christopher Manning读完后直言，「2026年，将成为改进残差连接之年」。

　　一个是mHC流形约束超连接，一个是DDL深度增量学习，几乎在同一时间，传递出一个强烈的信号：

　　2015年，ResNet（残差网络）横空出世后，「加法捷径（shortcut）」几乎成为了深度网络的默认配置。

　　ResNet通过残差学习，解决了深度神经网络训练中的核心难题——层数加深，AI性能不升反降。

　　如今，无论是CNN、ViT，还是各种混合架构，那条「直接把输入加回去」的残差连接，成为了标配。

　　这意味着，对应的线性算子所有特征方向的特征值都是+1，网络只能「平移」状态，而不能反转、选择性遗忘。

　　换句话说，旧特征很难被彻底清除，中间表示几乎不会被「反转」，深度网络在表达复杂动态时，显得有些笨重。

　　这个设计，让网络状态具备了「记忆矩阵」的含义，也为后续的Delta Rule的对齐埋下了伏笔。

　　这是一个rank-1 的对称线性算子，其谱结构异常简单。即d−1个特征值恒为1，只有一个特征值是1−β。

　　某些特征会被直接「翻转符号」，深度网络第一次具备了「反向表达」的能力，这对建模振荡、对立关系非常关键。

　　DDL明确引入了忘记、重写、反转，让网络可以主动清理无用特征，重构中间表示，让建模成为非单调动态过程。

　　DDL不会推翻ResNet，当门控（gate）关闭时，它就是普通残差网络，当它完全打开时，便进入了全新的表达空间。

　　这就像是一个「时代切换」的信号，过去模型变强=更大+更深+更多参数，现在「模型变强=更合理的结构约束」。

　　此前，他获得了清华大学交叉信息研究院计算机科学硕士学位并成为博士候选人；本科毕业于北京大学元培学院，获数学与计算机科学理学学士学位。

　　Yifeng Liu是加州大学洛杉矶分校的计算机博士，本科毕业于清华信息科学与技术学院，姚班出身。

　　个人研究方向包括机器学习、强化学习、生成式AI、AI for science以及智能系统应用。

　　他曾获得伊利诺伊大学厄巴纳-香槟分校计算机科学博士学位，分别于2007年和2010年获得了清华大学学士和硕士学位。

　　个人研究方向是人工智能与机器学习，重点包括非凸优化、深度学习、强化学习、LLM以及深度生成模型。原文出处：DeepSeek后又一神作！清华校友出手，终结ResNet十年统治？，感谢原作者，侵权必删！

标签: deepseek

返回列表

　　当时 DeepSeek-OCR 的出世，引起了大家对视觉压缩的关注与讨论，而这一次，DeepSeek 对视觉编码下手了。　　可以说，刚刚发布的 DeepSeek-O...

　　张骏绷不住了：狠狠共情DeepSeek!这AI怎么比我还内耗！ #AI #AI前线 #人工智能 #内耗 #脱口秀 #DeepSeek #元宝 #张骏 #脱口秀和Ta的朋友们 @微信时刻...

　　西部第四的丹佛掘金（35胜21负）将客场挑战排名第十的波特兰开拓者（27胜29负），这是两队本赛季第三次交锋。前两次交手开拓者均以微弱优势取胜，其中最近一次是2025年11月1日开拓者...

　　北京时间1月11日早8点，NBA常规赛将迎来东部一场强弱对话——排名第6的热火（20胜17负）客场挑战垫底的步行者（7胜31负）。本赛季两队首次交锋中，热火曾以142-116狂胜对手d...

　　9月5日，据外媒报道，DeepSeek被曝光正在开发具备更先进的AI智能体相关功能的人工智能模型，目的是与OpenAI等头部科技公司在技术新前沿展开竞争。目前DeepSeek创始人梁文...

　　日前，全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》，报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价，并发布了天和2...