当前位置:首页 > Deepseek最新资讯 > 正文内容

昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA

5个月前 (01-14)Deepseek最新资讯88

  MLA(Multi-head Latent Attention多头潜在注意力架构)凭借低秩压缩KV缓存设计,实现长上下文推理的显存与带宽双重优化,其有效性已在 DeepSeek-V2 等模型中得到了验证。但主流预训练模型如LLaMA、Qwen千问等多基于GQA构建,企业已投入大量工程优化,复用MLA需重训,成本极高。为此,在北京大学 鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学人工智能研究院助理教授张牧涵团队提出TransMLA转化框架,实现了无需重训便可将主流模型向MLA迁移。

  TransMLA针对GQA向MLA迁移的核心痛点,实现四大技术模块的精准破局:一是GQA→MLA结构映射,破解分组KV头与MLA单头潜在表示不兼容问题deepseek,通过特定的线性变换,将GQA分组后的K、V向量投影/融合为单一的低秩潜在表示,并配备上投影矩阵保障KV信息精准恢复,筑牢迁移基础;二是提出RoRoPE技术方案,通过创新适配让位置编码顺畅融入低秩压缩流程,解决了直接对RoPE应用PCA等通用降维方法可能导致的位置信息损失或模型性能下降问题;三是通过将RoPE中相邻频率的旋转维度进行折叠(Folding)与融合,在降低参数量的同时,更高效地集中和保留关键的位置信息,从而维持模型在长序列下的语义理解能力;四是通过均衡Key和Value矩阵在压缩前的范数分布,提升联合压缩(如PCA)的数值稳定性,减少信息损失。

  在技术落地过程中,昇腾发挥了关键支撑作用。其高效并行计算架构满足结构映射模块的多任务协同处理需求,保障了架构迁移效率;其优化的存储与缓存体系,为 FreqFold 的频率信息处理、BKV-PCA 的范数均衡提供稳定硬件基础,有效提升 KV 压缩的稳定性与资源利用效率,助力 TransMLA 核心技术平稳落地。

  经过实验显示TransMLA的转换过程性能优势明显,裁剪LLaMA-2-7B模型68.75%的KV缓存后无需训练,核心性能仅轻微损失,在32K序列长度、FP16精度下,基于昇腾平台的推理速度较之于业界主流GPU平台有显著提升。依托开放的生态资源,昇腾已推动TransMLA稳定支持主流模型部署并将集成至vLLM/SGLang等高性能推理框架生态,便于用户部署,大幅降低企业落地适配成本。

  TransMLA与昇腾的协同创新,打通了主流模型与MLA架构鸿沟,充分发挥昇腾生态优势。昇腾全链路支持实现TransMLA“零重训、低损失”目标,保留模型参数优势,降低企业基于昇腾的升级门槛。这一软硬件协同典范,为长上下文推理提供昇腾生态解决方案,推动自主计算与前沿AI融合,彰显昇腾核心引领作用,为大模型产业依托自主硬件降本增效提供可行路径。原文出处:昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA,感谢原作者,侵权必删!

标签: deepseek

“昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA” 的相关文章

DeepSeek预测:拜仁慕尼黑vs霍芬海姆,凯恩领衔火力全开,德甲霸主碾压黑马

DeepSeek预测:拜仁慕尼黑vs霍芬海姆,凯恩领衔火力全开,德甲霸主碾压黑马

  德甲第21轮焦点战,领头羊拜仁慕尼黑将在主场迎战近期状态火热的霍芬海姆。拜仁目前以74个进球(赛事第1)和18个失球(赛事第1)的恐怖数据领跑积分榜,而霍芬海姆则以43个进球(赛事第2...

DeepSeek预测:马德里竞技VS奥萨苏纳!床单军团主场碾压,阿尔瓦雷斯6球封

DeepSeek预测:马德里竞技VS奥萨苏纳!床单军团主场碾压,阿尔瓦雷斯6球封

  西蒙尼的马竞目前以13分排名第5,距离欧冠区仅差3分,但身后塞维利亚、埃尔切等同分球队虎视眈眈。奥萨苏纳则位列第12,距离降级区仅有4分优势。这场对决对双方而言都是输不起的战役——马竞...

一文看懂DeepSeek与清北最新论文:剧透V4底层架构,或改写大模型推理格局

一文看懂DeepSeek与清北最新论文:剧透V4底层架构,或改写大模型推理格局

  【#一文看懂DeepSeek与清北最新论文#:剧透V4底层架构,或改写大模型推理格局】#DeepSeek新论文剧透V4底层架构# 就在全世界都盯着V4发布时,DeepSeek先给了波剧...

北京亦庄推出全市首个电梯实时监管体系

北京亦庄推出全市首个电梯实时监管体系

  8月28日,北京亦庄创新发布最新消息,北京经济技术开发区(简称"北京经开区"或"经开区",又称"北京亦庄")正全面构建以物联...

DeepSeek预测:国米VS那不勒斯巅峰对决!劳塔罗率队3-1复仇 意甲榜首大

DeepSeek预测:国米VS那不勒斯巅峰对决!劳塔罗率队3-1复仇 意甲榜首大

  意甲第20轮即将上演火星撞地球的榜首大战!领头羊国际米兰坐镇梅阿查迎战第三名那不勒斯,两队仅差4分的微妙局势让这场比赛充满看点。作为本赛季意甲进攻最犀利的球队(场均2.11球),国米在...

12月14日DeepSeek预测:尼克斯vs魔术,布伦森对决班凯罗,东部强强对话

12月14日DeepSeek预测:尼克斯vs魔术,布伦森对决班凯罗,东部强强对话

  东部第二的纽约尼克斯将客场挑战排名第四的奥兰多魔术,这场强强对话将直接影响东部上半区的格局。魔术本赛季展现黑马姿态,而尼克斯则延续了上赛季的强势表现。   尼克斯的进...