当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

1年前 (2025-02-24)Deepseek最新资讯561

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

速看!广电网络积极接入DeepSeek,“智”造无限可能

速看!广电网络积极接入DeepSeek,“智”造无限可能

自深度求索公司推出DeepSeek系列大模型以来,中国广电紧抓技术革新机遇,积极布局,以“全国一网”战略为牵引,全面统筹各省网公司协同发力,围绕广电业务核心场景加速推进AI融合实践,通过深化DeepS...

12345政务服务热线接入DeepSeek借助DeepSeek大模型转写技术通话内容能实时转成文字

12345政务服务热线接入DeepSeek借助DeepSeek大模型转写技术通话内容能实时转成文字

3秒可以写一篇文章2秒可以翻译一段文字……这段时间AI智能开始走进大众视野我市积极探索“AI+政务服务”新模式与科技共同进步“叮叮叮……” 清脆的电话铃声在12345政务服务热线中心响起。“您好,请问...

带DeepSeek畅游巴塞罗那:是旅游搭子,更是高级“嘴替”

带DeepSeek畅游巴塞罗那:是旅游搭子,更是高级“嘴替”

当一个人完全没有做攻略就来到一个语言、文字不通的城市,该如何更好的生活or游玩呢?以前,我去外面旅游基本上会用到3-5个不同的app(不包括临时下载的本地功能性app),涵盖翻译、旅游攻略、旅游避坑等...

中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型

中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型

近日,中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型,并率先应用于智能质检与知识库检索两大业务场景,成为首批接入前沿领先AI大模型的消费金融公司。  在智能质检方面,借助...

中原证券:DeepSeek有望推动国产AI算力芯片加速发展

中原证券:DeepSeek有望推动国产AI算力芯片加速发展

AI算力芯片是“AI时代的引擎”。ChatGPT热潮引发全球科技企业加速布局AI大模型,谷歌、Meta、百度、阿里巴巴、华为、DeepSeek等随后相继推出大模型产品,并持续迭代升级;北美四大云厂商受...

当虹科技“DeepSeek+BlackEye”大模型一体机首发

当虹科技“DeepSeek+BlackEye”大模型一体机首发

当虹科技2月21日发布全新一代“DeepSeek+BlackEye”多模态大模型一体机,为传媒行业发展再次注入新活力。当虹科技副总裁、传媒事业部总经理叶建华表示,DeepSeek+BlackEye多模...