当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

4个月前 (02-24)Deepseek最新资讯227

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

弘信电子:全资子公司安联通已经推出安联云业务,安联云可一键部署DeepSeek系列镜像

弘信电子:全资子公司安联通已经推出安联云业务,安联云可一键部署DeepSeek系列镜像

每经AI快讯,有投资者在投资者互动平台提问:子公司安联通是否有云计算业务?弘信电子(300657.SZ)3月31日在投资者互动平台表示,公司全资子公司安联通已经推出安联云业务,安联云平台配备GPU的云...

山石网科发布DeepSeek大模型应用一体机解决方案

山石网科发布DeepSeek大模型应用一体机解决方案

每经快讯,据山石网科微信公众号3月3日消息,近日,山石网科发布DeepSeek大模型应用一体机解决方案,致力于为用户提供一站式“算力+大模型+安全应用”服务能力。山石网科股票山石网科发布deepsee...

华胜天成公司部分自有产品中部署应用Deepseek

华胜天成公司部分自有产品中部署应用Deepseek

华胜天成公司部分自有产品中部署应用Deepseek每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepS...

中华保险接入Deepseek大模型 实现技术新突破

中华保险接入Deepseek大模型 实现技术新突破

近日,中华保险旗下中华财险宣布已完成基于国产大模型DeepSeek的本地化部署,标志着其在保险科技领域的进一步突破。此次部署不仅是技术上的升级,更是中华保险旗下中华财险在数字化转型中的重要一步。未来,...

韩国:暂停DeepSeek下载

韩国:暂停DeepSeek下载

据韩联社17日报道,韩国政府当天表示,已经临时暂停基于中国人工智能企业深度求索(DeepSeek)大模型的应用程序在韩国的服务,理由是所谓的“数据收集担忧”。报道称,韩国个人信息保护委员会(PIPC)...

英伟达新GPU再王炸,也得靠蹭DeepSeek卖卡

英伟达新GPU再王炸,也得靠蹭DeepSeek卖卡

一身皮衣黄仁勋,GTC 2025上意气风发。虽然最近英伟达的股票跌得比较狠,甚至来到了10年来的最低点,但这不影响老黄,对最新的GPU们信心满满。时间回拨到2月初,DeepSeek的发布在AI领域掀起...