当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

6个月前 (02-24)Deepseek最新资讯337

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

DeepSeek+腾讯双重龙头!“强得可怕”,连创历史新高!

DeepSeek+腾讯双重龙头!“强得可怕”,连创历史新高!

云计算利好频出。2月18日,A股主要指数集体调整。截至收盘,沪指跌0.93%,深证成指跌1.61%,两大科创指数跌幅均在2%左右水平。沪深两市成交额接近1.8万亿元,较昨日缩量逾千亿。行业板块呈现普跌...

DeepSeek又得了个第一

DeepSeek又得了个第一

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。这是继DeepSeek应用力压ChatGPT登顶美区App...

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

【消息称DeepSeek-R2或下周发布 官方暂无回应】财联社3月11日电,有消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式发布。截至目前,DeepSee...

协鑫能科:公司暂时没有与DeepSeek开展业务合作

协鑫能科:公司暂时没有与DeepSeek开展业务合作

金融界2月17日消息,有投资者在互动平台向协鑫能科提问:尊敬的董秘你好!新年好!公司DeepSeek有合作吗?公司回答表示:公司主要从事能源资产投资管理及综合能源服务相关业务,目前公司暂时没有与Dee...

与DeepSeek、月之暗面等同台竞技,蘑菇车联的AI之路向何方?

与DeepSeek、月之暗面等同台竞技,蘑菇车联的AI之路向何方?

日前,蘑菇车联公布斩获荣誉“MOGO.AI AWARDS”,公司2024年以来接连荣获多项人工智能、独角兽、自动驾驶、智慧交通类顶级榜单和奖项荣誉。这些荣誉不仅来自北京市科学技术委员会、中国信通院等国...

廊坊市委研究室、市委改革办 举办DeepSeek应用专题讲座

廊坊市委研究室、市委改革办 举办DeepSeek应用专题讲座

为落实廊坊市委关于“部署DeepSeek等人工智能底座,打造多元化智慧应用场景”的战略部署,深入推进DeepSeek赋能廊坊政研和改革工作,3月21日下午,市委研究室、市委改革办举办全市政研和改革系统...