当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

6个月前 (02-24)Deepseek最新资讯295

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

仙桃“城市大脑”全面接入DeepSeek

仙桃“城市大脑”全面接入DeepSeek

3月12日仙桃DeepSeek大模型本地化部署上线发布会在市民之家举行仙桃市“城市大脑”完成重磅升级完成了DeepSeek大模型本地化部署成为全省直管市中首个接入国产人工智能大模型DeepSeek的城...

平台应用双升级 中关村科金的DeepSeek企业应用之道

平台应用双升级 中关村科金的DeepSeek企业应用之道

中新网上海新闻3月13日电(汤彦俊)3月13日,由中关村科金与上海市人工智能行业协会联合主办的"DeepSeek企业应用之道——2025大模型技术与应用创新城市论坛"在上海圆满落幕...

青云科技:未与DeepSeek签署服务合作协议

青云科技:未与DeepSeek签署服务合作协议

每经快讯,青云科技(688316)2月12日晚间发布股票交易异常波动暨严重异常波动公告,公司旗下部分产品进行了DeepSeek的接入,但公司未与DeepSeek签署服务合作协议,与其没有业务合作,该事...

建筑业真要洗牌了!中建三局已应用DeepSeek管理工程,取代人力更高效!

建筑业真要洗牌了!中建三局已应用DeepSeek管理工程,取代人力更高效!

源自丨中建三局近日,中央广播电视总台《新闻直播间》栏目播出《科技推动力·大模型“智”在何方》特别策划,其中1分多钟重点报道了中建三局系列平台产品创新应用AI大模型,为建筑业提供更多“数字方案”,探访揭...

中国港口接入DeepSeek以提升运营效率

中国港口接入DeepSeek以提升运营效率

海外网2月21日电据香港《南华早报》2月20日报道,中国人工智能企业深度求索的大语言模型DeepSeek正在赋能中国各行业和关键基础设施。报道称,中国三大港口已陆续实施或计划接入DeepSeek,以提...

零跑B10上市 搭载DeepSeek+通义千问双模型

零跑B10上市 搭载DeepSeek+通义千问双模型

人民财讯4月10日电,4月10日,零跑汽车全新B系列首款全球化车型——零跑B10正式上市。新车共推出5款车型,包括510km和600km两种CLTC续航版本,官方指导价格区间为9.98万元至12.98...