当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

1年前 (2025-02-24)Deepseek最新资讯560

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

贵阳贵安:运用DeepSeek赋能 在企业和群众两端发力

贵阳贵安:运用DeepSeek赋能 在企业和群众两端发力

3月7日,在贵阳贵安DeepSeek部署应用新闻发布会上,贵阳市大数据局局长、贵安新区大数据和科创局局长张雪蓉介绍,在运用DeepSeek赋能方面,贵阳贵安始终以“技术落地、服务见效”为目标,在企业和...

沈阳市注评行业党委举办DeepSeek专题培训班,以科技赋能行业提质增效

沈阳市注评行业党委举办DeepSeek专题培训班,以科技赋能行业提质增效

为提升注册会计师和资产评估行业从业人员专业能力与新技术应用水平,促进DeepSeek技术在注评行业内的普及与应用,沈阳市注评行业党委分阶段、分主题开展沈阳市注评行业DeepSeek专题培训班,通过前沿...

免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP

免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP

借助新版DeepSeek-V3,任何人现在可以一次性创建任何应用或游戏了——而且是一边开发一边看效果的那种。在Hugging Face中,这个名为DeepSite的应用火了。有网友直呼,这不就是网页版...

轻松健康集团接入DeepSeek

轻松健康集团接入DeepSeek

36氪获悉,轻松健康集团日前宣布完成与DeepSeek的技术整合。此次升级标志着轻松健康集团在医疗AI领域的技术储备已形成"算法层-应用层-商业层"的三重壁垒,其自主研发的AIca...

降准降息时间定了!100万房贷能省多少钱?DeepSeek帮您算算

降准降息时间定了!100万房贷能省多少钱?DeepSeek帮您算算

2025年5月7日,中国人民银行发布关于下调个人住房公积金贷款利率的通知,内容如下:中国人民银行上海总部,各省、自治区、直辖市及计划单列市分行;各政策性银行、国有商业银行,中国邮政储蓄银行,各股份制商...

DeepSeek“落户”新疆,带来了什么?

DeepSeek“落户”新疆,带来了什么?

中新网乌鲁木齐3月25日电 (史玉江)在人工智能的数字化浪潮中,DeepSeek正全面“落户”新疆,在把科技魅力转化为创造力的同时,也悄然改变着人们的生活。“DeepSeek+智慧政务”广泛应用目前在...