当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

1年前 (2025-02-24)Deepseek最新资讯564

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

当湖北移动遇见DeepSeek,荆楚大地掀起智能新浪潮

当湖北移动遇见DeepSeek,荆楚大地掀起智能新浪潮

"九省通衢"的湖北,正在数智化浪潮中全速前进!当湖北移动的优质网络遇上DeepSeek的前沿AI,会擦出怎样的火花?今天,带您体验「5G+AI」的双重惊喜!01应用场景1政务+AI...

AI+诊疗 DeepSeek帮你“一眼看懂”医疗报告

AI+诊疗 DeepSeek帮你“一眼看懂”医疗报告

随着人工智能技术飞速发展,AI应用场景不断拓展,深度融入人们的日常生活。今天的《打卡两岸》,我们一起来聚焦民生领域的人工智能,感受AI大模型如何赋能你我的生活。厦门市民 小许:肌酸激酶偏高,我应该挂哪...

“国民级应用”纷纷下场 DeepSeek开启AI新时代?

“国民级应用”纷纷下场 DeepSeek开启AI新时代?

刚刚过去的周末,人工智能大模型DeepSeek再次登上各大社交平台的热搜榜,同时出现的,还有“国民级应用”腾讯和百度的名字,引发业界和普通用户高度关注。15日晚间,腾讯宣布微信搜一搜正灰度测试接入De...

企业微信接入DeepSeek,可一键生成24小时“智能助理”

企业微信接入DeepSeek,可一键生成24小时“智能助理”

2月21日,上游新闻记者从腾讯了解到,今日企业微信新版本上线,正式发布“智能机器人”、“智能表格-客户跟进总结”等AI功能,灰度接入满血版DeepSeek-R1大模型。企业可一键创建基于内部知识库的专...

AI选股亏了!看三大模型怎么“狡辩”,DeepSeek硬刚到底

AI选股亏了!看三大模型怎么“狡辩”,DeepSeek硬刚到底

让AI去选股,会比散户强吗?昨天,A股收盘之后我们做了一个试验,让DeepSeek、豆包、同义千问分别各自选择一只看好的股票,在今天开盘买入。三大AI经过各自的分析之后,分别给出了以下三只股票:Dee...

部署智慧新赛道!DeepSeek落地吴江!

部署智慧新赛道!DeepSeek落地吴江!

在DeepSeek爆火出圈的同时,各地的本地化部署已然争相展开。日前,江苏吴江区数据局正式引入并本地化部署DeepSeek智能平台,标志着吴江在数字城市建设与人工智能技术应用领域迈出关键一步。目前,吴...