当前位置:首页 > Deepseek应用场景 > 正文内容

OpenAI罕见宣布将开源推理模型,DeepSeek给逼的

3个月前 (04-01)Deepseek应用场景244

就在刚刚,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。


据Altman透露,这是自GPT-2以来OpenAI首次计划发布开放权重语言模型。


他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。



作为参考,开放权重(open weight)是指将AI模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。


用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。


虽然开放权重不能完全等同于开源,是一种介于完全闭源和完全开源之间的折中方案,但它是开源理念在AI领域的一种延伸和部分实现,包括此前宣称开源的DeepSeek V3/R1同样只开放了权重。


在正式发布前,OpenAI将依据其“准备框架”对模型进行评估,确保其安全性与可靠性。


考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。


为进一步完善开发流程,OpenAI计划举办一系列开发者活动,以收集反馈并展示早期原型。首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。


有兴趣参与的开发者可通过链接报名:
https://openai.com/open-model-feedback



OpenAI研究员约翰内斯·海德克(Johannes Heidecke)对此补充道:


“安全性是我们开发开放权重模型的核心。从预训练到发布,我们都会遵循严格的准备框架,确保不会推出可能引发灾难性风险的模型。尽管开放模型面临独特挑战,我们对此充满信心。”


目前,Altman的评论区已经乱成一锅粥了。


网友呼声最高的模型是OpenAI o1 mini,全球最大AI开源社区Hugging Face CEO Clément Delangue也现身评论区。



谈到开源,自然绕不开DeepSeek。R1和R2的身影也充斥着整个评论区。




网友是懂Sam Altman的。毕竟GPT-5也说是“未来几个月”发布,但至今未见踪影。



Altman此前发文透露,得益于GPT-4o的多模态图像生成功能,OpenAI在过去五天内新增了100万用户。



并且由于大量用户的涌入,导致OpenAI的GPU被“融化了”,等模型开放后只能说形势易转。



值得一提的是,Altman上个月曾与硅谷知名分析师Ben Thompson进行了一场深度对谈,其中也有谈到包括开源模型以及和DeepSeek的竞争。


他当时表示:


我认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。


这对我们来说是一个教训,那就是当我们隐藏一个功能时(思维链),我们给其他人留下了获得病毒式传播的机会。这是一个很好的警醒。它也让我重新思考我们在免费层中提供的内容,GPT-5将可以免费使用。


在今天的发文中,他表示“我们已经考虑这个问题很长时间了,但其他优先事项曾经占据了更高的优先级,现在感觉发布它变得非常重要。”


显然,这位曾罕见承认OpenAI封闭策略站在“历史的错误一方”的CEO已经深刻认识到开源的战略意义。


在接下来的几个月内,无论是Llama 4,还是DeepSeek R2都将成为击垮OpenAI声誉的重要一击,而此次宣布开源,或许正是OpenAI精心准备的一招反击。


“OpenAI罕见宣布将开源推理模型,DeepSeek给逼的” 的相关文章

DeepSeek R2即将发布,关注AI产业链闭环

DeepSeek R2即将发布,关注AI产业链闭环

周末看到有大V说“DeepSeek沉寂4个月,归来仍是顶流”,一看原来是DeepSeek R2即将要发布了,目前预期是5月,预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产...

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

春节期间,在杭州的梁文锋打破了世界科技舞台上沉默许久的平静,也给全球资本市场带来了巨大扰动,特别是对以英伟达为代表的美股巨头造成了直接冲击,一度引发硅谷“恐慌”。DeepSeek的横空出世,对靠AI产...

Ai赋能,义乌老板已用DeepSeek卖货……

Ai赋能,义乌老板已用DeepSeek卖货……

如今,人工智能以极快的速度走进我们的生活,浙江义乌小商品市场的商户们也紧跟浪潮,玩出了新花样——利用DeepSeek大模型,他们不仅成功将商品推向国际市场,还“秒学”36种外语,成为了“国际交流小能手...

00后主播用DeepSeek直播1天卖出3.3亿元?有人用它写歌获利数万元被投诉了

00后主播用DeepSeek直播1天卖出3.3亿元?有人用它写歌获利数万元被投诉了

据海报新闻3月10日报道:3月8日,00后主播称用DeepSeek直播1天卖出3.3亿元再度引发关注。据悉,该团队早就开始用AI整理直播话术、梳理直播话术,让工作效率大大提升。据此前报道,DeepSe...

DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发

DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发

按时整活!DeepSeek开源周第四天,直接痛快「1日3连发」,且全都围绕一个主题:优化并行策略。DualPipe:一种创新的双向流水线并行算法,能够完全重叠前向和后向计算-通信阶段,并减少“流水线气...

深圳一公司抢注54个DEEPSEEK系列商标 国家知识产权局:坚决驳回!

深圳一公司抢注54个DEEPSEEK系列商标 国家知识产权局:坚决驳回!

2月24日,国家知识产权局发布通告,依法驳回抢注“DEEPSEEK”等相关商标注册申请。国家知识产权局通告中表示,近期,杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek人工智能大模型在全...