当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

1年前 (2025-02-15)Deepseek最新资讯586

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混...

多方恶意抢注DeepSeek商标被驳回

多方恶意抢注DeepSeek商标被驳回

每经快讯,2月24日,国家知识产权局发布通告。近期,DeepSeek在全球范围内引发了广泛关注,个别企业和自然人以社会公众普遍知悉的人工智能大模型名称“DEEPSEEK”等,提交了商标注册申请,个别代...

DeepSeek接入完毕,武汉硚口的这些业务可一键办理

DeepSeek接入完毕,武汉硚口的这些业务可一键办理

极目新闻通讯员 李刚近日,武汉市硚口区行政审批局“公司宝典”微信公众号接入深度求索(DeepSeek)人工智能模型,开创了湖北省省市场主体登记领域使用生成式AI服务群众的先河。公司宝典微信公众号据悉,...

掌趣科技:认为deepseek能助力游戏开发实现行业创新

掌趣科技:认为deepseek能助力游戏开发实现行业创新

金融界3月27日消息,有投资者在互动平台向掌趣科技提问:请问deepseek是否能助力游戏开发,从而实现行业创新,降本增效?公司回答表示:我们认为答案是肯定的。本文源自:金融界...

扬州海关政务终端接入DeepSeek

扬州海关政务终端接入DeepSeek

原标题:扬州海关政务终端接入DeepSeek科技日报讯 (尹红燕 单晓明 记者陈瑜)近日,扬州海关依托DeepSeek研发的大模型技术在政务服务领域取得突破,首批3台“扬关小智”智能政务终端正式投入运...

怎么用deepseek写好文案?deepseek写材料,deepseek续写小说

怎么用deepseek写好文案?deepseek写材料,deepseek续写小说

DeepSeek在文案撰写、材料编写以及小说续写方面都能提供强大的辅助。以下是如何利用DeepSeek进行这些创作活动的具体方法:一、用DeepSeek写好文案明确核心信息:在使用DeepSeek写文...