当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

6个月前 (02-26)DeepSeek技术交流393

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

Deepseek微信小程序入口使用教程-deepseek的微信入口在哪里?微信如何才能使用免费的 Deepseek小程序?

Deepseek微信小程序入口使用教程-deepseek的微信入口在哪里?微信如何才能使用免费的 Deepseek小程序?

太多的朋友在后台问deepseek的微信入口在哪里?微信如何才能使用免费的 Deepseek小程序?虽然deepseek有网页版(https://chat.deepseek.com),但毕竟访问没有微...

印度力图打造“本土DeepSeek”,分析师:你们不敢创新

印度力图打造“本土DeepSeek”,分析师:你们不敢创新

凤凰网科技讯 4月16日,金融时报发文,印度正押注于“低成本创新”的传统以及其庞大的科技人才库,以求在全球AI竞赛中迎头赶上,同时在这个快速发展的行业中分得一杯羹。印度总理纳伦德拉・莫迪领导的政府认为...

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

原标题:青岛AI企业如何高效拥抱DeepSeek青岛日报/观海新闻记者 孙 欣 周晓峰 杨 光美国当地时间2月17日晚间,马斯克旗下人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布...

吉安:实现DeepSeek+政务服务三大场景创新应用

吉安:实现DeepSeek+政务服务三大场景创新应用

12345政务服务便民热线中心大江网/大江新闻客户端讯 记者周雪莉摄影报道:随着国产人工智能大模型DeepSeek的全球瞩目,各地加速推进“人工智能+政务服务”转型。近日,吉安市实现DeepSeek在...

DeepSeek的顺风车,为何只有腾讯元宝成功“上车”?腾讯元宝联动DeepSeek,打出了当年红包大战的风采

DeepSeek的顺风车,为何只有腾讯元宝成功“上车”?腾讯元宝联动DeepSeek,打出了当年红包大战的风采

腾讯元宝联动DeepSeek,打出了当年红包大战的风采@明晰野望原创作者丨茯神腾讯元宝的大模型超车,是开年以来业内最津津乐道的话题。元宝从百模大战小透明,一度跃升至中国区苹果免费App下载排行榜第一。...

荣耀AI搜索官宣接入DeepSeek联网版

荣耀AI搜索官宣接入DeepSeek联网版

2月21日晚间,荣耀终端宣布,荣耀AI搜索接入DeepSeek联网版,将陆续覆盖更多手机机型。荣耀方面介绍,即日起,DeepSeek-R1联网版将覆盖荣耀手机MagicOS 8.0及以上,以及YOYO...