当前位置:首页 > Deepseek应用场景 > 正文内容

24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练

1年前 (2025-05-22)Deepseek应用场景838

Mistral沉默好久,果然在憋大招。

刚刚发布最新开源编程模型Devstral,在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。

并且参数只有24B,可以在单卡RTX4090甚至32G内存的Mac上运行。

Devstral专为编程智能体推出,解决传统大模型只擅长碎片化的编程任务,难以解决现实世界软件工程的问题。

它针对真实的GitHub Issue训练,重点在大型代码库中代码的上下文理解、识别不同组件间的关系,以及识别复杂函数中的细微错误。

在包含500个真实GitHub Issue问题的SWE-Bench Verified基准测试中,Devstral不仅成为开源SOTA,还优于许多同等参数规模的闭源模型。

Devstral由Mistral AI和All Hands AI合作开发,使用Apache2.0开源许可。与上一款代码模型Codestral明确禁止“员工在公司业务活动中进行任何内部使用”相比也更开放了。

这次发布没有配套论文,也没有更多详细的技术介绍,那么效果具体如何,只能看实际测试了。

最新开源代码模型实际表现

合作开发方All Hands AI联创分享了Devestral给他带来的“惊喜时刻”:

当被要求写一个待办事项列表APP时,AI没有直接开始写,而是询问用户想要使用哪些技术栈。

还有开发者手动为Devstral添加了视觉支持,并要求它复刻Claude网页版的界面UI。

虽然结果并不是很出彩,但算是完成了任务。

据这位开发者分析,Devtral是Mistral-Small的微调,不清楚官方为什么把视觉编码器拿掉了,直接加回去就能使用了。

与All Hands AI合作开发

合作方All Hands AI的口号是“少写代码,多做事“,他们没有开发自己的基础膜,而是专注于构建智能体框架。

Devstral可与All Hands AI的OpenHands或SWE-Agent等智能体框架配合使用。

OpenHands智能体框架可以执行人类程序员能做的任何操作,包括修改代码、运行命令、浏览网页、调用API,甚至可以从StackOverflow复制代码片段。

Devestral目前属于研究预览版状态,团队表示正在努力努力构建一个更强大的代理编码模型,预计将在未来几周内发布。

自去年4月推出以来,OpenHands在GitHub上已经积攒了5万+标星。

Devstral下载

https://huggingface.co/mistralai/Devstral-Small-2505

参考链接

[1]https://mistral.ai/news/devstral

[2]https://x.com/ngxson/status/1925202510312067494

本文来自微信公众号“量子位”,作者:梦晨,36氪经授权发布。


“24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练” 的相关文章

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek为何掀起全球巨浪?春节期间发布的Deepseek-R1在全球引起震动。著名风险投资家马克·安德森 (Marc Andreessen)甚至描述这是“人工智能的人造卫星时刻”——指的是20...

神州信息:公司引入国产开源大模型DeepSeek

神州信息:公司引入国产开源大模型DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:公司是否有接入deepseek合作??神州信息(000555.SZ)4月21日在投资者互动平台表示,作为领先的金融科技企业,公司引入国产开源大模型DeepS...

江苏多地宣布接入DeepSeek 专家:加速“数智江苏”建设

江苏多地宣布接入DeepSeek 专家:加速“数智江苏”建设

央广网南京2月18日消息(记者庄滨滨)近日,江苏省数据集团完成DeepSeek模型本地化部署,在已有QWen2.5、ChatGLM3等大模型的基础上,全面接入大模型能力开发平台,进一步增强大模型综合方...

新凯来火爆出圈 中国半导体设备或迎DeepSeek时刻

新凯来火爆出圈 中国半导体设备或迎DeepSeek时刻

本报记者 李玉洋 上海报道国内半导体设备行业或将迎来DeepSeek时刻。近日,在2025年上海国际半导体展览会(SEMICON China 2025)上,一家名为深圳新凯来工业机器有限公司(以下简称...

电商课堂引入AI工具 学生用DeepSeek“造金饭碗”

电商课堂引入AI工具 学生用DeepSeek“造金饭碗”

荆楚网(湖北日报网)讯(记者唐天琪 通讯员唐欣)“别问AI会不会抢你饭碗,要问你会不会用AI给自己造个金饭碗!”近日,在武汉城市学院信息工程学部的电商课堂上,学生们利用DeepSeek等先进AI工具,...

中海物业接入DeepSeek大模型,推出“海宝AI助手”

中海物业接入DeepSeek大模型,推出“海宝AI助手”

乐居财经 李兰 3月11日,中海物业通过官方微信公众号宣布,正式接入DeepSeek大模型,推出智能化服务平台“海宝AI助手”。该产品通过AI技术深度赋能物业服务全链条,旨在提升运营效率与标...