当前位置:首页 > Deepseek最新资讯 > 正文内容

首届AI实盘投资大赛:阿里千问20%收益率夺冠,DeepSeek第二,美国四大模

7个月前 (11-05)Deepseek最新资讯258

  北京时间11月4日消息,由第三方机构Nof1于10月18日发起的AI大模型实时投资比赛“Alpha Arena”,历时17天,在今日落下帷幕。

  DeepSeek位列第二,两款中国模型包揽冠亚军,成为全场唯二盈利的大模型。而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。

  AI大模型的综合性能越来越强,如何评估大模型在真实、动态、竞争激烈的环境中的决策水平,是当下AI竞技场最受人关注的领域。

  美国人工智能研究实验室nof1.ai发布的“Alpha Arena”(阿尔法竞技场),向六大顶尖模型提供1万美元及金融市场的实时价格及各类指标数据,让大模型在真实市场中用真金白银进行投资比赛,全程没有人工干预 ,模型进行自主决策和交易,是AI处理实时变动的现实世界任务的真实评测,也因此成为近期最火热的AI大赛。

  竞赛采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,以保证比赛的公平性和透明度。此外,Nof1还允许AI模型“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决出冠军。

  此后的初期阶段,DeepSeek v3.1一直处于领先位置,也让这场比赛广受国际关注。曾经能够与之“一战”的是马斯克旗下的Grok 4,其通过激进的投资策略,一度把与DeepSeek v3.1的差距缩短到1美元的位置。

  不过deepseek,10月21日至22日成为了“转折点”,这两日里,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈转亏,10月22日当日,六个大模型的收益率更是一度全部告负。

  但此时,DeepSeek v3.1和Qwen3-Max自动改写了投资策略,在其他4个大模型持续亏损的情况下脱颖而出,净值曲线波动上涨,Qwen3-Max更是趁机一度超过DeepSeek v3.1。

  截至北京时间11月4日早上比赛结束,阿里千问最后超越DeepSeek,Qwen以超20%的收益率获胜;DeepSeek实现盈利,位列第二。

  赛后,赛事主办方Alpha Arena的创办人Jay Azhang忙着为阿里千问Qwen模型策略及表现打call点赞,并祝贺阿里千问最终赢得冠军。

  根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额,超越OpenAI的4.7%,位列第四。

  OpenRouter推文显示,当下成长最快前10大模型中,有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。

  而在今年9月,零一万物CEO李开复曾公开表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”

  李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。

  有行业人士指出,阿里千问和DeepSeek在实战中的优秀表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。原文出处:首届AI实盘投资大赛:阿里千问20%收益率夺冠,DeepSeek第二,美国四大模型均亏损,感谢原作者,侵权必删!

标签: deepseek

“首届AI实盘投资大赛:阿里千问20%收益率夺冠,DeepSeek第二,美国四大模” 的相关文章

登上《自然》!DeepSeek-R1训练方法发布

登上《自然》!DeepSeek-R1训练方法发布

  DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能...

下一代模型呼之欲出?!DeepSeek的新年礼物mHC是个啥?

下一代模型呼之欲出?!DeepSeek的新年礼物mHC是个啥?

  为AI模型带来了“智能稳定器”,在保持模型宽度的同时,通过“双随机矩阵”的流形约束,解决了超连接(HC)不稳定性问题,确保模型训练稳健,配合算子融合等优化,mHC在MATH、GSM8K...

Deepseek推荐全国旅游百强区第18名:贵州贵阳市花溪区

Deepseek推荐全国旅游百强区第18名:贵州贵阳市花溪区

  日前,全国县镇发展研究课题组deepseek、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

芯报丨中国产业级AI芯片加速崛起,最早2026年迎来“DeepSeek时刻”

芯报丨中国产业级AI芯片加速崛起,最早2026年迎来“DeepSeek时刻”

  据独木资本消息,近日,中山市仲德科技有限公司(简称“仲德科技”)完成数千万元A轮融资,本轮融资由乾融资本领投,长石资本跟投,老股东东莞智富本轮继续追加投资。本轮融资主要用于扩大产能,以...

12月6日DeepSeek预测:黄蜂vs猛龙——巴恩斯率队捍卫主场,猛龙险胜残阵

12月6日DeepSeek预测:黄蜂vs猛龙——巴恩斯率队捍卫主场,猛龙险胜残阵

  北京时间12月6日早8:30,NBA常规赛将上演东部第三猛龙与第十二名黄蜂的较量。坐镇主场的猛龙(15胜8负)近期状态起伏,但凭借0.652的胜率仍稳居东部前列;而6胜16负的黄蜂则深...

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

  用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解决方案。...