当前位置:首页 > DeepSeek技术交流 > 正文内容

量化私募巨头纷纷宣布布局AI大模型,会有新的DeepSeek诞生吗?

5个月前 (03-17)DeepSeek技术交流291

作为一名投资者,李萌很久之前就关注到量化私募巨头幻方量化在研究大模型,但是直到今年年初DeepSeek爆火以后,才试用到这款大模型,“原来量化私募做出来的大模型竟然这么好用”。

自从DeepSeek爆火以后,不少头部量化私募表示要加码布局AI领域。

界面新闻注意到,近期蒙玺投资、宽德私募、鸣石私募均发布招聘信息,为各自旗下的AI Lab招揽人才。

在相关招聘信息中,蒙玺投资宣布公司AI Lab全新上线,并向在校生喊出“加入我们,成为改变世界的因子”;宽德私募表示独立孵化的宽德智能学习实验室(WILL)始于但不局限于金融场景,将朝着整个人工智能的星辰大海启航;鸣石私募介绍公司2021年便已成立G-Lab,次年正式开启超级计算“星座计划”,2025年随着“星座计划”超算系列进一步扩容,为G-Lab提供了自由的算力空间。

据中证金牛座消息,近日鸣石基金创始人袁宇还在接受采访时透露,未来公司不排除考虑“直接参与AI产业发展”的可能。

另外,九坤投资近期携手微软团队刊文表示,首次成功复现DeepSeek-R1,还首次发现了输出长度与推理性能提升无关、语言混合(例如中英文夹杂)会显著降低推理能力以及reasoning tokens确实有提升推理性能等问题。

那么,其他的量化私募也有可能打造出比肩DeepSeek的大模型吗?不少用户的心中都泛起了和李萌一样的疑问。

“技术上具备可行性”,在尚艺投资总经理王峥看来,国内头部量化私募的资金实力、算力资源以及人才储备,使其具备进入AI大模型领域的潜力,尤其是九坤成功复现DeepSeek-R1,表明资金充裕、计算资源丰富的量化私募已经能够开展大模型训练。

另有多位受访人士也都认为,量化私募和科技大厂之间本身就有着许多的共性。

首先,二者在人才储备方面非常相似。

王峥指出,量化私募长期以来吸引了大量数学、统计、计算机科学、机器学习领域的顶尖人才,许多从业者本身就有人工智能和算法研究背景。而AI大模型的核心研发涉及概率统计、最优化方法、深度学习等,这些正是量化研究员和算法交易员的强项。

界面新闻梳理发现,很多头部量化私募都拥有大量数理背景或者计算机科学领域的团队成员。以DeepSeek背后的幻方量化为例,私募排排网数据显示,公司策略开发团队有100多人,其中AI Lab有20多人,涵盖奥林匹克数学/物理/信息学竞赛金牌得主,信号识别、机器学习领域专家团队,拓扑学、统计学、运筹学、控制论各学科博士以及资深行业研究专家。

根据私募排排网不完全统计数据,截至今年2月27日已有28家百亿私募于春季发布了量化、算法、机器学习等AI相关的招聘岗位(包含校招、社招、实习生岗位),其中量化私募明显较多,共有19家,占比67.85%。

华南地区的一位量化私募负责人林宇指出,量化私募的研究团队往往具备扎实的AI技术功底。他们在高性能计算、工程实现、模型调优等方面积累了丰富经验,这些能力正是大模型研发的关键所在。因此,这类团队在转向大模型研究时,往往能够快速适应并高效推进,这种优势是其他领域的研究团队难以比拟的。

其次,头部量化私募普遍在算力基础设施方面储备丰厚。

尚艺投资总经理王峥指出,训练AI模型需要极强的分布式计算能力和高性能GPU集群,而量化高频交易机构本身对低延迟计算和超算基础设施的投入极大,具备大规模数据处理的能力。量化私募的交易系统通常已经搭建了专有的数据中心,这与AI大模型的高算力需求有一定的重叠。

界面新闻梳理发现,很多头部量化私募确实都在算力基础设施方面有着深厚的储备。比如早在2020年3月幻方量化就已经正式启用了“萤火一号”超算平台,后续还投建了“萤火二号”;明汯投资自2019年开始大规模建设高性能计算集群,每年持续投入,目前仍处在指数增长阶段;鸣石投资自2022年以来开启超算“星座计划”,陆续上线一期“仙女座”、二期“英仙座”等。

再者,量化模型和大模型研究之间有很多相通之处。

量化私募人士张鑫表示,量化私募团队通过数据分析和算法优化来进行投资研究,这与研发大模型的过程高度一致,都是将人才优势转化为技术创新。而且无论是量化私募还是大模型的研发,本质上都是利用数据和技术来推动创新,两者都依赖大量高质量的数据进行分析和建模,并且都需要开发和优化复杂的算法以提高预测精度或决策效率。

主要区别在于,科技大厂主要面向广泛的通用市场,创造适用于多种应用场景的通用模型;而量化私募则聚焦于投资领域,开发适用于金融市场的专用模型,这种专用模型能够更好地满足特定领域的需求。

华南地区量化私募负责人林宇进一步解释称,量化投资和大模型研究在方法论上存在诸多共性,两者都以数据为基石,通过算法模型的不断迭代优化来驱动决策。在量化交易中,深度学习、强化学习、时间序列建模等技术也早已广泛应用,而这些技术恰恰也是大模型的核心支柱。

以Transformer架构为例,它不仅在自然语言处理领域大放异彩,在金融数据分析中同样展现出巨大潜力。我们可以利用Transformer处理海量的海量金融和市场数据,如新闻舆情、社交媒体等,从中提取有价值的市场信号。这种技术迁移的可行性,源于两者在数据处理模式上的本质相似性。

此外,量化私募和科技大厂都具备雄厚的经济基础。

大模型“很烧钱”是业内的共识。华南地区量化私募负责人林宇指出,大模型的研发需要庞大的计算资源、海量数据以及高水平的研究团队,初期投入较大,对于资金充裕、盈利稳定的量化私募才能更好承担这些研发成本。

“动辄上百万的年薪抢人”、“在算力基础设施上持续投入”、“2.85亿竞拍豪宅”、“个人捐款1.38亿”,近年来量化私募及相关人士一些“壕气十足”的举动,恰好从侧面反映出了部分量化私募的“不差钱”。

根据私募排排网数据,截至今年2月底,国内管理规模超过100亿元的量化私募已经达到32家,另有8家百亿私募为“主观+量化”策略私募。

不过,界面新闻根据公开资料梳理发现,尽管在AI领域的新动作不少,目前尚未有其他量化私募明确宣布将打造类似于DeepSeek的AI大模型。

也有部分受访人士指出,量化私募固然具备一些研究大模型的基础,但是真的去实践的话,也将会面临着不少的挑战。

大岩资本相关人士认为,复现DeepSeekR1确实证明了利用开源代码和强化学习技术可以模仿现有大模型的性能,但并不意味着这种成功可以被轻易复制。复现不仅仅是简单的复制代码,而需要高水平的算法调优、超参数设置和环境调试,这需要顶尖的AI研发团队和长时间的技术积累。此外,训练和调优大规模模型需要庞大的算力和海量数据支持,这不仅涉及硬件设施的投资,还需要长期的运营维护成本。

尚艺投资总经理王峥指出,训练一个通用AI大模型的投资回报率不明确,量化私募的核心目标仍然是提升交易收益率,而AI大模型的研发本质上是一个技术驱动的长周期投入,需要平衡投入和回报的周期,并且AI大模型需要极大规模、多样化的数据进行训练,而量化私募的数据主要集中在金融市场相关领域,相比互联网公司掌握的跨行业、多语言数据,数据广度有限等挑战。

(文中李萌、张鑫、林宇为化名)


“量化私募巨头纷纷宣布布局AI大模型,会有新的DeepSeek诞生吗?” 的相关文章

腾讯游戏《和平精英》接入DeepSeek

腾讯游戏《和平精英》接入DeepSeek

中证报中证网讯(记者 王辉)腾讯旗下战术竞技手游《和平精英》2月21日宣布,将接入DeepSeek,为数字代言人“吉莉”注入人工智能。根据计划,2月25日将开启灰度测试,并在短期内面向全量用户开放。由...

DeepSeek赋能潮起

DeepSeek赋能潮起

新华社北京3月21日电 3月21日,《新华每日电讯》发表题为《DeepSeek赋能潮起》的报道。2025年开年,DeepSeek彻底突破技术圈层,直抵社会大众,成为热议高频词。刚刚结束的全国两会上,人...

外界热议DeepSeek低调“上新”

外界热议DeepSeek低调“上新”

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,...

软通动力:2月初,公司全线产品接入DeepSeek

软通动力:2月初,公司全线产品接入DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:请问公司的人形机器人有没有接入DeepSeek的可能?接入之后变成智能机器人?软通动力(301236.SZ)5月20日在投资者互动平台表示,公司积极拥抱 D...

DeepSeek接入贸易全链路环节!“义乌老板娘”积极拥抱AI新技术

DeepSeek接入贸易全链路环节!“义乌老板娘”积极拥抱AI新技术

在浙江义乌国际商贸城的20多万名从业者中,65%以上是女性,她们也被亲切地称为“义乌老板娘”。随着AI科技的加速发展,这些女性积极拥抱新技术,让小商品贸易赢得更广阔的市场。目前,义乌的AI智创服务平台...

华为云广东DeepSeek思享会·珠海站成功举办——共话AI浪潮下行业深度应用新路径

华为云广东DeepSeek思享会·珠海站成功举办——共话AI浪潮下行业深度应用新路径

当下,人工智能技术日新月异,对各行业的渗透与变革正以前所未有的速度展开,成为推动经济发展和社会进步的关键力量。今年年初DeepSeek爆火,以其独特的技术优势和创新能力,受到了社会各界高度关注。为了进...