当前位置:首页 > DeepSeek技术交流 > 正文内容

“像DeepSeek这样的团队,中国至少还有18个”

12个月前 (04-30)DeepSeek技术交流541

2025年,以DeepSeek为代表的人工智能技术掀起热潮,令国产大模型格局发生巨变。未来人工智能如何进一步发展?中国的人工智能发展之路如何走?

在第八届数字中国建设峰会期间举办的“院士专家行”活动上,中国工程院院士吴志强、陈军、刘韵洁,中国科学院院士童庆禧等围绕上述话题,各抒己见。

生态蓬勃发展

类似DeepSeek的团队还有18个

主持人:DeepSeek对创新发展带来什么启示?

吴志强:我们一直在关注全球的人工智能发展。无论是DeepSeek,还是海外的ChatGPT,都不是一日成长起来的。实际上,像DeepSeek这样的团队,在中国至少有18个和它水平差不多的,只是DeepSeek冒出来了。现在人工智能已经形成蓬勃发展的生态,我们要清楚整个生态体系才能真正引领或者把控局面。

我们在用人工智能技术做城市规划时是“两手推进”。一方面是用通用人工智能大模型,但有两个缺点:一是模型训练时“吃进去”的原料粗糙,二是算力消耗巨大。

另一方面是采用精细的数据来训练模型,吃的都是“精粮”。我们发现,在这种训练模式下,仅用5%-10%的算力,就能完成更加精准的内容输出。这意味着,“精准”和“普遍”两条道路都要走。

陈军:今年DeepSeek出来的时候,大家对中国技术有这样的突破,感到振奋。

DeepSeek确实不错,但你让它作首诗还可以,如果让它做一个专业的“东西”就差很多。所以我认为:

第一,每个领域、每个专业都有很多知识。首先要把知识汇集起来、提炼出来,建成知识库。我们要利用人工智能技术把我们行业的知识好好梳理、总结、应用。

其次,现在的大模型仍是语言大模型,它讲究的是上下文关系、推理关系。但如果要涉及地理信息、城市规划等领域,涉及很多空间信息,比如前后左右、地上地下、室内室外等,所需要的关系结构就变成了三维时空关系。所以要发展“时空大模型”,大模型要从语言模型走向“时空大模型”。

最后,我认为,现在要积极拥抱人工智能,但不要完全单纯地使用人工智能,要把我们的专业智能和机器智能有机结合起来。

刘韵洁:我想谈两点启发:第一,“六小龙”不光只有DeepSeek。各地政府去寻找与“六小龙”一样的人才或者团队,这是不太可能成功的。好的创新环境,对创新宽容的支持度是最重要的。“六小龙”出现在杭州不是偶然,是有必然性的。

第二,DeepSeek的成功说明,任何一个创新的团队,都要勇敢挑战自己从事的领域中最困难的问题。

我判断DeepSeek的成功就是基于问题导向的。只有大算力才能出现大智能?还是可能少用一些算力也能出现更高的智能?我认为它就解决了这个问题。这些给了我启发:哪怕我们现在还处在劣势的一些领域,完全有创新、赶超的机会和可能。

将有AI营养师等新职业

让青年“冒头”

主持人:未来数字中国的建设应该怎么做?我们应该关注些什么、部署些什么、推进些什么?

童庆禧:每天中国大概有将近四五百个遥感卫星在天上转,这意味着,传输下来的数据量甚至能到EB级。对于这些数据而言,如果人工智能大模型不能和遥感空间多维的信息相结合,仅仅聚焦国际上或者国内通用的模型,可能解决不了实际问题。所以,应该针对时空多维信息来发展我们的大模型。

吴志强:我认为要关注两点。一是新的职业训练师。我们在训练人工智能的过程中,越来越深地感受到,怎么训练各行各业特别需要的大模型,以及训练的时候给它什么“料”训练很重要。就像比赛一样,除了运动员,教练团同样重要,这事关最后出的效果好不好。这就意味着未来专门的AI训练师和AI营养师会成为新的职业。

第二点是青年涌现。发展人工智能不是只有国家战略、总体布局、自上而下的,有时候是自下而上的。比如刚才说有一群类似DeepSeek的团队,有很多只是暂时没冒出来而已。

要允许青年冒头。我团队的学生在三年前送给我一个“AI吴志强”,是他们自己“玩”出来的——把我所有写过的、发表的书全部训练后做出来的,非常优秀。这个产品是完全在计划外的,只是一帮学生觉得好玩做的。

在中国人工智能领域的未来发展中,这种“青年涌现”是我们要非常注意的现象。我们的眼睛要看到他们,要鼓励他们,要给他们营养。他们可能“玩”出世界级题目来。

陈军:一方面,还是要打造人工智能的公共产品。比如日常生活中,我们并不知道使用的电是核电、火电,还是水电,只要连上就能用。未来,人工智能也要像这样,并不是形成寡头,或者谁都去做;应该提供一些通用的工具,让各家在这个平台上去完善应用场景。

另一方面,要打造良好的生态。如果我们搞人工智能,搞到最后把我们所做的专业消灭了,把我们的行业消灭了,就是一种罪过,我们不应该走这条路。

我的理解是,人工智能出来后,将来会把很多费力的、危险的工作交给机器去做,人去做知识工程师,总结知识、凝练知识。

当年汽车发明出来的时候,国外有一些人很恐慌,觉得马车夫都没事干,要失业了。最后发现有了加油站、4S店、修理厂、出租车等行业,孵化了一批新职业。

我觉得我们要致力于打造良好的生态,让这个社会更好地发展。要把各行各业的人变成那个行业的知识工程师,让他们去创造知识、加工知识,然后把知识“喂”给机器,让机器帮我们干那些人不愿意干的工作,这样才是一个良好的生态。

原标题:《“像DeepSeek这样的团队,中国至少还有18个”》


““像DeepSeek这样的团队,中国至少还有18个”” 的相关文章

风险vs机遇!近百家公司抢搭“DeepSeek快车”

风险vs机遇!近百家公司抢搭“DeepSeek快车”

DeepSeek大热,风险与机遇并存。自蛇年新春开市以来,A股刮起两股风,一是“哪吒风”,二是“DeepSeek风”。A股市场上,一场围绕着以DeepSeek为中心的投资盛宴火热开启,几乎沾上Deep...

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

国产人工智能企业深度求索开发的大模型DeepSeek开源周落下帷幕。2月28日,DeepSeek最新宣布,开源面向DeepSeek全数据访问的推进器3FS(Fire-Flyer File System...

百度搜索宣布将全面接入DeepSeek及文心大模型深度搜索功能

百度搜索宣布将全面接入DeepSeek及文心大模型深度搜索功能

【百度搜索宣布将全面接入DeepSeek及文心大模型深度搜索功能】财联社2月16日电,百度搜索和文心智能体平台宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能。搜索用户可免费使用DeepS...

新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练

新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练

明敏 发自 凹非寺量子位 | 公众号 QbitAI刚刚,DeepSeek官方发布DeepSeek-V3模型更新技术报告。V3新版本在数学、代码类相关评测集成绩超过GPT-4.5!而且这只是通过改进后训...

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

媒体报道,全国人大代表、四川天府银行董事长黄毅接受采访时表示,人工智能大模型为银行业转型带来诸多机遇。其一,显著降低大模型应用成本。其开源策略使企业能够以较低成本使用先进大模型,减轻银行尤其是中小银行...

从DeepSeek看人工智能自主创新的战略价值

从DeepSeek看人工智能自主创新的战略价值

作者:彭一杰(北京大学光华管理学院研究员、人工智能研究院多智能体与社会智能中心主任)随着全球科技竞争的加剧,人工智能已成为国家竞争力的重要标志。无论是国家还是行业、个人,都在积极探索如何利用人工智能赋...