Agentic AI to Innovator AI to the Next
正文
目录Agentic AI 的突进- L2 Resoners- L3 AgentsL4 Innovator: 科学直觉- 大语言模型对科学数据的表示并不完备- 科学基础模型赋予AGI的科学直觉- Discovery New Science- 新的数学定理证明- 新药物/材料的发现What's the Next
Agentic AI 的突进
2024年七月Forbes和BloomBerg讨论了OpenAI对AGI的五档定义,最早发布的ChatGPT是典型的L1 Chatbots.
Stages of Artificial Intelligence
Level 1 Chatbots, AI with conversational language
Level 2 Reasoners, human-level problem solving
Level 3 Agents, systems that can take actions
Level 4 Innovators, AI that can aid in invention
Level 5 Organizations, AI that can do the work of an organization
L2 Resoners
2024年ChatGPT o1系列的发布代表着L2 Resoner阶段的开始,而2024年底DeepSeek R1的开源,极大的加速了L2 Reasoner阶段,推动2025年的主流大语言模型如Gemini Pro 2.5,Qwen3等都极大增强了模型的推理能力。
2025年七月份发布的Grok4 将推理阶段训练的算力提升了十倍,这意味着Grok 4在L2 Reasoner 阶段的模型能力已经达到或接近饱和,进一步提升则需要迈入下一阶段。

L3 Agents
AI Agents一直是今年热门的主题,初创公司Manus,Genspark等的Agent产品,发布即爆款,能力强大,让人印象深刻。这些Agent产品都是基于ChatGPT、Claude等大语言模型基模型进行研发,增强了工具调用,自主规划,自动化执行,协作等能力。这些能力,同样也是大语言模型基模型接下来进行系统增强,进入L3 Agents阶段的关键,即Agentic Model。
如何训练一个强大的Agentic Model,参考Kimi K2和Grok 4,一方面,通过大规模Agentic数据合成,产生大量高质量的Agentic数据,并将这些数据用于Pre-training阶段,使得模型能够原生学会任务的目标分解,任务规划,工具调用及协作。

Grok 4在Pre-training阶段和Post-training阶段都引入了tool use,进一步增强了数据的多样性和模型的Agent的能力;最后,Grok4通过在训练阶段深度整合Agent/multi-agent的能力,进一步提升了Grok的智能,从而成为率先迈向L3 Agents的标杆工作,Agent/multi-agent能力的整合加持使得Grok 4 在所有学科达到超出博士的水平。

马斯克在Grok 4的发布会最后提到的预计年底能够"discovery new science",则是接下来计划迈向L4 innovators的里程碑标志。
L4 Innovator: 科学直觉
L4 innovator能够实现discovery new science的关键是赋予LLM科学直觉。
大语言模型对科学数据的表示并不完备
AlphaFold是一个L2的SFM,它的输入是蛋白文本序列:
1. Human insulin (truncated)
2. GIVEQCCTSICSLYQLENYCN
它的输出也可以表示为文本的PDB文件:
1. HEADER HORMONE 28-FEB-78 1ZNJ
2. TITLE HUMAN INSULIN A-CHAIN
3. ATOM 1 N GLY A 1 11.104 13.207 2.122 1.00 20.00 N
4. ATOM 2 CA GLY A 1 11.954 14.380 2.306 1.00 20.00 C
5. ATOM 3 C GLY A 1 13.413 13.993 2.670 1.00 20.00 C
6. ATOM 4 O GLY A 1 14.019 14.870 3.313 1.00 20.00 O
7. ATOM 5 N ILE A 2 14.012 12.806 2.312 1.00 20.00 N
8. ATOM 6 CA ILE A 2 15.410 12.376 2.648 1.00 20.00 C
9. ATOM 7 C ILE A 2 15.681 11.165 3.571 1.00 20.00 C
10. ATOM 8 O ILE A 2 16.570 11.196 4.440 1.00 20.00 O
11. ...
12. TER
13. END
那么能否把蛋白质的文本序列作为输入,PDB的文本数据作为输出,训练基于decoder架构的的AGI具备或者超过AlphaFold的能力,从而变得更加全能?
实际上过去十多年里,科研人员已经尝试过大量的基于transform架构的方案,都无法超过AlphaFold。
究其根本原因,AGI的核心在自然语言领域是完备的,可以有效的基于自然语言学习,推理及交互。但是自然语言对于蛋白质结构的描述,是一种简化的,不完备的表示(缺失了大量的物理的、化学的和生物学的信息)。而AlphaFold的成功在于它通过更加复杂的网络设计,将物理的原子空间信息,化学的键角信息,生物的进化信息进行了有效的表征、整合和建模。
因此,在科学领域,针对不能被自然语言进行完备表示的科学数据,训练专有的科学基础模型,通常是最经济的路径。例如现在快速发展的材料/分子模型,流体/气象模型,生命/细胞模型,电磁模型。
科学基础模型赋予AGI的科学直觉
多模态大语言模型MLLM (Multimodal Large Language Model)是LLM发展路线上在的关键技术环节和关键阶段,当前多模态主要指语言+视觉+语音。同样的道理,语言对于视觉数据和语言数据的表示也是不完备的,因此需要MLLM来整合视觉和语言数据中更多的信息来增强AGI的能力。
| LLM | MLLM | SFM |
|---|---|---|
| 模态:语言 | 模态:语言+图像+音频 | 模态:自然科学数据(序列、点云、表面、网格、轨迹) |
| 学习对象:人类语言 | 学习对象:感知世界 | 学习对象:自然规律 |
| 应用领域:对话、推理、代码等 | 应用领域:视觉问答、多模态搜索 | 应用领域:药物设计、材料科学、流体、电磁、天文等 |
对于AGI,科学基础模型SFM 是对自然科学数据表征和理解的模态,这表现在:
SFM是LLM在物理世界的延展模态 SFM 赋予 AGI 真实世界中的科学直觉 SFM 是 AGI 的必要补集,而非另一个模型而已 SFM 是 AGI实现现实世界效用的关键支柱 科学基础模型(SFM)不仅是 AGI 的一个模态,更是让 AGI 具备对现实世界中物理、化学、生物等科学数据和规律认知的核心组成部分。
Scientific Foundation Models (SFMs) represent a critical modality of AGI - grounding general intelligence in the physical, biological, and chemical laws of the real world.
Discovery New Science
由于科学领域的繁多,科学基础大模型在不同领域发展的节奏是不同的,我们可以畅想一下未来半年里前沿LLM实现L4 Innovator的几种可能方式和领域:
新的数学定理证明
数学是人类语言和自然科学两者共通的重要组成, 近些年,如AlphaProve,AlphaGemetry,AlphaEvole等工作,持续推进和提升LLM解决数学领域问题的能力,近期谷歌Gemini获得2025 IMO金牌,实则是LLM在数学领域能力和创造力的一个关键里程碑。
同时,由于数学可以通过思维实验进行推理和验证,使得数学有可能成为诸多学科里,最有可能率先实现基于LLM实现新发现,可能在不久的将来,某个领先的大语言模型在进行了数月的联系思考、推演和验证后证明了孪生素数猜想、解决了纳维-斯托克斯方程的存在性、或是证明黎曼猜想。
新药物/材料的发现
制药是各个传统行业中研发投入比例最大的,也是各个行业中,将科学发现和转化研究结合最系统的,整个药物研发十多年的研发周期,七个大的研发里程碑阶段,目标就是将一个科学新发现(疾病的新机制),转化为一个在真实世界中有效的治疗方案。
小分子化合物的化学空间(可能存在的小分子的集合)大概为10^60,蛋白质的数量级别大概为 20^300≈ 10^390,科学基础模型如 PanguDrug、AlphaFold通过对大量小分子和蛋白质的学习和建模,能够更好的理解化学空间和蛋白质空间,因此,利用Agentic AI和 科学基础模型的融合和交互,在现实世界的实验室环境中进行持续的测试和验证,使得Agentic AI能够系统的学会对于分子改造以及实验结果之间的映射,通过强化学习进行系统的优化和修正,从而实现新药物的发现(材料也类似)。如下图所示,其中的关键技术都已具备,需要的是自主发现系统的研发。

What's the Next
下一阶段的L5: Organizations会是什么?我们沿着新药物的发现去展开。
我们可以把药物研发过程看作是一个对药物分子的多层次测试系统(Mult-level testing system),不同阶段的研发里程碑代表不同阶段的测试目标,涉及到的数据以及实验平台都是不一样的,例如:
药物设计平台AIDD利用模型和仿真对药物分子进行虚拟的验证; 高通量筛选HTS在分子水平进行验证; 类器官和器官芯片OoC在组织器官水平进行验证; 临床实验在招募的病人上进行验证; 最终临床四期在真实世界中持续对药物进行验证;
对于未来制药发现的 L5: Organizations,需要能够持续建立起从小规模的实验范围,到接入真实世界的数据的连续能力,通过多层次的Agentic AI,接入、理解和持续学习真实世界数据对于研究目标的影响,从而真正的把药物研发的全流程,变成AGI驱动的新变革。

学习入口:https://edu.cda.cn/goods/show/3814?targetId=6587&preview=0
推荐学习书籍 《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~ !



雷达卡





6666
京公网安备 11010802022788号







