楼主: CDA网校
1760 10

Agentic AI to Innovator AI to the Next [推广有奖]

管理员

已卖:189份资源

泰斗

2%

还不是VIP/贵宾

-

威望
3
论坛币
114997 个
通用积分
9589.4431
学术水平
268 点
热心指数
276 点
信用等级
243 点
经验
227157 点
帖子
6826
精华
19
在线时间
4361 小时
注册时间
2019-9-13
最后登录
2025-12-8

初级热心勋章

楼主
CDA网校 学生认证  发表于 2025-7-31 09:26:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Agentic AI to Innovator AI to the Next

正文

  1. 目录

  2. Agentic AI 的突进

  3. - L2 Resoners

  4. - L3 Agents

  5. L4 Innovator: 科学直觉

  6. - 大语言模型对科学数据的表示并不完备

  7. - 科学基础模型赋予AGI的科学直觉

  8. - Discovery New Science

  9. - 新的数学定理证明

  10. - 新药物/材料的发现

  11. What's the Next

Agentic AI 的突进

2024年七月Forbes和BloomBerg讨论了OpenAI对AGI的五档定义,最早发布的ChatGPT是典型的L1 Chatbots.

Stages of Artificial Intelligence

Level 1 Chatbots, AI with conversational language

Level 2 Reasoners, human-level problem solving

Level 3 Agents, systems that can take actions

Level 4 Innovators, AI that can aid in invention

Level 5 Organizations, AI that can do the work of an organization

L2 Resoners

2024年ChatGPT o1系列的发布代表着L2 Resoner阶段的开始,而2024年底DeepSeek R1的开源,极大的加速了L2 Reasoner阶段,推动2025年的主流大语言模型如Gemini Pro 2.5,Qwen3等都极大增强了模型的推理能力。

2025年七月份发布的Grok4 将推理阶段训练的算力提升了十倍,这意味着Grok 4在L2 Reasoner 阶段的模型能力已经达到或接近饱和,进一步提升则需要迈入下一阶段。

L3 Agents

AI Agents一直是今年热门的主题,初创公司Manus,Genspark等的Agent产品,发布即爆款,能力强大,让人印象深刻。这些Agent产品都是基于ChatGPT、Claude等大语言模型基模型进行研发,增强了工具调用,自主规划,自动化执行,协作等能力。这些能力,同样也是大语言模型基模型接下来进行系统增强,进入L3 Agents阶段的关键,即Agentic Model。

如何训练一个强大的Agentic Model,参考Kimi K2和Grok 4,一方面,通过大规模Agentic数据合成,产生大量高质量的Agentic数据,并将这些数据用于Pre-training阶段,使得模型能够原生学会任务的目标分解,任务规划,工具调用及协作。

Grok 4在Pre-training阶段和Post-training阶段都引入了tool use,进一步增强了数据的多样性和模型的Agent的能力;最后,Grok4通过在训练阶段深度整合Agent/multi-agent的能力,进一步提升了Grok的智能,从而成为率先迈向L3 Agents的标杆工作,Agent/multi-agent能力的整合加持使得Grok 4 在所有学科达到超出博士的水平。

马斯克在Grok 4的发布会最后提到的预计年底能够"discovery new science",则是接下来计划迈向L4 innovators的里程碑标志。

L4 Innovator: 科学直觉

L4 innovator能够实现discovery new science的关键是赋予LLM科学直觉。

大语言模型对科学数据的表示并不完备

AlphaFold是一个L2的SFM,它的输入是蛋白文本序列:

1. Human insulin (truncated)

2. GIVEQCCTSICSLYQLENYCN

它的输出也可以表示为文本的PDB文件:


1.  HEADER    HORMONE                               28-FEB-78   1ZNJ              
2.  TITLE     HUMAN INSULIN A-CHAIN                               
3.  ATOM      1  N   GLY A   1      11.104  13.207   2.122  1.00 20.00           N  
4.  ATOM      2  CA  GLY A   1      11.954  14.380   2.306  1.00 20.00           C  
5.  ATOM      3  C   GLY A   1      13.413  13.993   2.670  1.00 20.00           C  
6.  ATOM      4  O   GLY A   1      14.019  14.870   3.313  1.00 20.00           O  
7.  ATOM      5  N   ILE A   2      14.012  12.806   2.312  1.00 20.00           N  
8.  ATOM      6  CA  ILE A   2      15.410  12.376   2.648  1.00 20.00           C  
9.  ATOM      7  C   ILE A   2      15.681  11.165   3.571  1.00 20.00           C  
10. ATOM      8  O   ILE A   2      16.570  11.196   4.440  1.00 20.00           O  
11. ...
12. TER
13. END

那么能否把蛋白质的文本序列作为输入,PDB的文本数据作为输出,训练基于decoder架构的的AGI具备或者超过AlphaFold的能力,从而变得更加全能?

实际上过去十多年里,科研人员已经尝试过大量的基于transform架构的方案,都无法超过AlphaFold。

究其根本原因,AGI的核心在自然语言领域是完备的,可以有效的基于自然语言学习,推理及交互。但是自然语言对于蛋白质结构的描述,是一种简化的,不完备的表示(缺失了大量的物理的、化学的和生物学的信息)。而AlphaFold的成功在于它通过更加复杂的网络设计,将物理的原子空间信息,化学的键角信息,生物的进化信息进行了有效的表征、整合和建模。

因此,在科学领域,针对不能被自然语言进行完备表示的科学数据,训练专有的科学基础模型,通常是最经济的路径。例如现在快速发展的材料/分子模型,流体/气象模型,生命/细胞模型,电磁模型。

科学基础模型赋予AGI的科学直觉

多模态大语言模型MLLM (Multimodal Large Language Model)是LLM发展路线上在的关键技术环节和关键阶段,当前多模态主要指语言+视觉+语音。同样的道理,语言对于视觉数据和语言数据的表示也是不完备的,因此需要MLLM来整合视觉和语言数据中更多的信息来增强AGI的能力。

LLM MLLM SFM
模态:语言 模态:语言+图像+音频 模态:自然科学数据(序列、点云、表面、网格、轨迹)
学习对象:人类语言 学习对象:感知世界 学习对象:自然规律
应用领域:对话、推理、代码等 应用领域:视觉问答、多模态搜索 应用领域:药物设计、材料科学、流体、电磁、天文等

对于AGI,科学基础模型SFM 是对自然科学数据表征和理解的模态,这表现在:

  1. SFM是LLM在物理世界的延展模态
  2. SFM 赋予 AGI 真实世界中的科学直觉
  3. SFM 是 AGI 的必要补集,而非另一个模型而已
  4. SFM 是 AGI实现现实世界效用的关键支柱 科学基础模型(SFM)不仅是 AGI 的一个模态,更是让 AGI 具备对现实世界中物理、化学、生物等科学数据和规律认知的核心组成部分。

Scientific Foundation Models (SFMs) represent a critical modality of AGI - grounding general intelligence in the physical, biological, and chemical laws of the real world.

Discovery New Science

由于科学领域的繁多,科学基础大模型在不同领域发展的节奏是不同的,我们可以畅想一下未来半年里前沿LLM实现L4 Innovator的几种可能方式和领域:

新的数学定理证明

数学是人类语言和自然科学两者共通的重要组成, 近些年,如AlphaProve,AlphaGemetry,AlphaEvole等工作,持续推进和提升LLM解决数学领域问题的能力,近期谷歌Gemini获得2025 IMO金牌,实则是LLM在数学领域能力和创造力的一个关键里程碑。

同时,由于数学可以通过思维实验进行推理和验证,使得数学有可能成为诸多学科里,最有可能率先实现基于LLM实现新发现,可能在不久的将来,某个领先的大语言模型在进行了数月的联系思考、推演和验证后证明了孪生素数猜想、解决了纳维-斯托克斯方程的存在性、或是证明黎曼猜想。

新药物/材料的发现

制药是各个传统行业中研发投入比例最大的,也是各个行业中,将科学发现和转化研究结合最系统的,整个药物研发十多年的研发周期,七个大的研发里程碑阶段,目标就是将一个科学新发现(疾病的新机制),转化为一个在真实世界中有效的治疗方案。

小分子化合物的化学空间(可能存在的小分子的集合)大概为10^60,蛋白质的数量级别大概为 20^300≈ 10^390,科学基础模型如 PanguDrug、AlphaFold通过对大量小分子和蛋白质的学习和建模,能够更好的理解化学空间和蛋白质空间,因此,利用Agentic AI和 科学基础模型的融合和交互,在现实世界的实验室环境中进行持续的测试和验证,使得Agentic AI能够系统的学会对于分子改造以及实验结果之间的映射,通过强化学习进行系统的优化和修正,从而实现新药物的发现(材料也类似)。如下图所示,其中的关键技术都已具备,需要的是自主发现系统的研发。

What's the Next

下一阶段的L5: Organizations会是什么?我们沿着新药物的发现去展开。

我们可以把药物研发过程看作是一个对药物分子的多层次测试系统(Mult-level testing system),不同阶段的研发里程碑代表不同阶段的测试目标,涉及到的数据以及实验平台都是不一样的,例如:

  1. 药物设计平台AIDD利用模型和仿真对药物分子进行虚拟的验证;
  2. 高通量筛选HTS在分子水平进行验证;
  3. 类器官和器官芯片OoC在组织器官水平进行验证;
  4. 临床实验在招募的病人上进行验证;
  5. 最终临床四期在真实世界中持续对药物进行验证;

对于未来制药发现的 L5: Organizations,需要能够持续建立起从小规模的实验范围,到接入真实世界的数据的连续能力,通过多层次的Agentic AI,接入、理解和持续学习真实世界数据对于研究目标的影响,从而真正的把药物研发的全流程,变成AGI驱动的新变革。

学习入口:https://edu.cda.cn/goods/show/3814?targetId=6587&preview=0

推荐学习书籍 《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~ !

免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:innovator novat agent INNOV Next

沙发
CDA网校 学生认证  发表于 2025-7-31 09:31:05
多模态大语言模型MLLM (Multimodal Large Language Model)是LLM发展路线上在的关键技术环节和关键阶段,当前多模态主要指语言+视觉+语音。

藤椅
CDA网校 学生认证  发表于 2025-7-31 09:31:37
数学是人类语言和自然科学两者共通的重要组成, 近些年,如AlphaProve,AlphaGemetry,AlphaEvole等工作,持续推进和提升LLM解决数学领域问题的能力,近期谷歌Gemini获得2025 IMO金牌,实则是LLM在数学领域能力和创造力的一个关键里程碑。

板凳
CDA网校 学生认证  发表于 2025-7-31 09:32:08
利用Agentic AI和 科学基础模型的融合和交互,在现实世界的实验室环境中进行持续的测试和验证,使得Agentic AI能够系统的学会对于分子改造以及实验结果之间的映射,通过强化学习进行系统的优化和修正,从而实现新药物的发现(材料也类似)。

报纸
cre8 发表于 2025-7-31 09:55:30
谢谢分享!

地板
微心在线 在职认证  发表于 2025-7-31 10:00:09
6666

7
yiyijiayuan 发表于 2025-7-31 15:03:58
还是支持。

8
babylaugh 发表于 2025-8-1 09:03:18
点赞分享

9
redflame 发表于 2025-8-1 10:11:15
感谢分享

10
晏几道 发表于 2025-8-1 13:46:08
非常有用

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-9 09:45