楼主: CDA网校
859 17

[每天一个数据分析师] 自然·计算科学丨神经符号回归发现复杂网络动力学 [推广有奖]

管理员

已卖:189份资源

泰斗

2%

还不是VIP/贵宾

-

威望
3
论坛币
115387 个
通用积分
9866.4456
学术水平
268 点
热心指数
276 点
信用等级
243 点
经验
227710 点
帖子
6856
精华
19
在线时间
4366 小时
注册时间
2019-9-13
最后登录
2025-12-19

初级热心勋章

楼主
CDA网校 学生认证  发表于 2025-12-11 09:17:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

导语

网络动力学是分析理解高维复杂系统特性和行为的基础。尽管许多领域积累了大量的观测数据,但只有少数具备清晰原理的数学模型。

近日,清华大学电子工程系李勇教授团队提出一种神经符号回归的方法,能够从数据中自动推导公式。该方法减少了在高维网络中的搜索,使其等价为一维系统,并且使用预训练的神经网络来指导正确的公式发现。在十个基准系统中,他准确恢复了底层动力学的形式和参数。在两个基于实证数据的自然系统中(基因调控和微生物群落),它修正了现有模型。预测误差分别降低了 59.98% 和 55.94%。对于不同尺度下人类流动网络的流行病传播中,该方法发现了跨尺度的节点相关性呈现相同的幂律分布,并且揭示了国家间干预效果的差异。这一成果展现了机器驱动的网络动力学发现如何理解并推动复杂系统科学的发展。

关键词:复杂系统(Complex system),网络动力学(Network dynamics),神经符号回归(Neural symbolic regression),神经网络(Neural network)

周晓俊丨作者 赵思怡丨审校


论文题目:Discovering network dynamics with neural symbolic regression
论文链接:https://www.nature.com/articles/s43588-025-00893-8
发表时间:2025年10月24日
论文来源:Nature Computational Science

复杂系统的挑战

复杂系统的迷人之处在于:个体简单,整体复杂。从神经网络到生态系统,从基因调控到社交传播,局部相互作用能产生意想不到的全局模式。而理解这些模式,关键在于找到描述系统演化的动力学方程。

过去,这类模型往往依赖人类专家的直觉与经验。例如,生物学家用 Lotka–Volterra 方程解释物种共存,物理学家用 Kuramoto 模型刻画振荡同步。然而,大多数系统并没有清晰的“第一性原理”。面对浩如烟海的数据,人类能写出的方程却寥寥无几。

对于这个问题,最近清华大学团队提出了一种名为 ND²(Neural Discovery of Network Dynamics) 的方法,利用神经网络与符号搜索结合,从观测数据中自动“写出”网络动力学公式。简单来说,这是一台能从混乱数据中自己发现自然规律的“机器科学家”。

图1. 方法流程示意图。实例为236个节点和320条无向边的北欧电网,ND² 根据网络结构和节点活动,最后输出的是经典的 Kuramoto dynamics。
图1. 方法流程示意图。实例为236个节点和320条无向边的北欧电网,ND² 根据网络结构和节点活动,最后输出的是经典的 Kuramoto dynamics。

ND²:让高维网络“变简单”的巧思

符号回归(symbolic regression)旨在找到最能拟合数据的数学表达式。它像在数学符号的丛林中搜寻规律,组合+, ×, sin等运算符,最终得到“隐藏公式”。然而,在高维网络中,这种搜索几乎不可能完成——因为变量和连边太多,搜索空间会指数爆炸。作者提出 ND² 架构,将传统的符号回归与神经网络结合,让搜索更聪明、更高效。

第一,引入网络动力学算子(network dynamical operators)。这三种算子——源算子φs、目标算子φt和聚合算子ρ——受图神经网络(GNN)信息传递思想的启发,将复杂的节点-边关系转化为可操作的数学结构。借助它们,研究者把原本随网络规模指数增长的搜索空间压缩成与维度无关的一维问题。

图2. 网络动力学算子压缩搜索空间,b. 网络动力学算子。c. 搜索空间压缩的原理。d. 三节点网络示例
图2. 网络动力学算子压缩搜索空间,b. 网络动力学算子。c. 搜索空间压缩的原理。d. 三节点网络示例

第二, 提出 NDformer 的神经网络,它结合了 GNN 与 Transformer 结构。研究者在上百万个随机生成的动力学系统上对其预训练,让它学会“预测下一个符号”,即预测公式的生成方向。之后,NDformer就像经验丰富的导航员,引导蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)在公式空间中高效探索,大幅加快搜索速度——实验表明加速达三数量级。

图3. 搜索算法流程。系统从网络结构和节点活动中提取信息,在 NDformer 的引导下通过蒙特卡洛树搜索(MCTS)生成并评估候选公式,最终选出最优的动力学方程。
图3. 搜索算法流程。系统从网络结构和节点活动中提取信息,在 NDformer 的引导下通过蒙特卡洛树搜索(MCTS)生成并评估候选公式,最终选出最优的动力学方程。

模拟验证:十个模拟系统网络动力学的高效复原

作者首先在十类经典动力学系统上测试 ND²,包括 Kuramoto、Rössler oscillator、FitzHugh–Nagumo 神经模型、Wilson–Cowan 脑动力学模型、基因调控与种群演化模型等。结果显示,ND²不仅能准确恢复出所有真实公式的形式和参数,还能再现系统的时间演化轨迹。相比其他方法(如SINDy稀疏识别和PIGN网络推理),ND²在准确度与速度上都全面领先。

图4. 使用 ND² 在十个模拟系统上复原动力学的实验,其准确度和速度均显著优于对比方法
图4. 使用 ND² 在十个模拟系统上复原动力学的实验,其准确度和速度均显著优于对比方法

更令人惊讶的是,它能在观测数据存在显著噪声、网络结构部分缺失甚至完全未知时仍然成功恢复规律。这表明,ND²不仅是“拟合数据”,而是捕捉了系统背后的生成机制。

自然系统:修正经典模型中的网络动力学

当ND²被用于真实生物系统时,它展示了比传统人类模型更精确的解释力。在酵母细胞周期的基因调控网络中,经典的 Hill 方程假设基因间相互作用是两两相加的。然而ND²发现了新的公式形式——相互作用项不是独立求和,而是以邻居基因总体表达量为输入的逻辑函数(logistic function)。这意味着基因的调控存在“更高阶的间接作用”,一个基因对另一个的影响还取决于其他基因的状态,为理解多基因调控提供了新的视角。

图5. 上:基因。现有公式和修正公式;节点活动与真实值吻合(不同颜色代表不同表达的基因)。下:微生物群落。现有公式和修正公式,节点活动比现有公式更符合真实值(不同颜色代表不同种群)
图5. 上:基因。现有公式和修正公式;节点活动与真实值吻合(不同颜色代表不同表达的基因)。下:微生物群落。现有公式和修正公式,节点活动比现有公式更符合真实值(不同颜色代表不同种群)

在微生物群落动力学中,经典的 Lotka–Volterra 方程假设物种间竞争或共生的强度与种群规模正相关。ND² 结果显示这一假设并不成立:当某个物种数量增多时,其对其他物种的敏感性反而减弱。新发现的公式形式用饱和型函数描述这种效应,揭示了群落稳定性的自调节机制。

社会系统:理解社会复杂性

ND²还被用于分析全球人类流动网络上的新冠疫情传播。研究团队将七个地区(包括美国、中国、纽约、伊利诺伊等)的确诊数据与交通流量结合建模。结果显示,不同区域的传播方程形式虽有差异,但都遵循相同的规律:节点间的传播影响强度呈现幂律分布(power-law distribution),其指数约为−0.8,说明疫情传播在多尺度网络中具有普适性。

图 6: 新冠疫情传播。a. 不同国家空间尺度传播网络。b. ND² 自动发现的传播方程。e. 节点相关性的幂律分布。f. 两国自演化项 W(x) 的差异
图 6: 新冠疫情传播。a. 不同国家空间尺度传播网络。b. ND² 自动发现的传播方程。e. 节点相关性的幂律分布。f. 两国自演化项 W(x) 的差异

进一步比较发现,中国和美国的传播动力学存在显著差异。中国模型中的自演化项(self-evolution term)表现出明显的自抑制效应,即病例数上升会自动减缓增长;而美国的模型则近似线性,反映出两国在非药物干预策不同。通过稳态分析(steady-state analysis),作者甚至推算出了中国疫情传播的“临界点”:当跨省流动βeff超过阈值 βc 时,疫情会从可控状态跃迁为爆发状态。这种从数据中自动获得的动力学洞见,正是复杂系统科学长期追求的“可解释预测”。

当 AI 成为科学的合作者

在科学史上,从开普勒到牛顿,从麦克斯韦到洛特卡,每一次发现自然规律的过程,都依赖人类的洞察与直觉。如今,ND² 展示了另一种可能:AI 不再只是分析工具,而是科学规律的共同发现者

当一台算法能自动读懂数据背后的动力学、提出修正后的理论,并揭示自然界的隐藏规律,我们或许正站在一个新的科学范式的起点——让机器成为科学的“共作者”,让复杂系统的秘密,在数据与公式之间自动显现。

推荐学习书籍 《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~ !

免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:复杂网络 计算科学 动力学 distribution Monte Carlo

沙发
CDA网校 学生认证  发表于 2025-12-11 09:18:26
在科学史上,从开普勒到牛顿,从麦克斯韦到洛特卡,每一次发现自然规律的过程,都依赖人类的洞察与直觉。

藤椅
CDA网校 学生认证  发表于 2025-12-11 09:18:36
如今,ND² 展示了另一种可能:AI 不再只是分析工具,而是科学规律的共同发现者。

板凳
CDA网校 学生认证  发表于 2025-12-11 09:18:43
当一台算法能自动读懂数据背后的动力学、提出修正后的理论,并揭示自然界的隐藏规律,我们或许正站在一个新的科学范式的起点——让机器成为科学的“共作者”,让复杂系统的秘密,在数据与公式之间自动显现。

报纸
军旗飞扬 发表于 2025-12-11 09:44:15

地板
cre8 发表于 2025-12-11 09:50:06

7
dyl746800 发表于 2025-12-11 10:11:38

8
zgs3721 发表于 2025-12-11 10:20:23
谢谢分享

9
是没什么 发表于 2025-12-11 11:49:11
感谢分享

10
512661101 发表于 2025-12-11 12:08:05
谢谢分享!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 23:07