文献综述
研究背景与挑战
随着神经影像技术与人工智能的深度融合,脑科学正经历一场方法学上的变革。尤其是在中医药现代化进程中,针刺作为非药物干预的重要形式,其作用机制的研究逐步摆脱传统经验描述,转向依托客观影像数据的功能性验证路径。借助功能性磁共振成像(fMRI)、扩散张量成像(DTI)以及静息态功能网络分析等手段,研究者得以从空间分布和时间动态两个维度捕捉针刺引发的脑活动变化。
尽管观测能力显著提升,如何从高维、复杂的脑影像数据中识别出具有临床价值的生物标志物,并实现个体层面的疗效预测,仍是当前面临的核心难题。尤其在个体响应差异显著的情况下,构建稳定且可解释的预测模型成为推动该领域向精准医学转化的关键环节。
[此处为图片1]机器学习在脑影像分析中的演进路径
脑功能信号本质上是高维、时空耦合且信噪比较低的数据集合,传统基于先验假设的单变量分析方法难以全面揭示跨脑区协同活动模式。多元模式分析(MVPA)的兴起标志着研究视角由“激活位置”向“信息编码模式”的转变,也为监督式机器学习的应用奠定了基础。
支持向量机(SVM)因在小样本条件下具备良好的分类性能,曾广泛应用于脑状态解码任务。例如,在脑肿瘤分类研究中,结合纹理与形态特征的SVM模型表现出较高的准确率与敏感度,验证了其在医学图像识别中的实用性 [2]。然而,该模型对核函数选择敏感,且无法直接输出特征重要性排序,限制了其在临床决策支持中的推广。
相较之下,神经网络凭借强大的非线性拟合能力,在复杂模式识别任务中展现出优势。一项针对脑肿瘤亚型识别的比较研究表明,神经网络不仅整体分类精度更高,且在不同数据集间保持更强的鲁棒性 [2]。但其依赖大量标注样本训练,且内部结构缺乏透明性,常被视为“黑箱”,影响临床接受度。
集成学习:迈向稳健与可解释性的桥梁
为克服单一模型局限,集成学习逐渐成为主流策略。随机森林通过构建多个决策树并聚合结果,有效缓解过拟合问题,同时天然支持特征重要性评估。在卒中风险预测研究中,随机森林在六种分类器中表现最优,体现出优异的泛化能力 [3]。
梯度提升类模型如XGBoost、CatBoost则通过迭代优化残差误差进一步提升精度。例如,在肝细胞癌术后复发建模中,CatBoost的AUC达到0.7957,显著优于其他算法 [4]。这类方法在处理异构临床数据方面显示出较强适应性,为多源信息融合提供了技术支撑。
[此处为图片2]特征工程:保障模型稳定性与可解释性的核心步骤
在脑影像预测任务中,原始数据往往包含数千个潜在特征,其中多数为冗余或噪声成分。若不加筛选直接输入模型,不仅增加计算负担,更可能导致过拟合与泛化失败。因此,特征选择不仅是提升效率的技术手段,更是确保模型外部有效性的关键环节。
不当保留的特征可能使模型过度依赖偶然相关性,从而在新样本上表现急剧下降。为此,多种降维与特征筛选技术被引入,包括基于统计检验的方法、LASSO回归、主成分分析(PCA)以及递归特征消除(RFE),旨在提取最具判别力的信息子集,增强模型的稳定性与解释力。
针刺响应个体化预测的研究现状与展望
目前,已有大量研究聚焦于脑疾病(如脑肿瘤、卒中、心力衰竭)的机器学习预测模型,并初步探索了放射组学特征、基因表达谱与临床变量的融合建模策略 [1]。然而,针对针刺响应个体差异的建模工作仍处于起步阶段,尤其是整合多模态脑影像与中医证候要素的个性化预测体系尚不完善。
现有研究多集中于组水平的激活模式比较,缺乏对个体疗效的前瞻性预测能力;即便部分研究尝试引入机器学习方法,也普遍忽视模型稳定性评估与决策依据的可视化呈现。这种“重预测、轻解释”的倾向制约了成果的临床转化。
本综述系统梳理了近年来脑部疾病预测中应用的机器学习范式,重点关注其在特征选择、模型构建与可解释性增强方面的技术进展,并探讨这些方法如何迁移至针刺脑影像的个体化预测场景。通过剖析当前神经影像预测模型的技术架构与解释机制,本文旨在提出一个面向针刺响应异质性的稳健机器学习分析框架,同时讨论其在未来转化研究中的可行性与潜在局限。
放射组学(Radiomics)是一种从医学影像中高通量提取定量特征并将其转化为可分析数据空间的技术。该技术能够捕捉图像中的细微异质性,涵盖诸如强度直方图、纹理参数(如灰度共生矩阵GLCM、灰度游程矩阵GLRLM)、形态学指标以及经小波变换后的频域特征等信息。因其具备非侵入性和成本低的优势,放射组学被广泛视为连接影像表型与分子病理状态的重要桥梁。
在实际应用中,常用的过滤式特征选择方法包括互信息(Mutual Information)、皮尔逊相关系数(Pearson Correlation Coefficient)以及Kruskal-Wallis检验等。这些方法依赖于统计独立性或分布差异来筛选具有区分能力的变量,计算效率较高,适用于大规模特征的初步筛选。例如,在一项针对脑转移瘤原发灶预测的研究中,研究者首先采用Kruskal-Wallis检验剔除无显著区分力的放射组学特征,随后结合相关性分析去除高度共线性的冗余变量,最终将初始提取的1688个特征压缩至34个核心变量,显著提升了模型的可解释性与泛化性能 [5]。
[此处为图片1]相较之下,包装式(Wrapper)与嵌入式(Embedded)方法则将特征选择过程与模型训练过程深度融合。其中,递归特征消除(Recursive Feature Elimination, RFE)是典型的包装式策略,其通过反复训练模型并逐步移除贡献最小的特征,实现输入特征集的优化。在MVI阴性肝癌复发风险预测任务中,CatBoost结合RFE成功识别出肿瘤包膜完整性、HBV-DNA水平及CA125浓度等关键临床指标,揭示了一组在生物学上合理且具临床意义的风险因素组合 [4]。
主成分分析(PCA)作为经典的降维手段,常用于脑影像数据的预处理环节。尽管PCA能有效缓解多重共线性问题并保留主要方差结构,但其所生成的新特征通常缺乏明确的生理或临床含义,限制了其在医学解释中的应用价值。相比之下,弹性网络回归(ElasticNet)等正则化方法在保持稀疏性的同时还能兼顾群组效应,在某些场景下表现出更强的适用性。例如,一项关于低级别胶质瘤的研究利用ElasticNet进行特征筛选,成功识别出一组与1p/19q共缺失状态显著相关的放射组学参数,为实现非侵入性分子分型提供了可行的技术路径 [6]。
[此处为图片2]上述研究共同表明,科学合理的特征选择不仅有助于提升模型的预测精度,更有助于挖掘潜藏于高维数据背后的生物学机制。对于针刺响应预测这一特定任务而言,这意味着可以从全脑功能连接矩阵中提炼出真正反映针刺调控效应的核心网络节点和神经通路,避免因无关变量干扰而导致虚假关联的产生。
然而,尽管现代机器学习模型在预测准确性方面持续取得突破,其“黑箱”特性仍严重制约了在临床实践中的推广。医生难以信任一个无法阐明决策依据的风险评估工具,尤其是在涉及重大诊疗决策时。因此,构建透明、可追溯的人工智能系统已成为医疗AI发展的核心方向之一。
可解释人工智能(Explainable Artificial Intelligence, XAI)正是为应对这一挑战而发展起来的技术范式,旨在揭示模型内部的运作逻辑,使预测结果具备可理解性与可问责性。当前,SHAP(SHapley Additive exPlanations)与LIME(Local Interpretable Model-agnostic Explanations)是两种主流的XAI技术,并已在多种医学预测任务中得到验证与应用。
SHAP基于博弈论中的Shapley值理论,量化每个特征对某一具体预测结果所做出的边际贡献。它不仅能提供全局特征重要性排序,还可生成局部解释图谱,清晰展示某一位患者预测值偏离基线的具体原因。例如,在肝癌复发风险建模中,SHAP分析直观揭示了肿瘤直径增大、体重减轻等因素如何协同推高个体的复发概率,帮助临床医生理解模型输出背后的逻辑链条 [4]。
LIME则通过在目标样本邻域内构建局部线性代理模型,近似复杂模型的行为表现。这种方法特别适用于解析异常个案或边界情况下的预测机制。在卒中风险预测研究中,LIME被用于识别高风险个体的关键驱动因素,例如高血压史与糖尿病共病之间的交互作用,从而支持个性化预防策略的制定 [3]。需要注意的是,LIME的解释结果受邻域采样策略影响较大,扰动范围的设定需谨慎以确保解释的可靠性。
此外,一些前沿研究尝试将XAI技术整合进端到端的透明化框架设计中。例如,有研究团队提出一种融合多种特征选择方法与投票分类器的可解释AI系统,用于胶质瘤分级预测。该系统不仅实现了100%的分类准确率,还通过可视化各阶段特征权重的变化过程,完整呈现了从原始数据输入到最终诊断输出的推理路径 [7]。这种全流程透明的设计理念,为未来开发可信的针刺疗效预测平台提供了重要的参考范式。
在脑肿瘤的研究领域,放射组学已在原发灶定位、分子亚型识别及生存预后分析等多个方面展现出显著应用价值。例如,在一项涵盖六种原发性癌症引发的脑转移研究中,研究人员利用MRI影像提取放射组学特征,通过交叉验证实现了高达0.98的AUC值,成功区分乳腺癌、肺癌与肾癌等不同来源的脑转移病灶 [8]。此外,另有研究显示,该技术可有效预测低级别胶质瘤中的1p/19q共缺失状态(AUC达82.74%),为术前制定个体化放化疗策略提供了重要参考依据 [6]。
进一步地,将放射组学特征与临床变量融合建模,能够产生协同增益效果。一项关于心力衰竭风险预测的研究表明,结合视网膜OCT测量数据与机器学习算法,发现ISOS-RPE层厚度和黄斑区体积在CHF与UHF患者中均显著降低,提示眼部微循环变化可能反映全身心血管系统的状态改变 [9]。该研究采用XGBoost与CatBoost等先进模型,并结合特征重要性排序方法,凸显了关键解剖参数在预测中的核心作用,充分体现了多源信息整合的优势。
[此处为图片1]
这一多模态建模思路对针刺效应研究具有重要启示意义。针刺并非仅作用于局部穴位,而是通过中枢神经系统引发广泛的功能网络响应。若能从fMRI时间序列中提取稳定的类放射组学特征——如默认模式网络的拓扑熵、杏仁核与前扣带回之间功能连接强度的变异度——并将其与中医体质分类、经络敏感性等个体化参数相结合,则有望构建真正意义上的个性化疗效预测体系。
已有初步证据表明,相同针刺干预在不同个体中诱发的脑功能活动模式存在明显差异。部分受试者表现为边缘系统活动被显著抑制,而另一些则显示出额顶控制网络的激活增强。借助机器学习技术捕捉这些响应模式的结构化特征,并运用可解释人工智能(XAI)反向解析其影响因素(如年龄、焦虑水平或既往疼痛经历),未来或可实现“因人施治”的精准调控路径。
[此处为图片2]
当前挑战与未来发展方向:建立针刺预测专用建模框架
尽管已有丰富的技术积累可供借鉴,但将现有机器学习范式迁移至针刺相关的脑影像预测任务时,仍面临若干独特难题。
首要问题是数据质量与采集标准不统一。相较于肿瘤或卒中有明确的影像标志物,针刺引起的脑功能变化通常较为微弱且持续时间短,易受到头动、呼吸节律及注意力波动等因素干扰。同时,各研究中心在扫描协议、刺激参数(如捻转频率、留针时长)以及对照设计(假针 vs. 安静态)等方面缺乏一致性,导致数据异质性强,难以支持多中心联合建模。
其次,标签定义尚不清晰。在肿瘤诊断中,病理结果是公认的金标准;而在针刺研究中,“治疗有效”的判定尚无共识。是依据症状评分的变化?还是功能连接重塑的程度?亦或是自主神经反应的幅度?不同的终点指标会引导模型学习到截然不同的映射关系。因此,必须明确定义预测目标,并优先采用复合指标以提升模型的生态效度。
再者,模型的外部验证能力普遍不足。多数现有研究局限于内部交叉验证,缺乏独立测试集或前瞻性队列的支持。即使报告了较高的预测准确率,也可能存在严重的过拟合现象。理想的验证流程应包含跨设备、跨人群、跨时间的多轮测试,才能全面评估模型的泛化性能与稳定性。
最后,伦理与隐私问题亟需重视。脑影像数据属于高度敏感的个人健康信息,一旦泄露可能暴露个体的心理状态甚至潜在意图。在构建预测系统过程中,必须遵循最小必要原则,合理设计数据脱敏机制与访问权限控制,确保技术发展不会损害患者的隐私权益。
未来展望:构建面向针刺个体化预测的智能分析框架
面向未来的针刺脑影像个体化预测系统,应包含以下六大核心模块:
- 标准化的数据采集与预处理流程:确保不同来源的信号具备一致的质量与可比性;
- 多层次特征提取引擎:覆盖时域动态、频谱特性、空间拓扑结构及动态功能网络演化等维度;
- 基于集成学习的主预测模型:融合Bagging与Boosting策略,提升模型鲁棒性与预测稳定性;
- 嵌入式特征选择机制:实现输入特征维度的动态优化,避免冗余干扰;
- 双通道解释系统:一方面提供全局特征重要性概览,另一方面支持个体层面的决策路径回溯;
- 持续学习接口:允许模型在新增病例基础上进行在线更新,适应临床实践的动态演进。
尤为关键的是,该框架不应局限于预测功能本身,还应延伸至干预优化环节。例如,可通过反向强化学习探索最优刺激参数组合,或利用生成对抗网络模拟不同治疗方案下的脑状态演变轨迹,从而实现闭环式的智能调控体系。
总结
当前,机器学习正深刻变革脑科学研究的方法论体系。从脑肿瘤分类、心力衰竭预警到创伤性脑损伤预后评估,一系列研究表明,融合放射组学特征与先进算法的预测模型可在多种神经系统疾病中实现高精度识别 [1]。这些成果为拓展至更复杂的干预场景——如针刺效应预测——奠定了坚实的技术基础。
虽然支持向量机与神经网络在特定任务中表现优异,但其“黑箱”特性限制了临床接受度 [2]。相比之下,随机森林与梯度提升机等集成学习模型在保持高性能的同时,支持有效的特征重要性分析,更适合用于探索性研究 [3]。更重要的是,SHAP与LIME等可解释性工具的应用,使模型不再仅仅是预测工具,更成为揭示潜在神经机制的新颖探针 [4]。
当前的研究多集中于疾病的诊断或预后评估,较少涉及对主动干预措施后个体反应差异的深入探讨。针刺作为一种高度个性化的治疗手段,其效果受到遗传背景、心理状态以及生活方式等多种因素的共同影响,因此迫切需要一种能够整合多维度信息并动态调整预测策略的智能化分析系统。尽管放射组学与可解释人工智能(XAI)的融合已在肿瘤研究中取得显著进展 [8],但在针刺效应研究中的应用尚属空白。
[此处为图片1]
未来的发展方向应聚焦于构建一个集数据标准化、特征自动提取、模型可解释性及实时反馈机制于一体的综合性分析平台。该平台不仅需具备预测个体患者对足三里穴位针刺是否产生明显镇痛效果的能力,更应清晰阐明这一预测结果所依据的关键脑区活动模式变化,以及起主导作用的临床特征。唯有实现这种从“群体层面有效”向“个体层面适配”的转变,才能真正推动针灸疗法迈向精准化发展。
值得注意的是,技术乐观主义不应掩盖方法论上的严谨要求。在高维数据建模过程中,极易陷入“数据窥视”陷阱——即通过大量尝试偶然发现看似显著的关联模式。因此,任何预测模型的构建都必须遵循严格的验证流程,包括研究设计的预注册、独立测试集的验证以及多中心外部复制,以确保结果的稳健性和可重复性。
作者指出,脑影像结合机器学习对针刺响应进行预测的最终目标并非替代医生,而是增强临床决策能力。一个透明、可靠且面向个体的机器学习框架,有望成为连接传统医学智慧与现代科学技术的重要桥梁,助力针灸从经验驱动的传统模式逐步转向循证医学的新阶段。
参考文献
[1] Saravanan, P., Dr. S. Saravanakumar, and Dr. G. Shanmugarathinam. “A Survey on Brain Tumor Prediction with Various Machine Learning Approaches.” 2023 International Conference on Computer Science and Emerging Technologies (CSET), 2023, pp. 1–4. doi:10.1109/CSET58993.2023.10346944.
[2] Raja, MD Ashif, et al. “Exploring Machine Learning Approaches for Predicting Brain Tumors: A Comparative Study.” International Journal of Membrane Science and Technology, 2023. doi:10.15379/ijmst.v10i5.2505.
[3] Molawade, Krishnat N., and Reena Gunjan. “Decoding Stroke Risk: a Transparent Machine Learning with Personalized Recommendations.” 2025 International Conference on Information, Implementation, and Innovation in Technology (I2ITCON), 2025, pp. 1–5. doi:10.1109/I2ITCON65200.2025.11210549.
[4] Wang, Chendong, et al. “Machine Learning-Based Models for the Prediction of Postoperative Recurrence Risk in MVI-Negative HCC.” Biomedicines, vol. 13, 2025. doi:10.3390/biomedicines13102507.
[5] Panchawagh, S., et al. “P10.01.B A GRADIENT-BOOSTING MACHINE LEARNING MODEL PREDICTS PRIMARY TUMOR ORIGIN IN PATIENTS TREATED WITH GAMMA-KNIFE FOR BRAIN METASTASES.” Neuro-Oncology, 2024. doi:10.1093/neuonc/noae144.177.
[6] Panchawagh, S. “NIMG-01. RADIOMIC DATA ANALYSIS WITH ENSEMBLE MACHINE LEARNING TECHNIQUES PREDICT GRADE, HISTOPATHOLOGIC SUBTYPE, AND 1P/19Q CO-DELETION STATUS IN PATIENTS WITH LOW-GRADE GLIOMAS.” Neuro-Oncology, 2024. doi:10.1093/neuonc/noae165.0768.
[7] Loge, G. 等人提出了一种可解释的人工智能方法,用于实现精准的脑肿瘤预后分析。该研究通过透明化的机器学习模型,增强了临床决策的支持能力,使预测过程更具可信度与医学实用性。相关成果发表于《国际健康科学与药学杂志》,2025年。doi:10.47992/ijhsp.2581.6411.0141。
[8] Sardede, Dilek Betül 与 Sevim Cengiz 合作开展了一项基于放射组学特征的研究,利用机器学习技术对脑转移瘤中原发癌来源进行预测。该方法通过提取影像中的高维特征,提升了原发灶识别的准确性,为个性化治疗提供了技术支持。论文刊登在《国际成像系统与技术杂志》,2025年。doi:10.1002/ima.70234。[此处为图片1]
[9] Younis, Sona M. Al 及其团队探索了从视网膜光学成像数据中识别心力衰竭风险因素的可能性,采用可解释的机器学习模型进行分析。研究表明,眼部影像可能隐含心血管健康信息,具备非侵入性筛查潜力。该工作发表于《前沿医学》,第12卷,2025年。doi:10.3389/fmed.2025.1551557。[此处为图片2]


雷达卡


京公网安备 11010802022788号







