|
q表示将数据集示例映射到相应叶指数的每棵树的结构,T是树中的叶数,每个Fk对应一个独立的树结构q和叶重w。要学习模型中的函数集,正则化目标定义为:L(f)=XtXil(^yi,T+1,yi,T+1)+XkOhm(fk)其中Ohm(f)=γT+λkwk。然后以相加的方式对模型进行优化。如果^y(t)是在boosting迭代的第t阶段对第i个训练示例的预测,那么我们寻求通过函数ft1来增加我们的树集合集合,该函数使以下目标最小化:L(t)=nXi=1lyi,^y(t-1) i+ft(xi)+ Ohm(英尺)。目标函数通过二阶泰勒展开近似,然后进行优化(详情和计算步骤见【Chen和Guestrin,2016年】)。为了防止过度拟合,XGBoost使用收缩和特征子采样。人工神经网络:多层感知器人工神经网络(ANN)是受人脑启发设计的一组算法,用于识别模式。这种框架背后的思想是通过将简单的处理单元连接到一个神经网络来表示复杂的非线性函数,每个神经网络计算一个线性函数,然后可能是非线性函数。类神经元处理单元如下所示:A=φXjwjxj+b,其中,xj是单元的输入,wj是权重,b是偏差,φ是非线性激活函数,a是单元的激活。激活函数是用于将单元(神经元)的触发电平转换为输出信号的函数。
|