|
然后,将该模型应用于预测数据(2016年第三季度难民),以预测这些难民抵达的概率,如果他们被虚假地发送到相关地点。该过程对每个单独的位置分别执行,从而为预测数据中的每个难民生成一个预测概率向量,每个位置一个。对于预测数据中的所有难民,最终结果是一个预测概率矩阵(M矩阵),其中行代表单个难民,列代表安置地点。请注意,有两个M矩阵:一个用于就业概率,另一个用于外迁概率。更正式地说,对于每个难民r=1。。。,nT,用yr表示兴趣响应(如就业)∈ {0,1}和由wr表示的位置分配∈ {1,…,k},共k个可能的安置地点。让xrdenote一个由难民r的特征组成的p维特征向量,XRM表示第m个特征in xr,其中m=1。。。,p、 建模过程的目标是学习函数θl(~xr)=p(yr=1 | ~xr,wr=l)。下面介绍建模阶段的步骤。1、指定历史模型训练数据,并用矩阵T:T表示=ywx··x1m··x1p。。。。。。。。。。。。。。。yrwrxr1··xrm··xrp。。。。。。。。。。。。。。。ynTwnTxnT··xnTm··xnTp2、训练一组k模型,如下所示:。对于l=1。。。,k: (a)将T子集分配给wr=l的难民(即。
|