楼主: 大多数88
1855 77

[量化金融] 结合基于结果和基于偏好的匹配:一种受限的 [推广有奖]

61
nandehutu2022 在职认证  发表于 2022-6-14 04:39:23
然后,将该模型应用于预测数据(2016年第三季度难民),以预测这些难民抵达的概率,如果他们被虚假地发送到相关地点。该过程对每个单独的位置分别执行,从而为预测数据中的每个难民生成一个预测概率向量,每个位置一个。对于预测数据中的所有难民,最终结果是一个预测概率矩阵(M矩阵),其中行代表单个难民,列代表安置地点。请注意,有两个M矩阵:一个用于就业概率,另一个用于外迁概率。更正式地说,对于每个难民r=1。。。,nT,用yr表示兴趣响应(如就业)∈ {0,1}和由wr表示的位置分配∈ {1,…,k},共k个可能的安置地点。让xrdenote一个由难民r的特征组成的p维特征向量,XRM表示第m个特征in xr,其中m=1。。。,p、 建模过程的目标是学习函数θl(~xr)=p(yr=1 | ~xr,wr=l)。下面介绍建模阶段的步骤。1、指定历史模型训练数据,并用矩阵T:T表示=ywx··x1m··x1p。。。。。。。。。。。。。。。yrwrxr1··xrm··xrp。。。。。。。。。。。。。。。ynTwnTxnT··xnTm··xnTp2、训练一组k模型,如下所示:。对于l=1。。。,k: (a)将T子集分配给wr=l的难民(即。

62
何人来此 在职认证  发表于 2022-6-14 04:39:25
分配到第l个位置的难民),并将其称为Tl:Tl=yx··x1m··x1p。。。。。。。。。。。。yrxr1··xrm··xrp。。。。。。。。。。。。ynlxnl···xnlm···xnlpw=l=y~x。。。。。。yr ~ xr。。。。。。ynl ~ xnlw=lwhere NL表示wr=l的难民人数。(b)使用Tl中的数据(Tl中所有NLRefugees的结果yrand特征向量XRF),建模并估计函数^θl(~ xr)。指定新抵达难民的数据,并用矩阵R表示:R=˙x·······································。。。。。。。。。xr1、xrm、xrp。。。。。。。。。xnR·····················xnRp=~˙x~˙xr~˙xnR其中NR表示新抵达的难民人数。矩阵R对应于本申请中的2016年第三季度难民。4、对于R和所有安置地点的所有难民,估算P(˙yr=1 | ~˙xr,˙wr=l),如下所示。对于r=1。。。,编号:若l=1。。。,k: 通过将lth模型应用于ΘΘ至˙xr:bP(˙yr=1 | ~˙xr,˙wr=l)=θl(˙xr),估算P(˙yr=1 | ~˙xr,˙wr=l)≡ πrl将πrli排列成向量,~πr=[πr1,…,πrk]。5、生成预测概率矩阵,行对应新难民,列对应安置地点,如下所示。将向量~πrinto排列到矩阵M的行:M=~π...~πr~πnR=π···π1l··π1k。。。。。。。。。πr1··πrl··πrk。。。。。。。。。πnR··πnRl··πnRk这是最终建模阶段的输出。我们遵循Bansak et al.(2018)的方法,并使用增强树(Friedman et al.,2009,Friedman,2001)来估计步骤2(b)中的^θl(~ xr)。有关选择boostedtrees的选择标准和模型性能指标的更多详情,请参见Bansak et al.(2018)。具体而言,我们使用随机梯度增强树(袋分数为0.5)和二项式偏差损失函数(Friedman,2002,Friedman et al.,2009),该函数使用gbm软件包(Ridgeway,2017)在R中实现。

63
nandehutu2022 在职认证  发表于 2022-6-14 04:39:28
调整参数值,包括交互深度、学习率和推进迭代次数(早期停止点),通过在每个位置特定模型的训练数据中进行交叉验证来选择。我们使用以下预测因子:免费案例、会说英语、到达时年龄、男性、教育程度(无/未知教育程度、低于中等、中等、技术/专业和大学之间的有序变量差异),原籍国(缅甸、伊拉克、不丹、索马里、阿富汗、刚果民主共和国、伊朗、厄立特里亚、乌克兰、叙利亚、苏丹、埃塞俄比亚和摩尔多瓦等最大原籍国群体各一个二元变量)、抵达年份和抵达月份。D、 7映射到案例级别由于难民分配通常发生在案例级别(典型的家庭),我们需要将建模过程中的难民级别预测概率映射到案例级别度量。对于每个案例位置对,我们将映射函数应用于属于该案例的所有难民的难民位置预测概率,为该案例位置对生成一个值。这将产生一个新的矩阵(M*矩阵),列数(位置)与以前相同,但现在与案例一样多,而不是难民。Viii形式上,设i=1。。。,n表示难民案例,共n个案例,其中≤ 映射过程如下:1。按照如下所示,将单个预测概率映射到案例级度量。对于i=1。。。,n: 对于l=1。。。,k: 设∧πil={πrl r∈ i} 。(也就是说,▄πilis是属于第i个案例的第l个位置和难民的所有πrl的集合。)计算γil=ψ(|πil),其中ψ是预定的映射函数。将γi排列为向量,~γi=[γi1,…,γik]。2.

64
何人来此 在职认证  发表于 2022-6-14 04:39:31
生成一个矩阵,其中包含所有案例位置对的案例级指标,行对应案例,列对应移民安置位置,如下所示。将步骤1中产生的向量~γi排列到矩阵M的行中*:M*=~γ...~γi~γn=γ··γ1l··γ1k。。。。。。。。。γi1··γil··γik。。。。。。。。。γn1··γnl··γnk这是最终映射阶段输出。在步骤1中,必须指定函数ψ。在我们的应用中,我们采用了就业预测概率和外迁预测概率的平均值(参见Bansak et al.(2018)了解备选方案)。D、 8最终构建结果得分和偏好等级M*与预测就业概率相关的矩阵直接提供了结果分数,以便在机制中使用。然而,M*必须进一步转换与预测外迁概率相关的矩阵,以提供(推断的)偏好等级。具体而言,对于每一行(案例),我们对位置进行排序,以便将平均外迁概率最低(最高)的位置排在第一(最后),从而为每个案例生成一个偏好排序向量。D、 9通过结构调整估算偏好的替代方法我们还研究了一种估算位置偏好的替代方法,该方法使用了一个模型,该模型明确修正了由于搬迁成本而产生的潜在偏差。请注意,在我们的数据中,我们只观察难民是否从最初的安置地点向外迁移。这一决定将取决于位置偏好(即在不太理想的位置向外迁移应该更高)和迁移成本(例如。

65
mingdashike22 在职认证  发表于 2022-6-14 04:39:34
不同的地理和经济因素可能会导致从特定地点搬迁的成本更高)。在这里,我们利用外迁的结构模型来隔离外迁的组成部分,这可能归因于位置偏好,而不是位置成本。特别是,我们遵循移民和外迁地点选择文献中的标准模型,并估计出以下外迁结构模型:yijt=α+βXjt+θj+φt+θj×t+ijtwhere yijt是在第t年到达的难民i是否从其初始安置地点j迁移的结果,xjt是一组随时间变化的特定地点特征(如租金价格、失业率、种族网络、福利慷慨等),这些特征会影响搬迁成本和系数β,θjis是一组特定于位置的效应,捕捉到影响搬迁成本的所有时不变因素(如偏远位置),φ是一组捕捉常见冲击(如运输成本变化)的固定年效应,θj×t是一组特定位置的线性时间趋势,捕捉特定位置迁移成本的变化,这些变化对外迁有线性影响(例如当地经济衰退、当地交通基础设施的变化等)。我们在X中包括一组位置特征,这些特征通常包括位置选择的指导模型(Borjas,1999,Zavodny,1999,Damm,2009,Aslundand Rooth,2007,Mossad et al.,2020)。

66
可人4 在职认证  发表于 2022-6-14 04:39:37
特别是,我们将当地失业率和人均收入包括在内,以代表经济机会(Aslund andRooth,2007,Damm,2009,Mossad et al.,2020),租金价格代表生活成本(Damm,2009,Mossad et al.,2020),种族份额代表飞地效应(Beaman,2012,Mossad et al.,2020),人均福利支出代表福利的巨大影响(Damm,2009,Borjas,1999)。定义和来源列表如下所示。为了合并这些信息,我们首先确定了每个安置地点的县,然后合并到难民到达时测量的特定地点特征中。我们根据2016年第三季度之前抵达的难民培训数据,将模型与逻辑链接功能相结合。请注意,为了验证此模型,我们将培训数据仅限于作为免费案例抵达的难民。由于免费案例不选择其初始安置地点,而是由安置机构外生安置,该样本限制限制了由于个人根据未观察到的特征(如位置偏好)分类到初始位置而产生的潜在偏差(参见Aslundandrooth(2007),了解利用Swedento估计位置偏好中的安置政策的类似识别)。然后,在2016年第3季度每个移民安置地点的移民人数测试集中,我们使用拟合模型生成每个家庭的外迁预测概率。这些预测捕捉到了外迁的可能性,这是我们纯粹基于结构模型捕捉到的特定位置的迁移成本,对给定家庭的预期。在下一步中,我们将计算基于个体水平特征的先前模型的预测概率与结构模型的预测概率之间的差异。

67
能者818 在职认证  发表于 2022-6-14 04:39:40
由此产生的差异可以解释为主要由位置偏好驱动的外迁变化,因为它是根据结构迁移成本驱动的外迁变化进行调整的。例如,考虑一个家庭,根据个人模型,其在给定位置的外迁预测概率非常低,但根据结构模型,其在相同位置的外迁预测概率非常高。这表明,该家庭强烈倾向于留在该位置,即使基于结构因素,他们将被迫搬迁。在FLIP方面,如果一个家庭根据个人模型预测的外迁概率非常高,但根据结构模型预测的外迁概率非常低,则表明他们对居住在这个位置有强烈的偏好,因为结构因素会促使他们留下来。因此,作为每个家庭的最后一步,我们根据预测概率的差异对位置进行排序,从而将差异最大(最积极)的位置列为最(最不)首选位置。地理因素和数据来源清单如下:o县的年失业率。从劳动统计局的当地失业统计数据(LAUS)中检索的数据。o县内每月租金价格指数。从Zillow租金指数(ZRI)检索的数据(时间序列多户、SFR和公寓/合作社)。齐洛租金指数是对给定区域和住房类型的典型估计市场租金的平滑度量。我们对缺失值进行线性插值全县人均年收入。从经济分析局获取的数据。o大都市地区的共同国民份额。

68
何人来此 在职认证  发表于 2022-6-14 04:39:43
根据ACS 5年和3年样本(使用BLP和MET2013变量,从IPUMs下载),估计每个县年的共同国民份额。对于一些位于地铁区域之外的安置点,我们根据城市或彪马而不是地铁区域进行合并国家和地方年度人均福利支出总额。数据来自美国州和地方政府财政年度调查人口普查。使用这些新的偏好估计将我们的机制应用于2016年第三季度难民数据的结果如图S3所示。谢教育应用。1应用背景信息在这里,我们通过将其应用于小学选项的假设示例来说明我们的机制。我们考虑这样一种情况,即学区可能有兴趣将即将入学的幼儿园学生分配到该学区的小学,目标是通过幼儿园年级结束时进行的标准化考试的分数来衡量学业成绩的最大化。学生有校外偏好,因此该机制的目标是优化考试成绩和偏好,以达到学区设定的最低预期平均成绩水平。E、 2田纳西州之星数据我们利用田纳西州教育部开展的田纳西州师生成就率(Star)项目的数据。这些数据包括从1985年开始在田纳西州进行的一项纵向实验的学生水平数据,该实验跟踪了一组从幼儿园到三年级的学生(有关数据和样本的详细信息,请参见Achilles et al.(2008))。这些数据包括学生的人口统计信息、他们就读学校的指标,以及每年在每个年级结束时进行的成绩测试信息。

69
何人来此 在职认证  发表于 2022-6-14 04:39:46
我们关注的是来自33所学校的1674名学生的样本,这些学生从幼儿园到三年级的各个年级都被观察到,他们的考试成绩和背景特征没有缺失数据。表S2显示了我们样本的描述性统计数据。以下是变量和使用的度量值列表:o出生月份:该变量用1到12的值进行编码。o出生年份:该变量的编码值包括1978、1979、1980和o种族:学生的种族编码为六个类别,包括白人、黑人、亚洲人、西班牙裔、印第安人和其他种族免费午餐:如果学生有资格在幼儿园免费/减少午餐,则二进制变量编码为1,否则为零特殊教育:如果学生有资格获得幼儿园的特殊教育地位,则二进制变量编码为1,否则为零女性:二进制变量,女性学生编码为1,否则为零oSAT分数阅读:幼儿园结束时斯坦福成就测试的总阅读量表分数。xiioSAT分数数学:幼儿园结束时斯坦福成就测试的数学总评分。oSAT分数听力:幼儿园结束时斯坦福大学成就测试(StanfordAchievementTest)的听力总分SAT分数之和:幼儿园结束时,阅读、数学和Totallistening量表分数的三个SAT分数之和。o左幼儿园:用于衡量从幼儿园向外迁移的变量。较高的值表示学生更快离开幼儿园,这可以解释为对另一所学校的更强烈偏好。

70
大多数88 在职认证  发表于 2022-6-14 04:39:49
编码为0的If学生继续在幼儿园就读一、二、三年级;编码1如果学生在1年级和2年级时留在幼儿园,但在3年级时离开去了另一所学校;如果学生在幼儿园就读一年级,但在另一所学校就读二年级,则代码为2;如果学生去了一年级的另一所学校,代码是3。E、 3应用该机制生成每个学校的每个学生的结果分数向量,我们使用与难民应用程序中相同的随机梯度增强树模型预测任何学校学生的预期考试分数,作为其背景特征的函数。背景特征包括学生的年龄、性别、种族,以及他们是否有资格享受免费学校午餐(社会经济地位的一个代表)或特殊教育的信息。测试分数结果定义为幼儿园水平的阅读、数学和听力量表SAT分数之和。考虑到一些学校的样本量较小,我们在培训和验证集使用了相同的数据,并将袋子分数增加到1。我们使用5倍交叉验证,共有1500棵树,寻找交互深度为3到8的最佳拟合树模型。为了产生学校偏好,我们从观察到的学校转学中推断出学生的学校偏好。具体而言,我们使用了与测试分数相同的随机梯度增强树模型建模过程,但使用了一个反应变量来衡量学生是否在一年级、二年级或三年级转学。基于这些模型,我们可以根据每个学生的背景特征预测他们离开学校的倾向。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 16:59