楼主: 大多数88
1855 77

[量化金融] 结合基于结果和基于偏好的匹配:一种受限的 [推广有奖]

21
能者818 在职认证  发表于 2022-6-14 04:37:23
这些数据包含了大量学生选择小学的信息,以及这些学生的考试成绩信息。我们关注幼儿园的年级水平,并运用我们的机制为学生分配新的任务,目的是通过幼儿园结束时进行的标准化考试来提高学生的成绩。你可以想象一个学区设置了一个平均应该达到的最低考试分数。为了在每个学校生成每个学生的结果分数向量,我们采用与之前应用程序中相同的方法,根据学生的背景特征预测任何学校学生的预期考试分数。背景特征包括学生的年龄、性别和种族,以及他们是否有资格获得免费学校午餐(代表社会经济地位)或特殊教育的信息。测试分数结果定义为斯坦福大学幼儿园级成就测试(SAT)的阅读、数学和听力量表分数之和。我们从观察到的转学情况推断出学生的学校偏好。具体而言,我们使用了与测试分数相同的建模过程,但使用了一个反应变量来衡量一个学生是否在一年级、二年级或三年级转学。基于这些模型,我们可以预测每个学生离开学校的倾向,作为他们背景特征的函数。

22
何人来此 在职认证  发表于 2022-6-14 04:37:26
然后,我们对每个学生的学校进行排名,使他们转学倾向最低(最高)的学校排名第一(最后)。我们生成这些结果分数和偏好向量,并将我们的机制应用于来自33所学校的1000名学生的随机样本,这些学生从幼儿园到三年级的所有年级都被观察到,测试分数和背景特征没有缺失数据。SI中提供了有关数据和样本的详细信息。4结果4.1模拟数据图1描述了九种不同模拟场景在“g-约束优先级机制”下的分配结果,这些场景改变了代理内偏好和结果得分之间的相关性以及代理间偏好之间的相关性。此外,为了模拟一个真实场景,在该场景中,代理只能在申请表中指出有限数量的顶级位置,将截断偏好向量,以便只保留前10个排名,并在剩余位置之间建立差异。顶部面板显示了在不同级别的“g”(最低平均结果得分的阈值)下,被分配到前三个位置之一的代理的比例。底部的面板显示了在相同的“g”水平下,在指定位置的代理的平均结果得分。一旦达到“GmaxH”,曲线就会结束,因此不可能进行可行的分配。在所有模拟中,实现的偏好等级和结果得分之间存在明显的权衡。随着“g”的增加,实现的平均结果分数最终会增加。这是增加“g”的机械结果,因此加强了对更高平均结果值的要求。同时,一旦平均结果得分受到影响,分配到其首选位置的代理的比例也会下降。

23
nandehutu2022 在职认证  发表于 2022-6-14 04:37:29
之所以会出现这种情况,是因为强制要求更高的“g”值需要该机制偏离基于偏好的优化。图1还显示了权衡的直接性和严重性如何根据偏好和结果分数的联合分布而发生显著变化。首先,关注顶部面板,我们发现代理人偏好之间的相关性越高,可分配到其最高位置之一的代理人的可实现基线比例就越差,最低值为“g”。这一结果与偏好和结果得分之间的相关性无关,直观:不同代理的偏好越相似,匹配过程就越具有竞争性,因此,在每个位置的容量有限的情况下,将代理匹配到其排名第一的位置就越困难。第二,偏好和结果得分之间的相关性越积极,权衡就越不严重,因为在执行更高级别的“g”之前,权衡不会生效。这一结果的直觉是,如果偏好和结果呈正相关,那么基于偏好的匹配也应间接导致基于结果的匹配,因此,在达到更高水平的“g”之前,不会出现偏离基于偏好的解决方案的情况。从该机制的实际实现的角度来看,这是一个有用的发现。如果在他们提交参考报告之前,向代理人提供关于他们在每个位置的预测结果的信息,他们可以将这些信息纳入他们的偏好决定中。

24
kedemingshi 在职认证  发表于 2022-6-14 04:37:31
如果这能使偏好和结果更加一致,那将有助于缓解机制中的贸易效应。第三,转到图1中的底部面板,我们看到,一旦交易生效,实现的平均结果曲线将沿着身份线紧密跟踪;也就是说,如果强制执行偏离基于偏好的分配的“g”级别,则该机制将找到一个可供选择的分配,该分配可根据偏好进行优化,但仅限于最低限度。它还可以取决于每个位置的可用座位数以及每个位置对相关性的贡献程度。● ● ● ● ● ● ●●●●●●●●●● ● ● ● ● ● ● ● ● ●●●●●●●● ● ● ● ● ● ● ● ● ● ● ● ●●●●偏爱-结果相关性:-0.5参考-结果相关性:0首选项-结果相关性:0.50.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.000.250.500.751.00最低要求平均结果(g)Top-3偏好间的比例相关性:●0 0.5 0.8● ● ● ● ● ● ●●●●●●●●●● ● ● ● ● ● ● ● ● ●●●●●●●● ● ● ● ● ● ● ● ● ● ● ● ●●●●偏爱-结果相关性:-0.5参考-结果相关性:0首选项-结果相关性:0.50.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.000.250.500.751.00最小要求平均结果(g)偏好间的平均结果相关性:●0.0.5 0.8图1:将我们的“g-约束优先级机制”应用于模拟数据的结果,该模拟数据改变了偏好和结果得分向量之间的相关性以及各代理之间偏好向量之间的相关性。上面板显示了代理被分配到其前三个位置之一的平均概率。下面板显示实现的平均结果分数。N=100。满足“g”约束。

25
kedemingshi 在职认证  发表于 2022-6-14 04:37:35
已实现的平均结果结果也反映了已实现偏好等级的趋势:偏好和结果向量之间的相关性越积极,权衡效应的作用就越晚。第四,我们发现,鉴于偏好和结果得分之间存在负相关,偏好向量之间的相关性对权衡效应如何影响已实现的平均结果得分具有显著影响,而偏好向量之间的相关性较低时,权衡效应更为严重。这一结果可以解释如下。偏好和结果向量之间的负相关意味着基于偏好的分配与优化已实现结果分数的目标背道而驰。然而,如果代理偏好之间也存在正相关关系,这意味着不同类型的代理通常偏好相同的位置,因此导致低结果分数的位置在代理之间也是相似的,从而限制了基于偏好的匹配实际上会损害平均已实现结果分数的程度。相反,如果偏好之间没有相关性,那么机制就有更大的自由度将代理分配到其排名较高的位置,而这些位置也可能是其结果得分最差的位置。随着偏好和结果向量之间的相关性变得更加积极,这种动态开始消失。

26
mingdashike22 在职认证  发表于 2022-6-14 04:37:37
然而,在图1右下角的面板中,它没有反转的原因是由于偏好等级向量中存在尾部差异,这意味着无法与其严格等级位置匹配的代理使用基于结果的优化进行分配,从而限制了上述现象的影响。4.2难民数据图2显示了难民家庭结果得分和偏好等级向量的联合分布特征。顶部面板涉及家庭结果和偏好向量之间的相关性。对于每个族,计算其两个向量之间的相关性,面板显示这些相关性的分布。分布大致以零为中心(平均相关系数为0.03)。这表明,难民喜欢的地点与他们实际能够实现更好就业结果的地点之间的关系相对有限。这是一个有趣的发现,也是一个关键的政策含义。向难民提供哪些位置对他们的就业结果有利的信息,将使他们能够制定更加知情的偏好。如果这导致偏好和结果向量之间更紧密的相关性,这将有助于加强我们的机制,因为更积极的相关性可以缓解基于结果和偏好的匹配之间的权衡。图2中的中间面板显示了家庭偏好向量之间成对相关性的分布。相关系数大多为高度正相关,平均相关系数为0.67。这表明偏好向量在家庭中相对相似;许多难民或多或少更愿意被安置在类似的地点。

27
mingdashike22 在职认证  发表于 2022-6-14 04:37:40
考虑到位置容量限制的存在,从基于偏好的分配的角度来看,这是一个不方便的发现。图3中的底部面板显示了家庭结果向量之间所有成对相关性的分布。如图所示,相关性极为正(平均相关性为0.75),这突出了其他地方已经证明的事实(Bansak等人,2018年),即在帮助难民实现积极就业成果方面,某些地点通常优于其他地点。然而,不同家庭的结果得分向量之间仍然存在有意义的差异,这一事实表明,某些地点确实能够更好地匹配不同的难民家庭,这取决于他们的个人特征,这是Bansak等人(2018)引入的结果优化匹配程序的基础。SI包括相同模拟的结果,而不截断偏好秩向量。在这种情况下,我们确实看到了下三个面板的预期反转。跨越结果在偏好和结果之间跨越偏好-1-0.5 0.0 0.5 1.0012301230123相关性密度图2:显示了难民家庭位置偏好、融合结果(即就业)以及偏好和结果之间的成对相关性分布。N=561名2016年第3季度抵达美国的refugee家庭。在将我们的机制应用于2016年第三季度难民数据时,我们施加了现实世界中的分配限制,使每个地点的家庭数量与实际存在的家庭数量相同。我们还截断了每个家庭的偏好向量,即仅保留前10个等级,并在其余位置之间建立差异。图3显示了应用我们的机制的结果。

28
大多数88 在职认证  发表于 2022-6-14 04:37:43
与之前一样,该机制适用于不同级别的“g”,由x轴表示。顶部面板的y轴表示分配到前三个位置之一的病例比例,而底部面板的y轴表示平均实现结果得分,即基于分配的平均预测就业概率。两条虚线垂直线突出显示了权衡区间,其中改变“g”的值会影响参考值和结果,当“g”高于“gmax”时,区间结束。考虑到主要基于偏好的分配(即将“g”设置为低于交易间隔开始值的任何值),平均结果得分为0.41,这意味着预测的平均就业率为41%。在这种分配下,如果将“g”设置为低于权衡区间的值,则鉴于偏好等级向量中的后续差异,不会导致纯粹基于偏好的分配。我们还应用了该机制● ● ● ● ● ● ● ● ● ● ● ●●●●●●●●●●●0.100.150.200.250.300.30 0.35 0.40 0.45 0.50最低要求平均结果(g)Top-3比例● ● ● ● ● ● ● ● ● ● ●●●●●●●●●●●●0.350.400.450.500.550.30 0.35 0.40 0.45 0.50最低要求平均结果(g)平均结果图3:对美国难民家庭应用“g-约束优先机制”的结果,以达到平均融合结果(g)的预期最低水平。上面板显示了难民家庭被分配到其前三个位置之一的平均概率。下面板显示实现的平均整合结果,即平均预计就业概率。

29
能者818 在职认证  发表于 2022-6-14 04:37:46
N=561个在2016年第三季度抵达的家庭。25%的难民家庭被分配到他们的前三个选择之一的地点。相比之下,未采用任何机制的家庭在其实际所在地的平均观察就业率为34%。这表明,难民和地点之间存在着显著的协同效应,即根据不同难民的个人特征,某些地点更适合不同的难民。因此,即使在基于优先权的分配下,该机制也可以将预测的平均就业率提高到41%,比未应用任何机制观察到的平均就业率提高约20%。在谱的另一端,纯结果驱动的优化将产生最高的可行“g”(“gmax”),其略低于0.52,即在不截断偏好向量的情况下预测相同数据的平均值。结果是一个纯粹基于偏好的分配,最低值为'g,平均结果得分为0.36。参见SI。就业率52%。这相当于在未应用任何机制的情况下,观察到的平均就业率增加了约53%。因此,如果ZF关心的全部任务都是最大限度地提高分数,那么通过实施“gmax”,就可以达到相当高的预期就业率。然而,在“gmax”,只有15%的难民家庭会被分配到他们的前三个地点之一。顶部面板中的偏好曲线具有一个逐渐变陡的梯度,随着“g”的增加,梯度效应变得越来越严重。最后,我们还采用了另一种方法来估计位置偏好,试图纠正由于搬迁成本造成的潜在偏差。如上所述,我们正在根据外迁行为推断位置偏好。

30
能者818 在职认证  发表于 2022-6-14 04:37:50
然而,outmigrationdecisions是两个主要组成部分的函数:一个家庭离开的愿望和他们离开的能力。正是前一个组成部分捕获了我们的偏好和主要兴趣所在,但在不同地点进行搬迁和重新安置的不同成本可能会对后一个组成部分的外迁模式产生影响。只有观察行为数据,很难完全分解这两个组成部分。然而,我们试图通过估算外迁的结构模型来实现这一目标,该模型旨在捕捉与搬迁成本相关的地理和经济因素,然后通过使用该结构模型来调整我们的原始偏好估计,以便我们的新偏好估计在理论上更严格地受外迁行为的偏好成分驱动。然后,我们将我们的机制重新应用于2016年第三季度难民数据,并用新的偏好替代。SI中提供的结果显示了一种类似的模式,即当使用原始偏好估计时,有一个主要差异:分配到其估计前三位之一的家庭比例在所有级别的“g”中都系统性地较低,这是根据替代偏好估计,家庭排名靠前的位置更具竞争性(相关性更高)的结果。SI中提供了有关方法和结果的更多详细信息。4.3教育数据我们现在将该机制应用于田纳西州的教育数据,我们将学生分配到小学,以优化考试成绩和学生对学校的偏好。图4显示了学生结果分数和偏好等级向量的联合分布特征。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 16:59