楼主: 大多数88
1848 77

[量化金融] 结合基于结果和基于偏好的匹配:一种受限的 [推广有奖]

31
kedemingshi 在职认证  发表于 2022-6-14 04:37:53
顶部面板涉及学生结果和偏好向量之间的相关性。我们发现,对于大多数学生来说,相关系数适中,但正相关,平均值为0.11,这表明学生稍微倾向于他们预计考试成绩较高的学校。如前所述,偏好和结果向量之间的正相关在一定程度上缓解了基于结果和偏好的匹配之间的等级效应。这就是说,如图所示,不可能进一步提高“g”的事实当然是难民家庭结果向量充分分布的结果,即他们彼此之间具有很大的正相关性。跨越结果在偏好和结果之间跨越偏好-1-0.5 0.0 0.5 1.00123051015202501234相关性密度图4:显示了学生对小学的偏好、考试成绩结果以及偏好和结果之间的成对相关性分布。N=1000名来自田纳西项目恒星数据的随机抽样学生。在图4的中间面板中,学生偏好向量之间的成对相关性分布紧密聚集在0.93的高正平均相关附近。这表明,学生大多更喜欢被安排在类似的学校,这使得基于参考的匹配作业在首选学校有固定数量的座位时更具竞争性。

32
mingdashike22 在职认证  发表于 2022-6-14 04:37:56
如图4底部的面板所示,我们还发现,学生的结果向量之间的部分相关性几乎都是正的(相关系数为0.79),这表明某些学校通常比其他学校更适合学生获得更高的考试分数。在将我们的机制应用于这些教育数据时,我们施加了与之前相同的真实世界分配约束,使每个学校的入学人数与实际入学人数相同。我们还截断了每个学生的参考向量,以便只保留前10个排名,并在其余学校之间建立差异,以模拟申请表上的情况,即学生只能排名前十名的首选学校。图5显示了应用我们的机制的结果。与之前一样,该机制适用于不同级别的“g”,由x轴表示。顶部面板的y轴表示分配到前三名学校之一的学生比例,● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●●●●●●●●●●●●●●●●0.00.10.20.30.40.51490 1500 1510 1520最低要求平均结果(g)Top-3比例● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●●●●●●●●●●●●●●●●14901500151015201490 1500 1510 1520最低要求平均成绩(g)平均结果图5:将“g-约束优先机制”应用于学生分配到小学的结果,以达到平均成绩预期最低水平(“g”)的各种特定阈值。上面板显示了学生被分配到前三名学校之一的平均概率。下面板显示实现的平均考试分数结果,即平均预计SAT分数。N=从田纳西项目恒星数据中随机抽取1000名学生。而底部面板中的y轴表示平均实现结果得分,即。

33
可人4 在职认证  发表于 2022-6-14 04:37:59
基于作业的平均预测考试分数。两条垂直虚线亮起了权衡区间,其中改变“g”的值会影响偏好和结果,当“g”高于“gmax”时,区间结束。考虑到主要基于偏好的分配(即将“g”设置为低于交易间隔开始值的任何值),平均预测测试分数结果为1502。根据这项任务,大约42%的学生被分配到他们最喜欢的三所学校。为了进行比较,未应用该机制的学生在其实际位置的平均观察测试分数约为1490分,标准差为86分。这表明,与上面的难民数据一样,需要注意的是,这一比例与上面的难民示例没有直接的可比性,因为每个位置有不同的人数、地点和座位。学生和学校之间有着显著的协同效应,即某些学校更适合不同的学生,这取决于他们的个人特征。即使在主要基于偏好的分配下,该机制也可以因此将预测的平均测试分数增加到1502,与实际分配下观察到的平均值相比,测试分数的标准偏差有意义地提高了约七分之一。另一方面,纯结果驱动的优化将产生最高的可行“g”(“gmax”),这是平均预测测试分数结果1519。因此,与实际作业中观察到的平均值相比,学生与学校之间完全基于结果的匹配可以导致预测的平均测试分数大幅增加,约为标准偏差intest分数的三分之一。

34
何人来此 在职认证  发表于 2022-6-14 04:38:02
考虑到基于偏好的匹配和基于结果的匹配之间的差异,这意味着在纯结果驱动的优化下,只有大约10%的学生会被分配到他们最喜欢的三所学校。这突出表明,与上述申请相比,本教育示例中的权衡效应更为严重,这是因为偏好更多地集中在类似的七所学校,尽管偏好与结果之间存在更为积极的相关性。5其他福利问题与我们的机制有关的一个可能的问题是,如果偏好与其结果分数没有太大相关性的代理被给予比其他代理更高的优先级,那么他们的分配可能会降低分配给优先级较低代理的位置的总体偏好等级。例如,除了担心实现受限的帕累托效率分配外,假设规划师还关心获得排名前三的位置之一的代理的百分比。让我们把这个福利指标称为“前三个指标”通过更改族的指定顺序,可以在多大程度上改进此指标?为了了解这一点,我们对不同可能的药物顺序进行了随机抽样,并研究了前3个指标中产生的变化。我们重新运行了第4.1节中考虑的九个模拟场景的子集,使用身份程序生成数据,并使用相同的参数(代理数量、位置数量、差异集大小、g水平)。然而,在每个场景中考虑的每个级别的g中,我们将该机制应用于100次单独的模拟数据,其中每次重新随机化代理的顺序。

35
大多数88 在职认证  发表于 2022-6-14 04:38:05
结果显示在SI中。就分配给前三名位置的比例而言,最大值和最小值之间的差值在0.05到0.18之间,中值差值为0.13。因此,在这些数据中,重新排序可能会使前三名指标比典型抽签指标提高几个百分点。关于平均结果得分,最大值和最小值之间的差异范围为0.00至0.06,中位数差异为0.04。然而,这项工作的一个限制是,因为“g-约束优先权机制”没有描述约束帕累托效率分配集的特征(如第2.3节中的示例所示),我们不知道是否有约束效率分配产生的改进甚至超过了我们通过重新排序族和应用我们的机制所能产生的改进。我们还不知道是否有一种防战略约束的高效机制,可以在那些可以通过在我们的约束优先级机制下对代理重新排序而生成的任务中,挑选出使TOP-3指标最大化的任务,更不用说不能通过排序生成的任务了。很明显,通过依次重新排序并选择最大化前3个指标的机制,并不能确定一个战略证明机制。如果规划师愿意牺牲策略证明性,她可以尝试通过连续重新排序代理,以使用我们的受限优先级机制生成的最佳分配为目标。但通过实施这种方法,代理可能有动机篡改其偏好,因此,甚至可能不再生成计划者试图针对的最佳任务。使用预测的首选项。

36
mingdashike22 在职认证  发表于 2022-6-14 04:38:08
获取部分收益的另一种方法是使用历史(或其他)数据预测代理的参考值,这部分收益来自于对代理进行重新排序,而这些代理既不牺牲战略可靠性,也不牺牲效率约束。例如,规划师可以使用历史数据,根据过去代理人与当前代理人的人口统计学相似性来预测偏好,并根据预测的偏好,将代理人的排序确定为最大化前三名指标的排序。特别要注意的是,如果规划师能够完美地预测代理的偏好,那么策略证明性就不是一个问题,因为规划师已经有了代理的偏好。在这种情况下,规划者可以从重新随机化代理顺序中获得全部收益。如果规划师不能完美地预测代理的引用,但可以接近,那么规划师应该能够恢复一些收益。请注意,因为我们使用过去代理的历史数据来设置当前代理的顺序,所以代理无法使用其reportedpreferences来操纵该机制。为了评估这种方法,我们使用了前面描述的难民申请中的数据。具体而言,我们首先从应用程序中使用的全套数据中随机抽取100个家庭。然后,我们随机生成这些家族的100个不同的排序,对于每个排序,我们按照一系列值实施约束优先机制,例如。我们使用家族的结果得分向量和“实际”偏好向量(即前面介绍的应用程序中使用的偏好向量)。这使我们能够评估不同的订单会在多大程度上导致前三名指标的不同水平。

37
mingdashike22 在职认证  发表于 2022-6-14 04:38:11
图6中标记的组件“例如,假设在难民匹配应用程序中,基于历史数据,我们知道30多岁的男性特工来自特定国家,在特定行业工作,他们比其他人更有可能报告某些地点是他们的首选。然后,我们对他们的偏好进行了一些嘈杂的预测,这些预测预计将与那个特工的真实偏好。订单”显示这些结果,黑点对应100个订单的平均值,间隔表示100个订单获得的最大和最小结果。此外,对于100个排序中的每一个,我们还使用伪偏好向量代替实际偏好向量来评估应用约束优先级机制的结果。这些伪偏好向量旨在表示代理正确预测的偏好。在g的每一个层次,我们确定了随机排序,通过根据这些伪偏好获得前三名位置之一的家庭的比例来衡量,随机排序产生了最佳的伪总体福利。然后,我们能够评估应用这些“最佳猜测”排序的实际福利结果(基于家庭的实际偏好)。

38
可人4 在职认证  发表于 2022-6-14 04:38:14
换句话说,研究人员可以(i)提前/独立于实际参考报告,通过模拟确定可能导致基于预测偏好的更高水平总体福利的顺序,然后(ii)使用这些顺序作为最终顺序,从而实际应用“g-约束优先机制”分配家庭。为了模拟不完全预测家庭伪偏好的过程,我们通过随机扰动他们的实际偏好向量来构建他们的伪偏好向量。为了研究这种方法在预测偏好的不同有效性水平上的性能(即,可以构建与实际偏好向量相似的伪偏好向量的程度),我们引入了不同程度的扰动,并评估了这些不同规范的结果。结果可以在图6中标记为“伪推断序”的组件中看到,其中单独的面板对应于扰动量增加的场景。对于每个场景,标记为“伪推断顺序”的三角形表示根据伪偏好结果应用被认为最佳的顺序时的实际结果,如上所述。该图表明,如果规划师能够非常准确地预测偏好,那么仔细筛选代理订单可以获得很大一部分收益,但能获得多少收益可能取决于规划师的预测有多好。按结果得分方差排序代理。我们还探索了一种替代策略,用于确定可能导致前三名指标达到良好水平的先验(因此不需要牺牲策略证明)管理排序。

39
何人来此 在职认证  发表于 2022-6-14 04:38:17
与试图预测伪偏好不同,该策略相反利用了家族。可以通过各种方式测量扰动程度,但与我们的前3个指标相对应的一组直观测量值是,在伪前3个位置中包含3个、2个、1个或0个真正的前3个位置的家族的比例。对于我们的每个场景,以下报告了计算出的家庭比例,其中3、2、1或0个家庭的真实前3位置包含在其伪前3位置中。场景1:0.77(3)、0.23(2)、0.00(1)、0.00(0)。场景2:0.37(3)、0.59(2)、0.04(1)、0.00(0)。情景3:0.03(3)、0.33(2)、0.51(1)、0.13(0)。在最右侧的图表中,规划师能够为超过一半的代理预测前三名位置中的至少一个,并为其中三分之一的代理预测至少两个。● ● ● ●●●●●●●●●●● ● ● ●●●●●●●●●●● ● ● ●●●●●●●●●●场景1场景2场景30.35 0.40 0.45 0.50 0.35 0.40 0.45 0.50 0.35 0.40 0.45 0.500.150.200.250.300.35最低要求平均结果(g)顶部-3比例●●许多订单为伪订单-推断的顺序● ● ●●●●●●●●●●●● ● ●●●●●●●●●●●● ● ●●●●●●●●●●●情景1情景2情景30.35 0.40 0.45 0.50 0.35 0.40 0.45 0.50 0.35 0.40 0.45 0.500.350.400.450.500.55最低要求平均结果(g)平均结果●●许多订单为伪订单-推断顺序图6:对2016年第三季度难民数据中100个家庭随机样本的100个随机顺序应用我们的“g-约束优先级机制”的结果,以及基于伪偏好的“bestguess”排序。黑点对应100个订单的平均结果,区间表示100个订单的最大和最小结果。

40
kedemingshi 在职认证  发表于 2022-6-14 04:38:20
三角形(标记为“伪推断顺序”)表示根据伪首选项采用产生最佳伪top-3度量的顺序时的实际结果。这三种场景依次增加应用于实际偏好向量的扰动量,以生成伪偏好。上面板显示代理被分配到其前三个位置之一的平均概率。下面板显示实现的平均结果分数。N=100。谎言的结果得分。具体而言,对于每个家庭,可以计算结果分数在各个位置的方差,然后可以根据其方差排序代理。我们建议按递增方差(从最小方差到最大方差)排序代理。这个建议的直觉如下。在进行分配时,“g-约束优先级机制”面临着将代理发送到其首选位置和将其发送到能够满足“g-约束”的位置之间的权衡。对于每个代理人来说,这种特殊交易的影响程度在某种程度上取决于他们在不同地点的结果得分差异。在极端情况下,对于结果分数在不同地点相同的代理人来说,没有交易:无论他们被派往何处,他们的分配都会对“g”约束产生同等的影响。然而,对于结果分数差异非常大的代理人,他们的任务在多大程度上有利于或反对“g”约束,这在很大程度上是跨地区的。换句话说,高方差代理的分配提供了为“g”约束创建缓冲的机会,而低方差代理的分配则没有。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 12:28