楼主: 何人来此
1916 41

[经济学] 动机推理中的性别差异 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-4-24 19:01:16
也就是说,这组结果可以用男性和女性具有相似的易感性水平,对政治有相似程度的动机信念,但对表现有不同的动机信念来解释。2.2设计概要为了测试该模型,该实验向人们提供了关于新闻来源真实性的信号,告诉他们他们的中值信念高于真相或低于真相(Thaler 2021)。这些信号的构造使得Bayesianto无法推断,但它们唤起了有动机的信念。首先,受试者进行一项研究,测试有关犯罪、收入流动、种族歧视和地理等政治和美国知识问题的知识和对新闻的反应。本研究的这一部分旨在衡量知识和政治动机。完整的问题文本见附录。接下来,受试者被问到以下问题:你认为你在这项关于政治和美国知识的研究中表现如何?我已经将你所有问题(在此之前)的平均分与其他100名参与者的平均分进行了比较。你认为100名中有多少人的得分高于100名?(请猜0到100之间。)事实上,受试者的排名是100位,所以这个问题有一个真实的答案。受试者可能会被激励相信他们的表现优于其他人,我们将假设在基于表现的推理中存在性别差异。这项激励措施测试包括三个步骤:1。信念:要求受试者猜测上述问题的答案。他们被要求并被激励去猜测他们的中间信念(这样他们发现答案高于或低于他们的猜测的可能性相同)。激励措施详情如下。2.新闻:受试者从两个随机选择的新闻来源之一收到一条二进制消息:真实新闻和假新闻。

12
可人4 在职认证  发表于 2022-4-24 19:01:22
来自真实新闻的信息总是正确的,来自虚假新闻的信息总是错误的。这是主要的治疗方法。信息上写着“答案比你之前的猜测更大。”或者“答案比你之前的猜测要少。”注意,对于做出不同初始猜测的受试者来说,确切的信息是不同的。对于上述问题,“大于”对应于专业表演新闻,或好新闻;“少于”对应于反绩效新闻或坏消息。3.评估:受试者在收到信息后,使用0/10到10/10的量表评估信息来自真实新闻的概率,并鼓励他们陈述自己的真实信念。我通过观察在新闻真实性评估中看到“大于”信息与“小于”信息的处理效果来测试动机推理。对于参与者在研究中其他地方回答的政治问题,也遵循同样的程序。每个科目都有九个政治问题和一个绩效问题;在每一个问题上,都会引出他们的中间信念,并要求他们评估一个回答大于或小于这个信念的新闻来源。在政治问题上,新闻根据主题分为亲共和党或亲民主党;在这些情况下,我们使用受试者声明的党派偏好将新闻分为好消息/亲党派新闻或坏消息/反党新闻。回想一下,由于受试者收到了“大于”或“小于”的信息,并将答案与他们的中位数进行了比较,贝叶斯不会根据这些信息改变她的评估。如果她在看到消息之前有一个P(真新闻)=1/2的先验值,她就会形成一个P(真|“大于”)=P(真|“小于”)=1/2的后验值。

13
nandehutu2022 在职认证  发表于 2022-4-24 19:01:28
我们将信息对准确性评估的系统性处理效果归因于动机推理。例如,如果在关于绩效的问题上,男性倾向于陈述P(真|“大于”)>P(真|“小于”),而女性倾向于陈述P(真|“大于”)=P(真|“小于”),这将表明男性有系统的绩效动机,而女性没有。2.3页面和评分规则总体评分规则在实验结束时,受试者获得3美元的出场费,或者额外获得10美元的奖金,或者不额外获得奖金。如下文所述,在每轮实验中,受试者根据自己的表现获得0-100分。这八个政治问题出现在绩效问题之前;一个问题出现在它之后。同样,先验和可能性(如先前确认偏差和保守主义的形式)的总体权重过高或过低也不能预测信息方向对评估的处理效果。分数对应于受试者赢得奖金的概率:分数为x的分数对应于赢得奖金的概率为x/10%。问题页面在问题页面上,向受试者提供问题的文本,并要求他们输入三个关于他们最初信念的数字:o我的猜测:这得出了受试者先前分布的中值。o我的下限:这引出了受试者先验分布的25%我的上限:这引出了受试者先验分布的第75个百分位。猜测的评分规则是分段线性的。受试者的最高收入为{100-|C-g |,0}点当正确答案为c时,猜测g。受试者被告知,他们将通过陈述其信念分布的中值来最大化预期点。边界的评分规则是分段线性的,具有不同的斜率。

14
可人4 在职认证  发表于 2022-4-24 19:01:35
对于上限UB,受试者最多可获得{100- 3(c)- ub),如果c为0}点≥ ub和最大值{100- (ub)- c) ,0}pointsif c≤ 乌布。对于下限磅,受试者最多可获得{100- (c)- lb),如果c为0}点≥ lb和max{100- 3磅- c) ,0}点,如果c≤ lb.受试者通过将ub设置为其信念分布的第75个百分位数,将lb设置为其信念分布的第25个百分位数来最大化预期分数。受试者只能给出我的下限≤ 我猜≤ 我的上限;如果没有,他们会看到一条错误消息。新闻评估页面提交猜测后,受试者会看到关于同一问题的第二页。在这一页的顶部是原始问题的确切文本。在最初的问题下面是一条信息,与他们提交给我猜的数字有关。这条消息说:“答案比你之前对[我的猜测]的猜测要大。”或者“答案比你之前对[我的猜测]的猜测要少。”受试者被告知,真实新闻总是说真话,假新闻永远不会说真话,消息来源是独立的。在信息下方,受试者是这个彩票系统是一种二值化评分规则的形式,旨在解释风险规避,因为直接将分数映射到收益可能会导致受试者战略性地规避他们的猜测(Hossain和Okui 2013)。因此,我们不需要假设风险中性以使实验与激励相容,但我们需要假设受试者的行为就像复合彩票被简化为简单彩票一样。概率分布等同于随机选择一个问题进行支付,然后根据该问题的得分进行抽奖。问:“你认为这些信息来自真实新闻还是假新闻?”然后从每个x=0,1,…,中选择一个Leven单选按钮,上面写着“x/10有可能是真新闻,(10-x)/10有可能是假新闻”。

15
mingdashike22 在职认证  发表于 2022-4-24 19:01:41
, 10.评估的评分规则是二次的。对于评估a,受试者的收入为100(1-(1 - a) )如果消息来源是真实新闻,得100分(1分)-a) 如果是假新闻就要扣分。受试者通过陈述与他们的信念最接近的0.1倍来最大化预期分数。受试者会得到一张表格,其中列出了根据每种评估和新闻类型获得的分数。偶尔,受试者会正确猜出答案。如果出现这种情况,他们会跳过新闻评估页面,进入下一个问题。性能测试的七个答案(0.71%)完全正确。获得正确答案的可能性与受试者随机猜测的可能性(0.99%)相似,因此不存在猜测操纵。2.4实验细节该实验也是泰勒(2021)的重点,于2018年6月在亚马逊的机械土耳其人(MTurk)平台上进行。MTurk是一个在线劳动市场,参与者在其中选择“人类智能任务”来完成。MTurk已经成为一种非常流行的经济实验方式,参与者通常比大学实验室的学生拥有更多不同的人口统计学特征(例如,霍顿、兰德和齐克豪塞尔2011;莱维、弗里斯和德鲁克曼2016)。该实验是使用oTree编码的,oTree是基于Chen、Schonger和Wickens(2016)开发的Django web应用程序框架的开放源代码软件。这项研究的对象是目前居住在美国的MTurk员工。1387名受试者被招募并回答了至少一个问题,1300名受试者完成了研究。在这些受试者中,987人(76%)通过了简单的注意力和理解测试,其余的被从分析中剔除。如第3.3节和附录所述,结果对纳入这些受试者是可靠的。在987名受试者中,980人(99.3%)没有正确回答成绩问题。这些受试者会收到一条信息,将他们的猜测与真实答案联系起来,并进入新闻真实性评估页面。在980人中,528人(53.9%)认为自己是男性,447人(45.6%)认为自己是女性,5人(0.5%)认为自己不是男性或女性。这是正确的,但理解检查问题除外,该问题的信息是“答案等于/不等于你之前对[我的猜测]。”为了通过这些检查,受试者需要完美地回答附录B中的理解检查问题(给出正确的答案、正确的界限,并确定地回答新闻评估)。此外,许多问题都有明确的最大和最小可能答案(例如百分比,介于0和100之间)。如果受试者的答案不在这些范围内,他们就会被放弃。不报告他们的性别。这些结果集中在975名报告性别的受试者身上。这975名受试者的积极/消极治疗平衡表见附录A.1。整个dem之间没有统计上的显著差异

16
大多数88 在职认证  发表于 2022-4-24 19:01:47
这些受试者会收到一条信息,将他们的猜测与真实答案联系起来,并进入新闻真实性评估页面。在980人中,528人(53.9%)认为自己是男性,447人(45.6%)认为自己是女性,5人(0.5%)认为自己不是男性或女性。这是正确的,但理解检查问题除外,该问题的信息是“答案等于/不等于你之前对[我的猜测]。”为了通过这些检查,受试者需要完美地回答附录B中的理解检查问题(给出正确的答案、正确的界限,并确定地回答新闻评估)。此外,许多问题都有明确的最大和最小可能答案(例如百分比,介于0和100之间)。如果受试者的答案不在这些范围内,他们就会被放弃。不报告他们的性别。这些结果集中在975名报告性别的受试者身上。这975名受试者的积极/消极治疗平衡表见附录A.1。在人口统计学上,收到关于他们表现的好消息或坏消息的受试者之间没有显著差异。这项实验在所有新闻类型中也是平衡的,其中488条(50.1%)是好消息,487条(49.9%)是坏消息。没有受试者在看到这个问题的信息后退出实验,所以选择性消耗不是一个问题。在研究政治化问题的行为时,我们考虑主体对共和党和民主党的主观评价。在全部样本中,627名受试者(64%)对民主党的评价较高;270(27%)给予共和党更高的支持率;90%的受访者(9%)对双方的评分相同。

17
何人来此 在职认证  发表于 2022-4-24 19:01:55
这些主题分别被标记为“支持民主党”、“支持共和党”和“中立”,对于包含政治问题的分析,中立主题被删除。样本中男女之间的政治差异不大;女性更倾向于民主党。62%的男性支持Dem,28%的女性支持Rep,而66%的女性支持Dem,27%的女性支持Rep。在这个样本中,男性和女性的政党偏好在统计学上没有显著差异。3结果第3.1节分析了对绩效过度自信的性别差异。接下来,第3.2节介绍了关于男性和女性如何激发他们的表现的主要结果。这表明,在政治化问题上,绩效评估动机推理中的性别差异并没有反映出来。第3.3节讨论了识别的稳健性和潜在混淆,没有发现证据表明这些替代解释解释了结果。第3.4节提出了对这些结果的解释,以及关于精度过高的补充证据。3.1过度自信从原始数据中可以明显看出过度自信中的性别差异。男性受试者期望超过55.3%的受试者(s.e.0.9 pp),实际上他们的表现优于49.5%的受试者(s.e.1.1 pp)。女性受试者的预期表现优于44.5%的受试者(s.e.1.0 pp),实际上,她们的表现优于45.4%的受试者(s.e.1.3 pp)。男性受试者的绩效预测平均高出5.8个pp(s.e.1.3个pp,p<0.001),而女性受试者的绩效预测平均低0.8个pp(s.e.1.5个pp,p=0.585)。换句话说,男性受试者系统性地过度自信,而女性受试者则不然。男性和女性受试者过度自信的差异为6.6 pp(s.e。

18
能者818 在职认证  发表于 2022-4-24 19:02:00
2.0 pp,p<0.001)。受试者对自己表现的信念与其真实表现呈正相关,但真实表现过度自信的性别差异几乎没有异质性。性别差异存在于高、中、低表现的受试者中。图1使用一个组合散点图来比较绩效分布中不同点的男性和女性。图1:按性别划分的信心和绩效说明:该图显示了按性别划分的绩效和信心的组合散点图。x轴测量测验中的绩效百分比。y轴测量置信度,即百分位受试者预期得分。该图显示,在这个问题上,男性在绩效分配的每一点上的信心都更大。事实上,高、中、低绩效水平的男性都希望平均绩效达到或高于中位数。除了在高端,女性不希望表现超过中位数。男性和女性信仰之间的差异(10.8 pp)大于受试者中最高五分位数和最低五分位数信仰之间的差异(6.3 pp)。附录图6显示了受试者过度自信水平的CDF。这表明过度自信的差异不是由异常值驱动的;男性的一阶分布随机地支配着女性的分布。3.2动机推理动机推理的性别差异在原始数据中也很明显。回想一下,如果消息源给出了关于其相对表现的好消息或坏消息,贝叶斯会认为消息源同样可能是真的或假的。如图2所示,男性在听到好消息时比听到坏消息时更信任消息。

19
大多数88 在职认证  发表于 2022-4-24 19:02:06
相比之下,女性对自己的表现给出了几乎相同的好消息和坏消息分类。图2:性别成员对关于自身表现的新闻的信任:好消息告诉受试者,正确答案大于他们对自己表现的中值信念;坏消息告诉受试者,正确答案低于这些信念。y轴测量受试者对来源准确性的评估。对于好消息和坏消息,Bayesian人同样信任新闻,剩下的则是动机化的推理。误差条对应于95%的置信区间。这些结果表明,当得到关于他们相对表现的消息时,男性平均会有动机地认为他们比他们(已经非常坚定)的当前信念做得更好,而女性平均来说几乎是贝叶斯的。动机推理中的性别差异表现在两个方面:男性认为好消息更有可能是真消息,而坏消息更有可能是假消息。平均治疗效果的差异并非由男性和女性受试者选择极端概率的差异所驱动。附录图7显示了CDFof新闻真实性评估P(真实新闻|好消息),图8显示了CDFof新闻真实性评估P(真实新闻|坏消息)的表现。男性受试者在分布的各个点上对绩效好消息的准确度较高,而对绩效坏消息的准确度较低。接下来,我们询问这种差异是由于绩效的特定领域,还是由于对动机推理的总体易感性。为了梳理这些竞争假设,我们在另一种情境中考虑动机推理中的性别差异:政治。使用的政治话题遵循泰勒(2021)的说法,假设的政治动机列表见附录表3。

20
可人4 在职认证  发表于 2022-4-24 19:02:12
图3显示,genderin动机的政治推理不存在显著的异质性,这表明我们看到的性别差异是关于绩效的信念所特有的。受试者之间表现动机推理中性别差异的回归说明,受试者i对受试者性别的回归评估a,关于表现的新闻是好是坏,以及性别和新闻方向之间的相互作用,有无其他人口统计向量的控制。ai=α+β·马莱+β·良好的x性能+i(2)β是人们感兴趣的主要对象,用来衡量男性比女性更有动力地对绩效进行推理的程度。β本身也很有趣;它衡量女性对表现的动机。人口控制包括种族、年龄、收入、教育、宗教和政党偏好。回归规范将基于表现的推理与基于政治动机的推理进行了比较,这是在受试者范围内进行的,将受试者i对问题q的评估a回归到r对虚拟新闻的评估a,即有利于表现与反表现,对于整体好消息与整体坏消息(这对应于关于绩效或派对的好消息与关于绩效或派对的坏消息),以及两者之间的相互作用,我们注意到这是衡量平均治疗效果的指标。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 07:41