楼主: 能者818
823 64

[量化金融] 遍历性破缺揭示人类的时间最优决策 [推广有奖]

56
能者818 在职认证  发表于 2022-6-24 04:10:43 |只看作者 |坛友微信交流群
给他们读说明书在扫描仪外进行约20次试验,或根据需要进行多次试验(\'training.py\',默认20次,被动和主动各5分钟)演示如果他们不按会发生什么如果你不及时按,这意味着扫描持续时间更长解释整个实验的时间(共3小时,第1部分约60分钟,第2部分约75分钟,有休息)注册主题填写日志,将日志号作为患者id在控制台上,将患者id设置为日志编号。在控制台上,将患者姓氏设置为受试者idPACS的项目名称必须为LogUtil从程序卡加载LogUtil序列准备进入扫描仪室S需要厕所吗?解释扫描仪不运行时S可以随时通话解释对讲机的工作原理就像对讲机,当我们说话时,我们听不到,先等一下再说话解释即使很小的移动也会影响数据质量,这会影响身体部位,尤其是头部和眼睛。

使用道具

55
mingdashike22 在职认证  发表于 2022-6-24 04:10:40 |只看作者 |坛友微信交流群
a、 游戏简化版的状态空间图,只包含两个可能的赌博对,并且只有两次尝试。b、 相同的状态空间进行四次试验。c、 此实验的状态空间用于单个试验。在所有图a-c中,红点表示可能的赌博对之间的分支,黄点表示选择之间的可能分支,绿点表示不同可能结果之间的分支。补充材料受试者到达前的实验检查表获取文件(主题-墙上,MR安全表格-markedkontrolskema诊所的托盘)打开投影仪定位按钮盒(双按钮盒,多色按钮,使用“左”)找到胶带、耳塞和蓝纸覆盖担架纸,穿孔时撕下确保床头线圈在架子上扫描仪内部设置屏幕如果删除数据超过四分之三,请检查数据饼图(只有日志中显示已传输到pacs的已删除数据)如果当天第一次扫描提前30分钟到达在淬火按钮下打开扫描仪(约10-20分钟)使用淬火按钮下的钥匙解锁扫描仪打开两台计算机问候受试者记住名称,经常使用填写kontrolskema-抓紧笔填写主题id表提醒输入磁铁>吸引到扫描仪中的金属移除所有金属(耳环、戒指、穿孔、珠宝、零钱、领带、口袋里的东西、检查裤子、避孕套口袋、眼镜、胸罩里的电线)移除任何不必要的物体(即使是非金属)仔细检查金属去除情况不要相信他们的话,即使是有经验的研究人员提供医院测试礼服(更衣柜更换)将拆下的物品放在储物柜中培训科目提醒游戏对象。

使用道具

54
可人4 在职认证  发表于 2022-6-24 04:10:37 |只看作者 |坛友微信交流群
如果我们暂时假设,我们所知道的是不可能的,受试者确切地知道未知的赌博空间和试验次数,那么状态空间图如补充图3c所示。该图的每次试验分支因子的下界约为600,深度为312。相比之下,围棋的每一步分支因子约为200,平均深度约为200。当受试者参与计划任务时,来自神经解码的证据表明,最快的状态到状态转换大约为40ms,相当于每秒大约25次评估。考虑到受试者在两次试验之间有约6秒的时间进行搜索,每次试验可评估的图形节点数远远低于提前计划一次试验所需的数量。即使受试者的认知能力超过了之前观察到的,这也只会对静态模型预测的风险规避产生轻微的调节。最后,或许也是最重要的一点,因为多周期EUT是预期效用理论的扩展,所以它不能定量预测代理人在最终财富时应该最大化哪些效用函数。基于这些考虑,多周期EUT不适合这种规模、复杂性和认知不确定性的游戏。即使要解决或消除这些问题,它们仍然无法提供与此处观察到的数据相符的定量预测。我们还注意到,虽然可以推导出前景理论的动力学版本47,48,但同样的基本限制也适用于这些模型。在这两种情况下,对提前计划的认知限制使得动态版本和静态版本的预测实际上是相同的。补充图6 |任务不同版本的状态空间图。

使用道具

53
可人4 在职认证  发表于 2022-6-24 04:10:34 |只看作者 |坛友微信交流群
因此,在一次试验后,有8种可能的最终财富(点的内绿色圆圈),在两次试验后,有64种可能的最终财富(外绿色圆圈)。通过计划评估树木在时间、工作记忆和代谢能量方面的计算代价很高。然而,有一些证据表明,人类可以通过基于模型的认知系统部分搜索这种大小的树,该系统评估基于状态的选项序列偶然性44,45。根据现有证据,基于树的搜索的性能似乎随着深度的增加而急剧下降,深度为5(分支因子为2)是达到区分最佳结果的机会性能的点。在补充图6a所示的简化游戏中,受试者在两次试验后评估最终财富时,可能会有机会表现出来。根据Goldstein的计算,对数效用的受试者在重复加法游戏中风险规避参数的变化,提前搜索两次试验(对于他的设置)将导致大约只有2%的变化,下降到0.98。这种风险厌恶程度的变化不足以解释观察到的风险厌恶程度的变化(图3k)。在这种短视的搜索能力下,Goldsteinresult提出的多周期模型导致风险规避的变化,其规模与图3c(下图)中所示的规模相当。计算开销随搜索深度呈指数增长。例如,为了提前搜索4个试验,Supp图6b显示必须评估1536个TerminalWealth。即使在认知上可以评估一棵树的这么多节点,但事实并非如此,那么风险厌恶感也只会下降约5%。这个实验的实际游戏树。

使用道具

52
能者818 在职认证  发表于 2022-6-24 04:10:31 |只看作者 |坛友微信交流群
微妙之处在于,一名实验人员根据观察到的多周期EUT代理的选择来估计效用函数,将发现估计的效用函数似乎在不同的动态设置之间发生变化,即使代理优化了终端财富的相同效用函数。事实上,这被提议作为这项实验的一个候选模型,其基础是可以证明,与乘法赌博相比,在重复加法的情况下,风险厌恶可以减少。这对于评估动态环境下的预期效用模型非常重要,但对于本实验任务而言,多周期EUT不是一个可行的人类行为模型。首先,终端财富是不可处理的。这是因为受试者不知道从最终财富进行反向归纳所需的以下五个细节:a)他们将面临多少赌博;b) 他们将面临怎样的赌博;c) 每次赌博的结果;d) 将实现哪些选择;e) 选择时他们当前的财富是什么。其次,即使我们设想这些不确定性不是计算终端财富的问题,但游戏的组合数学在计算上是禁止的,我们将在接下来的两部分中展示。简化的游戏树。为了说明实验中的分叉可能性,考虑一个非常简单的实验游戏,只涉及两对可能的赌博,只持续两次试验。此处,状态空间图如补充图6a所示。从中央节点开始,图形首先分支为两个,一个用于可能的赌博对(红点),然后再次分支为两个用于代理做出的二进制选择(黄点),然后再次分支以确定两个刺激中的哪一个是由公平硬币实现的(绿点)。

使用道具

51
能者818 在职认证  发表于 2022-6-24 04:10:28 |只看作者 |坛友微信交流群
这种噪声源可能会增加明显的风险厌恶,因为它会增加每次赌博的不确定性。动态实用新型。迄今为止测试的模型都是静态的,从某种意义上说,它们没有纳入对未来赌博或财富轨迹的任何预期。这是因为该游戏实际上是一个单周期游戏,其中10个随机选择的结果在游戏结束时立即实现,没有中间高度更新。然而,受试者可以采取的一种策略是提前计划,做出决策,最大限度地发挥游戏结束时终端财富的预期效用。这是在多期预期效用理论17-19下预测的,该理论涉及通过动态编程计算财富的迭代评估。这类模型计算在不同意外情况下可能的所有终端财富,并在给定代理的效用函数的情况下向后推导出最优选择。然而,这种策略对于游戏中的主体是不可能的。这是因为每个试验的分支因子是极端的(每个试验>600,补充图6c),并且受试者缺乏计算最终财富所需的关键信息,例如知道可能的赌博对的空间是什么,甚至知道他们将面临的试验总数。我们表明,即使考虑到对认知约束的乐观估计,也会导致搜索范围过于短视,以至于多周期模型的预测与静态模型几乎没有什么不同。预期效用理论和前景理论的动态版本。多周期EUT模型采用单一效用函数来评估终端财富,这在所有设置中都是不变的。

使用道具

50
kedemingshi 在职认证  发表于 2022-6-24 04:10:25 |只看作者 |坛友微信交流群
经济实验的另一个有效性问题是“房钱”问题,这涉及到如果受试者认为钱不完全是他们的,他们的行为是否会有所不同。这些影响通常通过预先捐赠资金或让受试者工作来感受资金的所有权来规避。这两种策略都是在这里实施的,只要受试者知道他们的捐赠提前几天,并且他们在做出决策之前大约90分钟就被预先捐赠了。受试者通过338次按键积极地改变财富,并观察由此产生的波动,总共约60分钟,从而增强了主人翁意识。此外,住房货币作为一种假定效应,并不能解释所观察到的风险规避的特定条件变化,也不能解释其与时间最优策略的双变量一致性(图3e)。认知因素。值得注意的是,受试者能够在具有挑战性的认知条件下完成任务。赌博是根据参与者对前一次被动会话中刺激物的记忆来选择的,大约60分钟前,每10秒进行一次选择,每天在嘈杂的环境中进行约1小时的测试。在Nobrainer试验中,几乎所有受试者(19人中的18人)都可以选择高于机会的优势赌博(补充图4e)。受试者能够接近时间最优策略的程度表明,他们对潜在增长增量和因素具有相对高保真的量值表示。虽然时间最优性是观察数据的合理近似值,但估计的风险规避参数系统地偏向于比时间最优性预测的风险规避程度更高(图3p)。这可能是由于刺激的感觉或记忆编码中存在噪音。

使用道具

49
大多数88 在职认证  发表于 2022-6-24 04:10:22 |只看作者 |坛友微信交流群
每个面板显示后部!通过与图3所示实际数据相同的模型和代码估计的受试者边缘分布。b、 modelrecovery针对三组不同的合成剂,对三种模型进行了比较。颜色范围显示如图4c所示的立体模型概率(黑色=1,白色=0)。后验模型概率强烈映射到地面真实模型恒等式上,因为前九个因素是通过时间最优模型合成的,下一个因素来自前景理论模型,最后九个因素来自等弹性效用模型。请注意,对于其他两个模型,等塑性剂获得的后验模型概率很小,范围约为0.05,只有2/9的参数值。合成剂。图1e-f显示了重复播放该范例中使用的144个不同组合的合成代理的财富轨迹。无脑者不包括在内。合成了12种不同的试剂,包括三个模型类别:9种前景理论试剂变体,包括V{1、2、3}和a{0.3、0.6、0.9}(收益和损失相同)的所有可能组合,以及2种等弹性试剂变体h{0、1}。每个prospecttheory和等弹性体的加性和乘性动力学参数相同。时间最优代理是一种特例,在加性动力学下具有线性效用,在乘性动力学下具有对数效用。轨迹是在几个时间尺度(小时、天、周、年)上计算的。在足够长的时间尺度上,噪声会随着时间的推移而消除,并且差异的时间平均增长率变得明显。在这个人工环境中,特工们每9.5s就要连续进行一次试验。在一周的时间内,通常显示出与时间平均增长率的合理近似值(图1e-f)。补充讨论。房款。

使用道具

48
mingdashike22 在职认证  发表于 2022-6-24 04:10:18 |只看作者 |坛友微信交流群
5a显示了风险规避参数估计值与模拟合成代理中使用的基本真值之间的对应关系。代理被模拟为具有所有成对组合!加法和乘法动力学的值[-0.5,0,0.5,1,1.5]。对每个参数组合模拟20名受试者,然后应用相同的参数估计程序来可视化参数的恢复,如图3所示。这包括*和!参数。补充图5a显示了与本文主要结果最相关的空间子集。事实是!可以准确地恢复表明它不能通过其他参数(如灵敏度参数)充分捕获。从Postrior的相对精度也可以看出这一点!图3中原始数据中观察到的值。模型恢复。为了评估模型选择方法是否能够恢复所测试的效用模型集,我们进行了一次模型恢复模拟,在该模拟中,我们将我们的估计程序置于由合成代理所做的选择中,这些合成代理预先设置了基础真值模型值。补充图5b显示了每种实用新型的后验包含概率与用于模拟合成试剂的实用新型的基本真值识别之间的对应关系。前七名受试者被合成为前瞻理论代理人(加性和动态会话的参数相同),后七名受试者合成为等塑性效用代理人(两个会话的参数相同),最后七名受试者合成为时间最优代理人。补充图5 |参数和模型恢复。a、 具有不同组合的几种合成剂的参数恢复!参数。

使用道具

47
能者818 在职认证  发表于 2022-6-24 04:10:15 |只看作者 |坛友微信交流群
由于被动阶段被设计为具有随机路径,因此受试者可以用不同的财富结束被动阶段,也经历了不同的波动(财富变化的方差)。我们测试了两个受试者和条件之间的这些差异是否可以解释观察到的风险规避差异。为此,我们以eta为因变量,以动态作为重复测量因子,执行armANOVA。为财富变化添加了以下受试者wisecovariates:被动阶段两种条件下的平均方差(“mean\\u var\\u dx\\u overconditions\\u passive”);被动相位条件之间的差异(“delta\\u var\\u dx\\u betweenconditions\\u passive”);主动相位两种条件的平均方差(“mean\\u var\\u dx\\u overconditions\\u passive”);主动相位条件之间的差异(“delta\\u var\\u dx\\u betweenconditions\\u passive”)。游戏中财富本身又增加了两个主题相关变量:被动阶段各条件的平均方差(“平均值\\u var\\u财富\\u过度条件\\u被动”);被动阶段条件之间的差异(“delta\\u var\\u wealth\\u betweenconditions\\u passive”)。请注意,支持。图4e显示,包含动态因子的Bayes因子是极端的,而所有其他协变量都低于1。这表明,甚至没有适度的证据表明,将财富协变量添加到模型中可以提高其预测的充分性。参数恢复。为了评估模型估计方法是否能够恢复近似参数估计,我们进行了一次参数恢复模拟,在该模拟中,我们将我们的估计程序置于事先设定了基础真值参数值的合成数据中。补充图。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-14 17:10