楼主: 大多数88
1422 79

[量化金融] 公平报酬问题:成功的幻觉及其解决方法 [推广有奖]

31
mingdashike22 在职认证  发表于 2022-6-14 04:05:58
E、 考虑到在狩猎-采集并存的情况下,这个政权至少占据了人类历史的90%,这可能是核心问题:事实上,繁荣和生存往往取决于平衡冒险进入未知领域及其潜力和风险,而不是依赖熟悉的生产方法。直到一万多年前的农业革命,我们才开始学会在一个有组织的/等级制度中成为政治动物。本质上,这相当于一种进化突变-繁殖权衡。自然,它形成了人工智能学习的基础(Kaelbling et al,1996)。这是一个普遍的传统格言(例如,在道教中,以平衡“气”的实践为中心)。此外,有机体、动物(Caraco,1980)、人类个体(Cohen et al,2007)、公司(创新或停滞;“管理双重性”)(Wilson et al,2014)、战略投资者(投资VC?)都是一个问题,社会同样需要导航(Banks,1994;Mehlhorn,2015)。收集了这些想法后,我们回到图7中的游戏和进化玩家:代理监控者(agentmonitors)观察系统的可见部分,试图以理性和客观的方式区分运气和技能。此外,动态环境改变了比赛,并可能改变运气和技能之间的平衡(例如,在高度多变的风下,幸运的帆船赛)。代理人需要仔细推断运气的动力和贡献,至少部分地,这超出了视野。该系统经历了探索(决定)–利用(执行)周期,交替发散的开放思维,然后统一到一个共同的目标。优化循环将相同的动态嵌入到执行机制内的子尺度(监视器)中。

32
nandehutu2022 在职认证  发表于 2022-6-14 04:06:01
此外,在缺乏探索性的制度下,需要嵌入有规律的收敛循环:例如,选择有前途的想法并构建原型。事实上,这个学习需要做,做需要执行。这就是Tetlock等人(2015)所说的“掌握错误平衡自行车”。英特尔前首席执行官安迪·格罗夫(AndyGrove)表示,应该实行“建设性对抗”。Ray Dalio(2017)对此表示赞同:“为了取得成功,我们必须有独立的思考者,他们必须如此独立,以至于他们会打赌反对共识”。Tetlock et al.(2015)的表述如下:不要试图为自己的失败辩护或辩解。拥有它们!进行坚定的尸检:我到底错在哪里了…也不要忘记对你的成功进行事后分析。并非所有的成功都意味着你的推理是正确的。你可能只是幸运地犯了抵消错误。如果你一直自信地沿着同样的思路推理,那你就是在给自己制造一个可怕的惊喜。他们把这称为“目标的神话”:“目标实际上成为通向更令人兴奋的成就的障碍,比如那些涉及发现、创造力、发明或创新,甚至实现真正幸福的人……通向“蓝天”发现者实现无限抱负的最真实的道路是根本没有目标。平衡昂贵、不确定和有风险的学习与“局部最优”优化和生产的更安全保护。例如,在生物进化中,由于代谢化学反应的巨大冗余性,小的所谓“中性”突变逐渐累积,对适应度没有明显影响。然后,当达到阈值时,最后一个微小的突变会引发一连串的变化,这可能会导致一个新物种(Wagner,2015)。本质上是中国道教的阴阳。

33
大多数88 在职认证  发表于 2022-6-14 04:06:04
这种动态如图7所示:注射I(b)中,系统朝着局部最优方向调整,并达到平台。在I(a)中,达到高峰值,但随后衰减,例如,由于过度的自上而下控制(执行不佳)或环境变化。随着该制度的增长潜力达到极限,不确定性激增,而在这种情况下,强化的勘探活动导致了突破。范式I向范式II的突变/转变发生了。灭绝是另一种可能性。在新范式中,操作不断优化,系统的性能超过了前一范式的峰值——正如潜在图所示,潜在图受未来运动和不确定性的影响。5、衡量和奖励过程绩效5.1这三个案例:既然我们已经掌握了进化游戏的本质,为现实世界的问题提供了丰富的模型,我们就可以创造出三种互补的观察方式,从而奖励优点。给出了测量的具体性质和使用条件。这三种方法针对不同的结果衡量标准:原始结果(“等待奶油上涨”):这是基本情况,即基于单个快照对流程进行评估,最典型的是在其停止时间。这与Dorner的弹道作用密切相关(Dorner等人,1990年)。若不存在计量,采用产出计量可能是一种改进。这种方法的简单性–使用e。g、 成功/失败是可以客观观察到的,不需要对过程质量/优点进行评估,这很可能是困难的、耗费成本和时间的,并且容易出错,这使得它很有吸引力。然而,这是非常嘈杂,依靠一个单一的观察。

34
何人来此 在职认证  发表于 2022-6-14 04:06:07
从技术角度来看,成功的结果可能不能说明基本过程的实际质量——显著区分运气和技能的统计能力很低。推理可能会因过程中范式的变化而发生偏差。以下方法更为复杂。风险调整/聚合(“将小麦从谷壳中分离”):这里,对一个过程的实例进行路径评估,以查看结果是如何获得的。在足够稳定的条件(环境)下,人们可以利用统计经验来解释运气对最终结果的作用。因此,这将原始结果度量扩展为风险调整。此外,如果存在单独的(理想情况下是独立的)过程实例并可以观察到,则可以使用聚合度量(例如,%成功)。因此,相对于基于结果的“样本量一”方法,预计luckand技能之间的区别会更好。图7:通过“范式变化”和探索周期对不断发展的学习者的动态视图——在文本中进行了描述。前瞻性:(“侦察未来之星”)这一包罗万象的案例解决了一个不断变化的环境,以及不断变化的内部范式,即历史不是未来的完全和直接代表,但通过演绎推理,可以被同化为未来情景。因此,这一过程是通过评估过去、现在和未来来评估的,其优点部分应根据发展能力来评估。这允许风险评估超越已发生的场景和事件。在量化允许的情况下,可使用Rawoutcome和风险调整措施。

35
nandehutu2022 在职认证  发表于 2022-6-14 04:06:10
然而,这里的度量更多的是关于一个过程与上面3中定义的进化系统的原理的定性比较。为了更广泛地反思这一重要的前瞻性案例,Seligman等人(2013、2016)从大自然中汲取灵感,推测前瞻性是人类认知和行动的核心和单一组织特征。有鉴于此,人类不应该被称为智人(“智者”),而应该被称为智人(“前瞻性的人”),因为智者是对可能的新未来的模拟。杰夫·霍金斯(Jeff Hawkins,2004)进一步提出了一个神经生物学基础,假设认知是一个反馈/回忆循环,以双向层次发展认知和预测:这种“记忆预测”理论声称,我们的大脑因此不断尝试预测,然后比较、预测、比较、学习、调整、预测等等。在相关思考中,Karl Friston等人。(2006年、2012年)假设生物系统努力将期望和感官感知之间的差异最小化(Perrinet等人,2014年)。为了修正想法,将这三个度量标绘在思维导图中(图7),并与三种类型的操作系统相关,每种操作系统都具有较高的“智能”(Gell-Mann,1994)。第一种是直接适应:就像恒温器一样,当超过某个阈值时,恒温器只会做出反应(“太冷、太热、太冷”…)。这个最基本的管理系统对应于我们基于结果的案例。接下来是一个更智能的专家系统,它是一个静态的内部模型,类似于决策树,基于历史专家经验:“如果…,那么…,否则…”。这里强调的是控制,以及系统可以通过充分了解历史投入产出关系来控制的信念。

36
大多数88 在职认证  发表于 2022-6-14 04:06:13
这与我们的风险调整案例相对应。最后,最智能的操作系统是一个复杂的自适应系统,它是一个专家系统,可以通过突变和选择过程从不断变化的环境中学习,就像在生物进化中一样:它有一套内置规则(方案、基因、模因)。存在允许选择的适合性标准,而糟糕的方案将过时。此外,还存在通过繁殖和突变(开发探索)的变异。选择和变化是允许系统学习并动态适应其不断变化的环境的基本要素。我们推测,其他动物也能够概念化探索,推断灵活规划的现有证据(Kabadayi,C和M.Osvath,《Ravens parallel great apes in flexible planning for tool use and bartering》,Science 357202-2042017)。5.2将技能与运气区分开来:结果和风险调整措施短期成功通常会得到奖励,而不考虑长期健康状况,并且可能会损害长期健康状况。我们努力建立更多的精英制度。在这里,通过模拟研究评估了原始和风险调整措施识别质量的效率。5.2.1运气和技能模型我们现在讨论在原始结果观察下将运气与技能分开的问题。考虑某个经纪人,他在完成一个过程(玩游戏)时使用了技能和运气的组合(暴露在其中会受到冒险的影响)。在Shockley(第2节)之后,该任务的结果在某个时间点的分布为对数正态分布。在这种情况下,其依赖时间的演化可以表示为一个随机过程,如几何布朗运动(GBM):+,-,-。

37
nandehutu2022 在职认证  发表于 2022-6-14 04:06:16
“/”01 2“3”045(2),其中在无穷小的时间步长dt内,成功结果的百分比变化+,-,完全由百分比漂移u(表示技能部分)和百分比波动率s(此处表示运气)表示。离散小波变换引入了随机性,它是维纳过程(布朗运动)的增量。在GBM之后,时间T之后的偏移通常为:67\'895:\';\'</=>?%@\'A 2\'BC\'3\'DA(3),其中xi是零均值和单位方差的随机变量。第一项</=>?%@在那里。h、 (3)中的s是技能部分的累积效应,第二个术语bc\'3\'DAis theluck部分。术语(>?%\'A@in技能成分是托卡斯蒂克过程中乘性噪声的结果。对于大多数应用程序,此校正项很小,所以将其设为零。图8:奖励层次结构:三个互补的分支代表了根本不同的奖励方法。在强平稳性的情况下,应使用(寿命)时间,对于弱平稳性,应使用数据,当不存在平稳性时,应使用启发式。有一个特征时间T*,在该时间点,技能和运气将对GBM过程的结果做出同等贡献。此时,T*满足/AE3\'DAE,屈服:AE\'F> (4)当T小于T时,运气成分占主导地位,且过程是扩散的或随机的;当评估结果的时间大于T*时,技能占主导地位,过程正在漂移。因此,当基于单一观察无条件评估漂移过程时,只有时间才能区分技能和运气。只有在超过characteristictime(4)后,流程的结果才是技能的良好指标。在较短的时间内,幸运占主导地位。

38
nandehutu2022 在职认证  发表于 2022-6-14 04:06:19
更广泛地说,典型的时间区分了哲学家孟子的闵仪和闵昕:第一个是指基于变化无常的短期思维的政策,而第二个是着眼于长期整体的观点(Weiwei2017)。考虑到一些关于GBM类型过程中估计技能难度的著名观点:默顿,1980年指出,“……试图估计市场上的预期回报是在做傻事”,Markowitz和von Dijk,2006年,“我们不知道如何输入数据并获得“正确的”预期回报估计。”Ambarish和Seigel,1996年指出,估计平稳过程的预期回程到指定置信水平可能需要几年的时间。Chopra和Ziemba,1993年,讨论了投资组合选择中的平均值错误,并显示了它们的相对重要性。5.2.2时间作为分割因素:等待乳膏上升,对于原始结果观察病例,我们评估特征时间启发式在区分技能和运气方面的表现:我们考虑了N种药物的异质群体,在GBM(2)之后执行一些过程。每个代理都有技能和lucki(例如,由于不同的风险承担水平)。ui根据两个对数正态分布LN(Iskill,Jskill)和LN(Iluck,Jluck)进行分布。经过一个时间步长ka后,代理的已实现成功可通过等式(3)计算得出:Withkill part</C=>L?%@KA,和运气成正比。然后,我们根据时间步长后的实现结果,将人群分成结果十分位数(每个包含N/10个代理)。然后,我们计算每个观察到的细节的真实技能ui和运气的平均值。对不同的KA重复模拟,我们称之为“审查期”:评估代理质量或“审查”代理所需的时间。

39
大多数88 在职认证  发表于 2022-6-14 04:06:22
附录A.1给出了四个不同人群的结果,异质性增加。从这里,并参考图A.1,考虑到奖励问题,出现了两种解决方案:1)“选择成功”:奖励最高的十分位,希望包含熟练的代理;2)“取消选择运气”:奖励中等的十分位,从而避免/惩罚最幸运的人,也许还有那些承担不负责任风险的人。事实上,前十名中包含了最幸运(和一些技术娴熟)的人。奖励他们是经典的原始结果解决方案。然而,这一策略的优点在很大程度上取决于人口异质性和相对于特征时间的审查期。有趣的是,去选择运气方法对种群异质性和审查时间的依赖性很弱。这可以在图A.1中的四个子图中清楚地看到。通过重排中间的十分位数,我们最终会以相对较低的运气贡献来奖励代理人,事实上,我们明显忽略了最成功和最不成功的代理人。Pluchino等人(2018)基于基于代理的模型,也发现最成功的代理很少是最有天赋的。生活在公元前372年至289年的著名儒家哲学家。需要明确的是,Iskill是代理人技能分布的平均值和标准差,而Luckis是N个代理人“运气”分布的平均值和标准差(考虑到例如可变的风险承担)。术语不应与漂移术语混淆。它表示平均波动率。JSKILL也是如此,它不应与波动性混淆,而应与人口的可变性混淆。哪种解决方案最好?显然,如果有足够长的审查期,人们可以等待,然后从前十分位中挑选奶油。

40
可人4 在职认证  发表于 2022-6-14 04:06:25
然而,人们如何知道自己是否已经等待了足够长的时间,以至于观察到的成功大多不是偶然的?而且,在异质人群和短审查期的实践中,该怎么办?例如,对于选择金融投资的问题,考虑到通常每年约5-10%和20-30%,表达式(4)给出的特征时间T*在4到36年之间。在这里,(无条件的)选择成功的方法对于持有期不到4年的公司来说是很弱的,这已经是很长的时间了。这说明了一个众所周知的事实,即大多数表现优异的金融基金都有很大的运气,而真正有技能的基金则很少(Barras et al.,2010)。我们现在通过风险调整后的衡量标准来测试上述指标的表现:技能除以运气(/M3@called金融领域的夏普比率。结果如图8所示。令人惊讶的是,对于更短的审查期(这里不到一年),最优分配的夏普比率几乎持平。然后,从分配到中值十分位数,再到分析到第一个十分位数,形成一个阶梯式的最优分配函数。从我们的模拟中得到的教训很清楚:只有拥有很长的审查周期,才能以这种方式将技能与成功区分开来——在一个随机且异质的世界中,精华慢慢升起。对于大多数真实的人类活动来说,技能和运气的广泛分布,加上决策的紧迫性,需要努力避免成功的幻觉,这种幻觉往往会使我们在追求可持续成功的过程中变得盲目和误导。5.2.3风险调整措施:将小麦从谷壳中分离出来,现在考虑更丰富的环境,其中1)我们能够在评估过程中包括中间结果,甚至2)考虑多个平行实例。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 12:40