楼主: mingdashike22
1940 73

[量化金融] 声誉学习与网络动态 [推广有奖]

11
能者818 在职认证  发表于 2022-5-8 13:06:53
在该论文的模型中,当代理之间没有间接利益时,每个代理都会一次性与其他代理做出关联决策,以后再也不会更新其选择。但随着学习的进行,代理可能会通过中断与邻居的链接来改变他们的链接选择,而邻居的链接总是产生较低的收益。不完整信息会导致链接随着新信息的到来和信念的更新而动态变化,而不是像完整信息的情况那样保持静态。我们认为,当一组代理首次会面并形成网络时,这些影响是关键,甚至是动态的主要驱动力。此外,我们模型的可处理性允许我们明确计算不同网络结构的社会福利,即使在不完全信息的情况下。这种可处理性源于在我们的模型中使用连续时间扩散过程,它允许不同网络出现的概率的闭合形式等式。相比之下,Jackson和Wolinsky(1996年)以及Bala和Goyal(2000年)等其他网络论文使用的离散时间模型不允许这种干净的封闭形式表达式。虽然这些其他论文分析了给定固定网络的有效性,但我们的福利结果要强大得多,随着代理学习和更新其链接决策,网络可以随着时间的推移内生发展。这使我们能够比较不同初始网络结构的事前最优性,并提供特定网络结构最优时的一般结果。

12
nandehutu2022 在职认证  发表于 2022-5-8 13:06:56
例如,我们表明,当网络中的学习速度非常慢或非常快时,如果代理的初始预期质量都高于维护链接的成本,则完整的网络是最佳的。但是,当学习处于中等水平时,由于与声誉效应相关的负外部性,即使脆弱的代理的初始预期质量高于连接成本,也可能是防止他们连接的最佳方法。这样的结果不会产生不完整的信息,在这种情况下,如果代理人的素质都是完全已知的,那么严格来说,所有这些素质最初都联系起来会更好。本文还与网络观察学习相关的文献相联系。Golub和Jackson(2010年)、Acemoglu等人(2011年)和Golub和Jackson(2012年)等著作分析了社交网络中的观察学习。在这些模型中,有一个固定的外生网络,Agent在这个网络上进行交互,Agent通过观察邻居的行为来了解世界的外生状态。这些论文提供了通过不同类型网络连接的代理可以实现的观察学习的速度和准确性方面的结果。我们的论文与这篇文献有很大的不同,因为代理人了解其他代理人的素质,而不是外部世界的状态。因此,代理人希望随着时间的推移更新他们的联系决策,因为他们对他们与变革有关的代理人的信念。网络和学习共同进化,导致网络结构内生进化。维加·雷东多(Vega Redondo,2006)专注于道德风险和监控问题,并考虑了网络中有关代理行为的信息扩散。它假设参与者参与双边囚徒困境博弈。

13
大多数88 在职认证  发表于 2022-5-8 13:06:59
有关玩家行为的信息通过网络传播,特工可以通过惩罚叛逃者来维持合作。更紧密的连接网络允许更快的信息传输,因此可以维持更高水平的合作。本文分析了信息传输对网络结构的影响,并通过模拟和平均场分析表明,包含基于网络的信息可以增加网络密度。我们的工作重点是逆向选择问题和学习有关代理人类型的知识。我们表明,更多的信息可能对福利有害,因为它会导致更大程度的排斥。我们模型的可处理性还允许我们考虑整个网络演化路径产生的社会福利,而不是长期平均网络的福利。因此,我们能够解决网络设计问题,并描述不同环境下的最佳网络结构。我们还提供了模拟,突出了我们的主要结果,并显示了不同网络结构的社会福利。Song和van derSchaar(2015)发表了一篇涉及逆向选择学习的相关网络论文。与我们一样,本文还考虑了代理对网络中其他代理类型的学习,并展示了不完整信息和学习过程如何导致各种各样的网络结构和动态。然而,本文考虑了一个离散时间模型,并结合了一个简化的学习过程,在这个过程中,信息在一次交互后立即被释放。相反,在我们的模型中,信息逐渐被释放,决策和学习同时发生。

14
kedemingshi 在职认证  发表于 2022-5-8 13:07:02
由于学习是逐渐进行的,而不是瞬间进行的,因此我们能够分析准确的学习率如何影响网络动态和社会福利。非常重要的是,我们的模型允许网络结构本身影响对代理的学习速度。这种假设是现实的,因为学习通常受网络中代理的连接数的影响。我们发现,它具有强烈的影响,需要网络设计师仔细规划,以正确控制代理完成的学习。此外,我们对连续时间的使用使我们的模型更易于处理,并且能够明确描述不同网络结构的社会福利。B.与金融网络文献的关系我们的论文也与不断增长的金融网络文献有关。最近有许多论文试图解释金融网络普遍存在的核心-外围结构。这种核心-外围金融网络结构在各种市场上都有很好的实证记录,例如市政债券(Li和Sch¨urhoff 2014)和证券化(Holli¨ield等人2014)。Chang和Zhang(2015)、Farboodi(2015)、Neklyudov和Sambalaibat(2015)、Babus和Hu(2015)以及Wang(2016)的理论论文都提出了模型,试图解释核心-外围网络的普遍性。这些论文表明,各种形式的交易商异质性等特征可以导致核心-外围型结构。然而,这些论文大多是在完全信息环境下进行的,在这种环境下,可以直接观察到其他代理的类型。

15
大多数88 在职认证  发表于 2022-5-8 13:07:05
而那些确实考虑不完整信息的论文关注的是通过信息收集(关于债务偿还)的投资进行学习,而不是通过受网络结构本身影响的互动进行学习。例如,Babus和Hu(2015)表明,由于星型网络可以允许金融机构进行有效的相互监控,因此它们也会导致更有效的交易。Blaskes等人(2015)表明,核心-外围网络带来的好处会随着时间的推移带来更大的稳定性。我们的论文还为现实世界中的众多核心-外围网络提供了一个合理的解释,因为我们表明,在某些声誉不同的网络中,这样的核心-外围网络最大化了社会福利。然而,与之前的论文不同,我们的结果是由声誉力量的存在所驱动的。在我们的模型中,核心-外围网络降低了易受攻击的低声誉代理的声誉风险,从而防止他们尽快被排除在金融网络之外。此外,我们论文的背景与其他论文不同。在交易对手信息不确定性较低的情况下,考虑完整信息的文件与更长的时间框架和稳定的金融市场条件更相关。相反,我们认为我们的模型描述的是一个具有极大不确定性的短时间段。例如,在金融危机之后,由于难以评估其资产质量,银行对其他银行的偿付能力非常不确定。在这种情况下,银行会犹豫是否与其他机构进行交易,并会仔细尝试通过观察还款情况来了解其他机构的偿付能力。因此,每家银行的声誉都会随着时间的推移而变化。

16
kedemingshi 在职认证  发表于 2022-5-8 13:07:08
声誉较低的银行可能会在流动性挤兑期间完全被排除在融资市场之外,就像最近金融危机中雷曼兄弟倒闭时的情况一样。对于金融监管机构来说,重要的是仔细构建交易网络并控制相互作用,以便缓解这种情况。C.与社会排斥文学的关系最后,我们注意到我们的模型对社会和组织网络也有重要影响。我们关于声誉学习负外部性的研究结果突出了社会心理学文献中发现的排斥的破坏性影响。社会排斥是一种普遍存在的力量,在社会心理学文献中有很好的记载,从在线互动到办公场所。正如Williams和Sommer(1997)所说,“社会排斥是一种普遍存在的现象。”在本文献中,当代理人的感知质量下降太低时,也会发生排斥,并对代理人本身产生有害影响。正如Wesselman等人(2013)的论文所指出的,“被排斥是一种常见但痛苦的社会经历……不符合团体对贡献成员的定义的个人可能会发现自己是惩罚性排斥的候选人”。这篇论文通过一个在线实验展示了排斥行为的发生,在这个实验中,特工们玩游戏的能力不同。表现糟糕的经纪人被其他人排斥。这种效应与我们的模型类似,在我们的模型中,学习到低质量的代理被排斥在网络之外。工作场所也可能发生排斥现象,因为一些员工可能会被同事排斥。

17
kedemingshi 在职认证  发表于 2022-5-8 13:07:11
Robinson等人(2012年)指出,“这种经历不仅非常痛苦,而且在某些情况下,它们可能比其他有害的工作场所行为(如攻击和骚扰)产生更大的负面影响。”因此,公司必须考虑工作场所互动中可能出现的排斥的有害影响。我们通过在网络中心位置放置低计算代理,为最小化排斥的负面影响提供指导。三、 莫德拉。概述我们考虑了一个有限水平连续时间模型,其中包含一组由V={1,2,…,N}表示的有限代理。在每一时刻,代理都会选择与哪些其他代理建立链接,只有在双方同意的情况下才能建立链接。这些选择受到潜在的网络约束Ohm = {ωij}指定了能够相互链接的代理对。对于每对代理,如果代理i和j可以相互连接,则ωij=1,否则ωij=0。如果特工i和j能联系上,我们就叫他们邻居。最初(timet=0),代理根据网络G={gij}链接 Ohm. 由于网络将随时间变化,我们将GT表示为时间t处的网络。此外,我们让kti=Pjgtijbe表示代理i在时间t处的链接数,并让Ktidenote表示代理i在时间t处的邻居集。代理从每个环节获得的流量回报等于该环节的收益减去成本。每个代理我必须为其活跃的每个链接支付流动成本c。因此,在时间t时,代理IPAIS为其所有链接支付ktic的总成本。代理人还可以从他们的联系中获益,这取决于他们联系的邻居的素质。然而,每个代理的真实品质最初对所有代理都是未知的,我们不要求代理知道自己的品质。

18
能者818 在职认证  发表于 2022-5-8 13:07:15
在模型开始时,每个试剂i的质量指数都是从一个众所周知的正态分布N(ui,σi)中得出的,ui>c。均值和方差都允许在不同试剂之间变化,我们下面的几个结果将利用这种异质性。Agent i为与其相连的每个Agent j生成不同的噪声收益bij(t),这些收益遵循扩散dbij(t)=qidt+τ-1/2idZij(t),其中漂移是真实质量,方差取决于τi,我们称之为因子i的信号精度。Zij(t)是标准的零漂移和单位方差布朗运动,代表每种相互作用的收益中的随机波动。Zij(t)被认为是独立于所有i和j的,因此agenti产生的所有收益都是有条件地独立于qi的。我们假设代理i产生的所有好处都是由代理i的所有邻居观察到的,这确保代理i的邻居都具有相同的网络约束Ohm 可能源于代理人关于他们想与谁联系的特定利益/愿望,或源于限制代理人联系的潜在物理/地理限制。也可以通过金融监管机构对金融机构网络的监管,或公司人力资源部对员工网络进行规划。我们可以将信号精度视为代理在每次交互中显示的关于自身的信息量,更高的精度对应于更多的信息。这可能取决于与代理的交互类型(例如。

19
可人4 在职认证  发表于 2022-5-8 13:07:18
亲密关系或偶遇),或代理人的个性等因素。在任何时间点对我的信念(信息在代理i的邻居中是本地公开的)。对于每个代理人i,我们将代理人的受益历史定义为所有之前受益的历史,Hti={btij}tt=0。我们假设代理是短视的,因此他们在做出关联决策时只考虑当前的流量效益。假设每个代理的效用在每个链接提供的收益和链接成本中是线性的。这也意味着,当存在不确定性时,代理是风险中性的,因此考虑对邻居质量的期望。在任何时间t,试剂i的流量效用由以下等式给出:Ui=X{j∈Kti}(E[qj|Hti]- c) (1)B.声誉和学习速度由于我们假设了一个扩散过程,所有单个链接收益的充分统计是代理i到时间t产生的每个链接的平均收益,我们表示为asBi(t)。鉴于我们的上述假设,Bi(t)遵循扩散dBi(t)=qidt+(ktiτi)-1/2dZi(t),其中漂移率为真实质量qi,瞬时波动率(ktiτi)-1/2dependson代理i在时间t时的链接数,Zi(t)是标准布朗运动,具有零漂移和单位方差。重要的是,这个等式表明,一个代理的链接越多,其波动率越低,了解其真实质量的速度也越快。这是因为链接越多的代理产生的个人收益越多,因此所有收益的平均值更精确。还请注意,没有链接的代理不会发送任何信息,因此不会了解其质量。因此,网络的拓扑结构强烈影响每个代理的质量学习率。这是保持模型可处理性的一个重要假设。

20
能者818 在职认证  发表于 2022-5-8 13:07:21
例如,它可以通过一个在线专家网络进行解释,其中agent i的输出是公开的,因此agent i的所有邻居都可以判断我为其所有链接提供的好处。或者在一个模糊的环境中,我们可以假设代理i的邻居正在与代理i的所有其他邻居持续讨论他们从代理i获得的好处,以便邻居保持相同的信念。对于我们的大多数结果,信息不需要完全公开;关于代理i的信息只需要提供给代理i的所有直接邻居。这种假设在网络文献中很常见,以保持可跟踪性,例如,参见Jackson和Wolinsky(1996)或Watts(2001)。近视是财务网络中的一个适当假设,在这种网络中,企业经理有近视的动机。雅各布森(1993)和米兹克(2010)等论文从经验上证明了这种近视动机。Werelax在扩展部分给出了这一假设,在扩展部分我们考虑了改变代理链接策略的补贴。如果在t时,代理i的所有链接都被切断,那么代理i将不会产生任何收益,这将被表示为bti=. 在这种情况下,不添加任何信息,因此,试剂i的扩散停止在其当前水平。如前所述,存在对代理人i的质量n(ui,σi)的先验信念,代理人将根据对流量效益的观察,以贝叶斯方式更新该信念。这些观察与先验质量分布相结合,将导致代理人i的质量f(qi | Hti)的后验信念分布,该分布也是正态分布。根据历史记录,我们将uti=E[qi | Hti]表示为代理人i的预期质量,并将其称为代理人i在时间t的计算。声誉代表了在时间t与代理人i联系的预期收益。我们假设代理人是短视的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 05:01