楼主: 何人来此
1703 23

[经济学] 网络上的非对称博弈:走向伊辛模型表示 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-4-16 11:33:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要翻译:
我们在这里研究两性之战游戏,一个在小型网络上的非对称游戏的教科书案例。由于博弈者偏好的冲突,分析方法很少,通常在网络上重复博弈的数值模拟中使用更新策略,直到达到收敛。结果,玩家的选择之间出现了相关性。我们的方法是用一个广义的伊辛模型来研究这些相关性。利用响应策略框架,我们描述了参与者的行为如何使网络从非均衡状态进入稳定状态。我们利用博弈论工具得到这些构型,并用伊辛参数描述结果。我们穷尽了两人情形,给出了所有均衡可能性的详细说明。针对三个参与者,我们推广了Ising模型,并比较了三种典型网络的均衡解。我们发现,没有直接联系的参与者保留了一个与其初始相关性成正比的关联度。我们还发现局域网络结构与小磁场值和Ising模型的相互作用强度最相关。最后,我们得出了均衡状态的某些参数与网络无关的结论,这为分析描述网络上的非对称博弈提供了可能性。
---
英文标题:
《Asymmetric games on networks: towards an Ising-model representation》
---
作者:
A. D. Correia, L. L. Leestmaker and H. T. C. Stoof
---
最新提交年份:
2021
---
分类信息:

一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--
一级分类:Physics        物理学
二级分类:Statistical Mechanics        统计力学
分类描述:Phase transitions, thermodynamics, field theory, non-equilibrium phenomena, renormalization group and scaling, integrable models, turbulence
相变,热力学,场论,非平衡现象,重整化群和标度,可积模型,湍流
--
一级分类:Economics        经济学
二级分类:Theoretical Economics        理论经济学
分类描述:Includes theoretical contributions to Contract Theory, Decision Theory, Game Theory, General Equilibrium, Growth, Learning and Evolution, Macroeconomics, Market and Mechanism Design, and Social Choice.
包括对契约理论、决策理论、博弈论、一般均衡、增长、学习与进化、宏观经济学、市场与机制设计、社会选择的理论贡献。
--

---
英文摘要:
  We here study the Battle of the Sexes game, a textbook case of asymmetric games, on small networks. Due to the conflicting preferences of the players, analytical approaches are scarce and most often update strategies are employed in numerical simulations of repeated games on networks until convergence is reached. As a result, correlations between the choices of the players emerge. Our approach is to study these correlations with a generalized Ising model. Using the response strategy framework, we describe how the actions of the players can bring the network into a steady configuration, starting from an out-of-equilibrium one. We obtain these configurations using game-theoretical tools, and describe the results using Ising parameters. We exhaust the two-player case, giving a detailed account of all the equilibrium possibilities. Going to three players, we generalize the Ising model and compare the equilibrium solutions of three representative types of network. We find that players that are not directly linked retain a degree of correlation that is proportional to their initial correlation. We also find that the local network structure is the most relevant for small values of the magnetic field and the interaction strength of the Ising model. Finally, we conclude that certain parameters of the equilibrium states are network independent, which opens up the possibility of an analytical description of asymmetric games played on networks.
---
PDF下载:
--> English_Paper.pdf (2.38 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:correlations Presentation proportional Quantitative Contribution

沙发
能者818 在职认证  发表于 2022-4-16 11:33:40
网络上的非对称游戏:走向伊辛模型代表。D.Correia,*l。L.Leestmaker和H.T.C.担任荷兰乌得勒支大学理论物理和复杂系统研究中心主任。荷兰乌得勒支大学社会学系/ICS和复杂系统研究中心(日期:2021年8月24日)我们在这里研究小网络上的性别之战游戏,这是一个非对称游戏的教科书案例。由于玩家的偏好,分析方法很少,通常在网络重复游戏的数值模拟中使用更新策略,从而达到收敛。因此,玩家选择之间的相关性就显现出来了。我们的方法是用一个广义的伊辛模型来研究这些相关性。首先,我们展示了这些相关性在模拟中出现,并且可以有类似伊辛的形式。然后,利用responsestrategy框架,描述了参与者的行为如何使网络从非均衡状态进入稳定状态。我们利用博弈论工具得到了这些结论,并用Ising参数描述了结果。我们穷尽了两个游戏者的情况,给出了所有平衡可能性的详细说明。在三个参与者中,我们推广了伊辛模型,并比较了三种代表性网络的均衡解。我们发现,没有直接联系的玩家保持一定程度的相关性,与他们的初始相关性成正比。我们还发现局部网络结构对于小磁场和Ising模型的相互作用强度是最重要的。最后,我们得出了平衡态的某些参数与网络无关的结论,这为分析网络上的非对称博弈提供了可能性。关键词:非对称博弈,相关博弈,Ising模型,网络上的博弈。引言许多Di-Enerent系统的成功依赖于协调过程,无论是Tra-with C中的cars、组织一个公司还是生物系统[1-3]。理解协调过程往往是至关重要的。当利益相关者对他们愿意协调的选择有利益相关者的偏好时,协调可能会变得复杂。在博弈论中,这些情况可以通过非对称(性别斗争)游戏来形式化。这些游戏描述了双方对结果有不同的偏好,但仍希望达成协调的情况。例如,它们可以用来描述在政治、经济或人与人之间进行的合作谈判[4]。近年来的研究表明,网络结构对2×2非对称博弈中博弈者的行为有重要影响[5-9]。这些研究通常依赖于重复博弈的数值模拟,直到达到收敛。我们在这里感兴趣的是,对网络上进行的两性之战游戏的均衡状态进行分析描述。本研究的目标是能够以一种新的方式对数值模拟的结果进行分析再现[5,9]。一般情况下,2×2对策是由它们的特征*a.duarteCorreia@uu.nlistic payo-thructure[10]来定义的。给定一个特定的游戏,每个玩家都得到一个奖励,这个奖励不仅取决于他们自己的行为,也取决于他们对手的行为。在oneshot游戏中,玩家是独立的,每个玩家都选择他们认为能产生最高Payo的选项。这通常对达到最优状态提出了挑战[11]。由于对手会做什么的不确定性,玩家可能会达到一个均衡,要么不是最优的,要么甚至根本达不到一个均衡。在重复游戏中,玩家与同一个对手多次玩相同的2×2游戏。

藤椅
kedemingshi 在职认证  发表于 2022-4-16 11:33:46
在每一轮中,玩家被告知其他玩家在前一轮中的回声。这些信息可以在下一轮中得到解释。因为在重复游戏中,玩家知道其他玩家在前一轮中的选择,所以在选择行为中引入了相关性。最近(重复)博弈论与网络理论合并[12,13]。网络理论和进化博弈论的融合有很长的历史[14,15],其中统计物理学的方法作出了相当大的贡献[16-18]。对于网络上的对称博弈,当所有节点都是相同的时,唯一的参数节点是可用选择的数目和节点的连通度。在这种情况下,存在统计处理和分析预测的平衡条件[19,20]。然而,对于非对称游戏来说,这是很难获得的,因为尽管每个玩家仍然有相同数量的选择,但现在存在着不同类型的玩家,每一种玩家都以偏爱某一选择为特征[21]。当分布在anetwork上时,有一个游戏的展开是由于这些直接偏好:玩家可以与具有相同偏好的玩家联系在一起(在那里他们玩纯粹的协调(PC)游戏),也可以与具有直接偏好的玩家联系在一起(在那里他们玩性别之战游戏)[5]。考虑到每一个节点在连通度大于1的情况下都经历两种类型的连接,使得研究该博弈在网络上的收敛性极具挑战性。在一次博弈中,每个参与者都有一次行动,因此得到了类似于不相关(纯策略和混合策略)纳什均衡的结果,由于缺乏沟通,延续了相同的欺诈问题。相比之下,在迭代游戏中,玩家继续重复玩游戏,他们可以利用前几轮的结果信息来调整他们的策略。这引入了一种异步通信形式,采用学习规则或更新策略的形式。在这种情况下,玩家根据上一次迭代的信息更新她对下一次迭代中她应该玩什么的信念,直到达到收敛的标准[15]。通过引入更新策略,玩家往往可以在一个有利的策略上进行协调,通常也依赖于网络结构本身[22,23]。更新策略有两种主要类型[15]。一种是比例模仿,在这种情况下,玩家模仿其他人的行为,如果这些人的行为比他们自己的行为高,通常比他们自己的行为高出平滑阈值,例如,费米分布函数[24]。另一个是bestresponse,玩家改变他们的动作,以改变在前一轮中会给他们更高Payo的动作[23,25]。最佳反应策略会使博弈者收敛到一个状态,在这个状态下,博弈者可以通过改变策略来证明他们的支付能力[26],这是纳什均衡的特征。对于网络上的非对称博弈,这是特别有用的,因为如果没有任何形式的交流,纳什均衡是很难达到的[4]。

板凳
大多数88 在职认证  发表于 2022-4-16 11:33:52
Hernandez等人[7,8]预测,当选择一个稳定的点时,Broere等[5]对性别之战博弈进行了数值模拟,该博弈在广泛的网络范围内收敛到一个最短视的反应,表明中心度是节点结果的最重要预测之一,从而导致集群内部的同质性和集群之间的异质性,这与Hernandez等的结果不一致。对人类受试者进行NumericalPredictions的后续实验[6]。我们在这里的建议是看看通过更新策略引入的潜在相关性,对应于玩家之间的一种通信形式,这是解决偏好Con描述所必需的[4],并使用广义ISingModel的参数来研究它们。通过这样做,我们试图理解结果的相关性是如何向平衡发展的,使用伊辛参数作为直观的映射。我们期望从小型网络开始,并以这种方式改变视角,我们将能够发现一致性模式,从而增强对网络分析的扩展。获得关于网络中不断发展的相关关系的信息对于从分析的角度理解这些关系是至关重要的。为了检索网络上的相关性,可以检查哪些相关性可以先验地强加给系统作为一个整体,以便结果具有相同的相关性。第二,我们提出了一种结合博弈论和统计物理的方法,从游戏中更新规则引入的潜在相关性和玩家在使系统达到平衡时的选择的角度来研究网络游戏中获得的均衡。将这些关联转换为Isingmodel既证明了模拟平衡是如何关联的,又揭示了结果的有趣的突现性质。因此,我们的方法能够考虑到网络结构和共享信息的特殊性。在秒内。III我们用Broere等人[5]的方法模拟了包含TheXExes之战的两种类型的网络。我们用伊辛模型表达了初步结果,并表明收敛后的总磁化强度支持潜在关联的存在。在秒内。给出了在存在相关关系的情况下,即两人性别之争和纯协调博弈的均衡评估方法。我们将均衡前后的相关关系转化为Ising模型,研究Ising模型的参数在参与者行为的影响下是如何进行正则化的。在秒内。我们将我们的分析扩展到三人网络,其中一个玩家比其他两个玩家有更好的选择。我们将几种重整化方案应用于初始关联。然后,我们比较了在某种重整化方案下关联表示平衡的双能网络。为了进行比较,我们使用了一个广义Isingmodel的参数,并做了一些对称性假设。在秒内。讨论了一些结果,如所有网络所共有的渐近行为的出现,以及一些限制和可能的未来方向。我们在第七节中总结这项工作并概述其预期影响。

报纸
mingdashike22 在职认证  发表于 2022-4-16 11:33:59
非对称博弈和ISING模型在本节中,我们引入纳什均衡作为博弈的解,其中博弈者独立于他人,应用斜率分析作为计算它们的方法。我们对有相关性和无相关性的博弈进行了探讨,并展示了如何用ISINGModel来解释结果的概率。无关联博弈在博弈论中的标准假设是游戏者彼此独立,意味着他们不能直接交流。因此,实现收敛到最优状态的一个关键挑战是,玩家获得的Payo值不仅取决于他们个人的选择,还取决于他们对手的选择。一个可能的解决方案是在Payo上安装一个稳定点。如果每个玩家选择策略,如果他们改变策略,他们的个人Payo值不会增加,就会发生这种情况。一旦每个玩家都采取了这样的策略,我们就得到了纳什均衡[11]。有两种策略可以成为纳什基利布里亚:纯策略,当玩家选择以等于1的概率移动时发生;混合策略,当玩家以0到1之间的一定概率移动时发生,这使得他们对对手的选择不感兴趣。因此,Purestrategies是MixedStrategies的特殊和极端情况。斜率分析通过这个标志,纳什均衡可以被认为是参与者的Payo函数上的极值点,考虑变量是采取可用行动的概率。当每个玩家i的Payo值不提高时,当每个玩家的Payo值不提高时,就达到了纳什均衡。这可能有两个原因:要么Payo函数在这个概率值附近下降,要么它已经在概率区间[0,1]的极限,因此不能再改变了。基于这种观点,Correia和Stoof[27]引入了Payo函数斜率的分析,作为计算所有纳什均衡的直接方法。一般的想法是,一个玩家的payo函数的斜率,即orcoe和cient,与该玩家选择特定动作的概率pi相关联,已经有了计算均衡的所有必要信息。一方面,斜率的符号表示平衡的类型,负斜率或正斜率表示平衡将是纯的,因为概率分别被截断在0和1,零值斜率表示平衡将是混合的。另一方面,一个coe依赖于对手采取行动的概率,这些行动的概率具有与他们自己的coe一致的纯值或混合值。当所有这些条件一致并同时求值时,结果精确地为纳什均衡,用这种方法得到的概率是相互依赖的。例如,在一个游戏中,有两个玩家i=1,2玩μ,μ∈C,D},玩家1玩C的概率和玩家2玩C的概率的乘积,这是由于纳什均衡可以是次优解或极难达到的独立性,所以玩家1玩C的概率是(μ,μ)=(C,C)的概率是(μ,μ)=(C,C)的概率是(μ,μ)=(C,C)的概率。在描述许多社会、经济、政治和生物现象的对称博弈中,每个人都有合作或背叛的相同动机。然而,理想的结果仍然可以是在没有交流的情况下实现的。对于雪堆博弈,纳什均衡要求相同的博弈者采取不同的行动,而对于囚徒困境博弈,博弈者选择一个非最优的纳什均衡。其他现象更好地用非对称博弈来模拟,如性别之战[28],在这种博弈中,玩家的欺骗偏好也使得纳什均衡难以达到。

地板
kedemingshi 在职认证  发表于 2022-4-16 11:34:05
性别之战BoS游戏是一个两人游戏(表Ia),玩家们认为它可以通过邪教来达成均衡,因为他们有不同的个人驱动力。一个例子说明了促使这种设置的情况,涉及一个会议上的两个同事,他们希望在一个平行会议上一起参加两个会谈中的一个。令他们恼火的是,他们不能互相联系,他们的电话也不能正常工作。一位同事更喜欢参加C晶体光谱的讲座,而另一位则更喜欢听D-膜的讲座。虽然双方都有动机去参加相同的谈话,但他们的欺诈偏好不允许他们在没有沟通的情况下就谁达成一致。在同一个选项上进行协调,双方要么选择C要么选择D,形成了两个纯策略的Nashequilibria,使其成为一个协调游戏。另外,该博弈具有混合策略纳什均衡,其中玩家1以概率pc=1/(1+s)和pd=1-pc分别玩C或D,玩家2以概率pc=pd和pd=pc玩C orD。虽然玩家原则上可以同意这个策略,但它导致每个玩家的Payo极限为s/(1+s),低于任何玩家在纯均衡下的最坏可能结果,即s。在网络上,连接DC(1,s)(0,0)D(0,0)(s,1)(a)BoS博弈。c DC(1,1)(0,0)D(0,0)(s,s)(b)PC博弈,偏好c.c DC(s,s)(0,0)D(0,0)(1,1)(c)PC博弈,偏好D。表I:在网络结构中出现的三个两人博弈的Payo表,带有s∈[0,1]。相同的玩家将玩一个额外的对称协调博弈,即纯协调(PC)博弈,根据他们的偏好,在表Ib或表Ic中给出Payo表。这些博弈与BoS博弈具有相同的纯纳什均衡和混合纳什均衡,但协调它们的偏好是实现1.b的最高可能支付的唯一理性选择。游戏中的相关性和两个玩家的Ising模型游戏可以用相关性进行扩展。在游戏理论中引入了相关关系来形式化玩家之间交流的可能性。这是通过引入一个概率分布Pμ,μ,它描述了玩家的最终联合结果[29]。为了对游戏结果的统计进行建模,我们研究了一维伊辛模型,描述了相互作用粒子之间的磁相互作用。作用C和D被映射到自旋为1/2的粒子的自旋态“向上”和“向下”,这样μi∈{-1,1}。粒子可以耦合到外部磁性Bi,具体到每个粒子。此外,它们相互作用的强度由对称相互作用强度J决定。两个粒子在一定状态下结合的概率由玻尔兹曼分布Pμ,μ=ze-hμ,μ,(1)给出,其中hμμIsing哈密顿量,hμ,μ=-jμμ-bμ-bμ,(2)和Z是配分函数,Z=xμ,μe-hμμ。(3)由于原博弈的Nash均衡产生不相关的联合概率,将其转化为Ising模型只需要单独的磁偏差参数,如Pi(R)i=Ebi(R)izi,(4)单独的配分函数Zi=P(R)ieBi(R)i,在这种情况下不需要交互强度,它传达了博弈者行为的独立性。在这种不相关的情况下,其中J=0,连接概率分布因此等于单个自旋在该状态下的概率的乘积,Pμ,μ=PμPμ.不相关景观在情商中的状态概率。2等于从Payo表Ia中得到的不相关(一次性)混合策略的概率,如果参数以以下方式相关b=lnrs,(5)和b=-lnrs。

7
大多数88 在职认证  发表于 2022-4-16 11:34:12
(6)例如,假设S=S=1/2,这种情况下的mixedstrategy解是玩家1玩D的三分之二次,C玩三分之一次,玩家2玩D的三分之二次,Cone玩三分之一次。因此,两种策略组合的概率分别为(C,C)为2/9,(C,D)为4/9,(D,C)为1/9,(D,D)为2/9。例如,处于(1,1)自旋态的概率,现在也可以用等式计算。(1),当参数J=0和b=-b=ln√2时,得到p1,1=2/9。菲林金情商。(1)对于具有相同参数的其他状态,如指定的:p1,-1=4/9,P-1,1=1/9和P-1,-1=2/9。正是在绕过这种独立性的情况下,游戏的模拟能够在结果上达到更好的收敛,因为更新策略引入了非零的相互作用强度J[30]。模拟中的相关性在本节中,我们使用Ising模型来计算由相互作用的二元变量组成的小型网络的解析表达式,其中我们改变相互作用coe-cientj以表示网络游戏的重复相互作用。通过对Ising模型的进一步推广,可以将其参数化来表示环图性别之战的非对称情况。然后利用计算方法和伊辛模型研究了小网络的平衡行为。具有节点依赖磁性的伊辛模型性别之战是一个不对称的游戏,这意味着相同的选择组合可以为玩家提供不同的支付方式。因此,我们需要对玩家在游戏中的偏好进行分析。我们可以通过允许系统变量在粒子之间变化来做到这一点。考虑一个具有N个结点的一维环图G。每个节点i与具有周期性边界条件的直线上的两个邻居相互作用,例如μn+1=μ.对于一定的自旋常数{μi},系统的总能量可以满足以下条件:{μi}=-nxi=1Jμiμi+1-nxi=1biμi,(7),其中为了简单起见,我们假设所有节点之间的J是相同的,但由于它们的偏好不同,在i中Bican具有di值。某一网络通电的概率isp{μi}=E-H{μi}Zn。(8)配分函数ZNis,通过对总的可能自旋常数求和得到:Zn=x{μi}exp(Nxi=1jμiμi+1+biμi+bi+1μi+1μi+1=x{μi}nyi=1tμi,μi+1,(9)转移矩阵的元素asT=t1,1t1,1t-1,1t-1,1t-1,-1。(11)转移矩阵表示μi+1和μi+1所有可能状态的Boltzmann权重。如前所述,当性别之战在网络相互作用结构上进行时,可以发生三种类型的相互作用,从而获得表I中的三种Payo结构。因为所有三种情况都需要适应,所以我们需要构造三个di-erenttransfer矩阵。我们将方程(11)中的转移矩阵定义为相反偏好的相互作用。对于一种类型具有相同偏好的交互,我们定义为~t=~t1,1~t1,-1~t-1,1-t-1,-1(12),对于另一种类型,定义为t=t1,1t1,-1t-1,1t-1,-1。(13)配分函数现在可以被写为di-erent转移矩阵T、~T和T的n次方迹的乘积。示意性地,Z=tR[tn~t~n t n],(14)其中n指具有转移矩阵的链路数目xt,~n指具有转移矩阵的链路数目~t,n指具有转移矩阵的链路数目t,n指具有转移矩阵的链路数目t,the链路数目在等式中是n+~n+n=n。(14)我们没有明确地表示这些变换矩阵的变化顺序,而只表示总数。然而,每个传输矩阵表示节点之间的一个链路,因此传输矩阵的顺序依赖于网络中不同类型节点的排序,因为传输矩阵不是交换的,所以排序是很重要的。

8
mingdashike22 在职认证  发表于 2022-4-16 11:34:18
在下一节中,我们描述了与转移矩阵的不同顺序相对应的节点的不同顺序。网络的磁化强度为Bymi=Bilnz,(15),而每个自旋的总磁化强度为M=Nximi。(16)请注意,由EQS中的关系给出的磁性参数和Payo参数之间的关系。(5)和(6)在所有转移矩阵中,对应于BoS对策的不相关解,而不对应于PC对策的不相关解。(12)和(13)应该由他们各自的PC游戏的混合策略解决方案给出。然而,这将在节点中引入Acon Curitic,这些节点既参与BoS游戏,也参与PC游戏。因此,我们对任一网络的所有节点使用磁图作为方程。(5)和(6),预计在存在aPC博弈的情况下,这些磁图值只有在J6=0.b时才可能存在。本文将Ising模型的计算结果与图2所示的两个双端环网的计算结果进行了比较。1,说明了αβαβαβαβαβαβαβ网络1αααβββαβαβ网络2fig。1:n=10的环网络。颜色代表偏好,绿色节点(α)偏好C平衡,红色节点(β)偏好Dequilibrium。注意,在网络1中,每个边都只玩BoS游戏。偏好的分布,绿色节点表示对C的偏好,红色节点表示对D的偏好。1a表示一个完全集成的网络,其中节点仅与具有特定偏好的节点进行交互。1b表示一个独立的网络,其中一些节点同时参与一个PC和一个BoS博弈。为了模拟每个网络的博弈均衡,我们重点讨论了Broere等人[5]描述的计算模型。在本研究中,节点与邻居进行迭代的2×2游戏。每个节点在游戏的第1轮(C或D)之前获得一个PreferenceAsSignd,该PreferenceAsSignd,该PreferenceAsSignd,该PreferenceAsSignd,该PreferenceAsSignd,该PreferenceAsSignd,该PreferenceAsSignd,该PreferenceAsSignd,用于从表I中对应的游戏中在figurrstround中,节点以概率1发挥其首选行为。在每一轮之后,节点通过增强学习更新他们玩C或D的概率[31,32]。采用最佳响应策略来更新选择Cor或D的概率,以确定在以前的情况下最佳选择是什么。我们根据EQ计算出双端面网络的平均磁化强度,作为磁化值的函数。(16)。在每一个网络中,我们得到了三个J值,即0,0.5和1的结果,它们是变率的代表值。因为我们想将此与模拟中的平衡控制的统计数据进行比较,在图。2平均磁化率是作为磁性值的函数绘制的,但x和y轴以sand s为单位缩放,遵循EQs。分别是(5)和(6)。在z轴上,每个自旋的平均磁化被缩放为选择C的概率,这样平均磁化为-1意味着玩C的概率为0,平均磁化为1意味着相同的概率为1。这三个图是伊辛模型的结果,J=0的结果是第二个,J=0.5的结果是第三个,J=1的结果是最右边的图是迭代博弈论模型的模拟结果。当J=0时,结果与整个网络的不相关混合平衡解相等。我们注意到,即使在分辨率更高和模拟次数更多的情况下,模拟结果也要噪声得多。总的来说,模拟的趋势与伊辛模型的趋势相当,其中模拟结果似乎与伊辛模型的结果基本一致,J=1。

9
大多数88 在职认证  发表于 2022-4-16 11:34:24
这表明网络上的行为有很高的相关性,正如所期望的那样,网络2比网络1更有相关性。然而,我们预计Network1会出现一个明显的趋势,但实际上并非如此。虽然模拟证明了均衡状态下的参与者之间存在着更新策略所引入的相关关系,但它们也表明需要一个更详细的分析模型来解释这些关系是如何随着参与者的决策而演变的。我们如何开始思考一个考虑到这一点的广义伊辛模型将是接下来两节的主题二人博弈的反应策略在本节中,我们在二人博弈中引入相关性,并说明如何通过重新正化潜在的相关性,使一个系统进入平衡状态。通过将这些关系映射到伊辛模型,我们绘制出玩家可以朝着这个目标采取哪些行动,给出了他们最初的不平衡相关关系相关均衡评价是否处于均衡,在情商中的相关概率分布。(1)采用相关装置。这个概念是Byaumman[29]引入的,作为一种具体的方式来描述每个玩家如何只接收关于entirecorrelations景观的部分信息,保持对边缘的盲视0.00.0.2 0.4 0.6 0.8 1.00.00.20.40.60.81.00.0.2 0.4 0.6 0.8 1.00.00.20.20.40.81.00.0.2 0.4 0.6 0.8 1.00.00.20.20.40.60.81.00.0.2 0.4 0.6 0.8 1.00.00.20.0.80.81.00.10.20.30.50.60.80.81.00.10.20.30.40.50.60.70.80.9(a)网络10.0.0.2 0.4 0.6 0.8 1.00.00.20.40.60.81.00.0.0.2 0.4 0.6 0.8 1.00.00.20.40.60.81.00.10.20.30.40.50.60.70.80.9(b)网络2图2:选择C的概率,其中x轴代表Bin项的值,y轴代表s的Bin项的值,根据EQS。(5)和(6)。左边是J=0的标绘值,第二个图中是J=0.5的标绘值,第三个图中是J=1的标绘值,右边是对手的模拟结果。该设备从概率分布中提取一个规则,并通知每个玩家他们应该玩什么,以便系统达到该全局规则。当参与者在收到建议后,没有任何动机选择除建议外的任何策略,同时假设对手没有偏离他们自己收到的指示时,就达到了一个相关均衡,即纳什均衡。如果其中一个玩家偏离了建议,那么相关平衡不是一个可行的解决方案。在这种情况下,如果参与者放弃相关性而求助于不相关的纳什均衡,那么稳定性就得到了实现。相关性在进化博弈理论中很早就被使用了[33],但是,尽管有一些例外[34],据我们所知,它们还没有成为一种标准工具。这可能部分是由于相关平衡的刚性。这种对均衡的认识,虽然假定系统中存在潜在的相关关系,但没有考虑到这样一个事实,即参与者对一个最初的不均衡概率分布的行动,如果足够精确,可以使网络达到一个处于相关均衡的控制。事实上,这就是在具有最佳反应策略的迭代游戏中所发生的情况,因为玩家的行为将网络从一个out-ofequilibrium状态带到了一个玩家不再通过改变策略而受益的状态。响应概率Escorreia和Stoof[27]引入了一个框架来精确计算在这种环境下玩家如何行动以实现不平衡。引入初始相关器件和重整相关器件,分别为pμ、μ、prμ、μ,a播放器i概率地遵循初始器件的指令μigiven。

10
何人来此 在职认证  发表于 2022-4-16 11:34:30
因此,策略不再是由原始游戏动作上的概率分布组成,而是由按照建议玩和不按照建议玩的动作上的分布,分别由概率PFμi、PNFμi=1-PFμi给出,形成响应策略,其中下标F和nf限定概率,指示它们是遵循或不遵循相关装置的建议的概率。因此,改变策略的概率根据响应策略ASPI(R)I(R)(R)I=δμI(R)IPIF(R)I+(1-δμI(R)I)PiNF(R)I来计算。(17)abcfkdijklgh0.00.20.40.60.81.0pcc0.20.40.60.81.0pdd(a)123450.00.0.0.40.60.81.0pcc0.20.40.60.81.0pdd(b)fig3:对称相关平面的刻划。(a)对应于响应策略的特定组合的初始相关平面中的区域,这些策略是两人博弈的均衡解,对于s=1/2。相关装置的行列式在曲线上方为正。(b)在均衡状态下的特定响应策略给出的Payo值高于BoS博弈中的s=1/2的区域。在区域1中,(1,1,0,0)和(0,0,1,1)都是均衡,对两个参与者都是同样好的解。在区域2中,(0,0,1,1)是最佳解,在区域3中,(1,1,0,0)是最佳解。在区域4和5中,两个策略(0,0,0)和(1,1,1,1)都是均衡,但在区域4中,玩家1偏好策略(1,1,1,1),而玩家2偏好策略(0,0,0),与区域5相比,在区域5中玩家的偏好是相反的。初始相关装置不需要是不相关的均衡,因为这些新策略中的一系列其他均衡是可能的。通过玩家对初始器件的反应,可以得到一个E-能重构的器件,其值为prμμ=xμμPμμPμμPμμ。(18)如果一个玩家的行为是按照这个重整化的设备给出的玩μi的建议进行的,那么就达到了一个相关的平衡。这就定义了一个新的博弈,关联博弈。玩家i的预期Payo,computedashuii=x-ixμiTM-iuTMiTM-iprTMiTM-i,(19),其中,-i表示玩家i的所有对手,按照通常的博弈论惯例,对于两个玩家来说,i=1和-i=2。为了达到相关均衡,Payo值必须是这样的,即它不会随着玩家遵循新指令的概率的单方面变化而增加。服从这一准则的响应策略就是相关博弈的解。参与者仍然是独立的,因为他们只对外部相关性做出反应,这意味着反应策略解也是纳什均衡。因此,这里我们也可以使用斜率分析,但现在变量是跟随和不跟随的响应概率,并且Payo函数也依赖于初始相关性,如athuii=CiCPiF c+CiDPiF d+Ci,(20)与Ci,玩家i的Payo斜率与变量PiFμi和Cia常数相关联。请注意,secoe cients依赖于玩家i与邻居的交互类型和数量。我们将此方法应用于BoS和PC游戏,使用s=s=1/2,就像在环网模拟中一样,为了简单起见,我们从现在开始重命名sas s。我们研究了相关空间的对称截面spcd=pdc=(1-pcc-pdd),(21),它允许与以前关于对称对策的工作进行比较。然而,从这些方面来看,在BoS游戏中,玩家和他们的策略是不可互换的。因此,我们对一个完整的响应概率集(PF C,PF D,PF C,PF D)进行aslope分析。首先,我们计算了哪些初始相关关系构成了玩家1的斜率条件,给出了玩家2的策略,然后与玩家相反进行了相同的计算。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-17 23:36