人大经济论坛 › 论坛 › 经济学人二区 › 外文文献专区 › Berk-Nash均衡：一个具有错误指定的代理建模框架

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 3 4 5 6 7 8 下一页

发帖

楼主: 大多数88

1300 71

[量化金融] Berk-Nash均衡：一个具有错误指定的代理建模框架 [推广有奖]

0关注
3粉丝

会员

学术权威

68%

还不是VIP/贵宾

威望: 10 级
论坛币: 10 个
通用积分: 63.9303
学术水平: 0 点
热心指数: 4 点
信用等级: 0 点
经验: 23514 点
帖子: 3880
精华: 0
在线时间: 0 小时
注册时间: 2022-2-24
最后登录: 2022-4-15

楼主

大多数88

发表于 2022-5-7 02:58:52 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

英文标题：
《Berk-Nash Equilibrium: A Framework for Modeling Agents with Misspecified
Models》
---
作者：
Ignacio Esponda and Demian Pouzo
---
最新提交年份：
2019
---
英文摘要：
We develop an equilibrium framework that relaxes the standard assumption that people have a correctly-specified view of their environment. Each player is characterized by a (possibly misspecified) subjective model, which describes the set of feasible beliefs over payoff-relevant consequences as a function of actions. We introduce the notion of a Berk-Nash equilibrium: Each player follows a strategy that is optimal given her belief, and her belief is restricted to be the best fit among the set of beliefs she considers possible. The notion of best fit is formalized in terms of minimizing the Kullback-Leibler divergence, which is endogenous and depends on the equilibrium strategy profile. Standard solution concepts such as Nash equilibrium and self-confirming equilibrium constitute special cases where players have correctly-specified models. We provide a learning foundation for Berk-Nash equilibrium by extending and combining results from the statistics literature on misspecified learning and the economics literature on learning in games.
---
中文摘要：
我们开发了一个平衡框架，放松了人们对环境有正确特定看法的标准假设。每个参与者都有一个（可能是错误指定的）主观模型，该模型描述了作为行为函数的与回报相关的结果的一组可行信念。我们引入了伯克-纳什均衡的概念：每个参与者都遵循一个给定其信念的最优策略，并且她的信念被限制为她认为可能的信念集合中的最佳匹配。最佳拟合的概念形式化为最小化Kullback-Leibler发散，这是内生的，取决于均衡策略。标准解的概念，如纳什均衡和自我确认均衡，构成了特殊情况下，玩家有正确指定的模型。我们通过扩展和结合关于错误指定学习的统计文献和关于博弈学习的经济学文献的结果，为伯克-纳什均衡提供了学习基础。
---
分类信息：

一级分类：Quantitative Finance 数量金融学
二级分类：Economics 经济学
分类描述：q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学，包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类：Computer Science 计算机科学
二级分类：Computer Science and Game Theory 计算机科学与博弈论
分类描述：Covers all theoretical and applied aspects at the intersection of computer science and game theory, including work in mechanism design, learning in games (which may overlap with Learning), foundations of agent modeling in games (which may overlap with Multiagent systems), coordination, specification and formal methods for non-cooperative computational environments. The area also deals with applications of game theory to areas such as electronic commerce.
涵盖计算机科学和博弈论交叉的所有理论和应用方面，包括机制设计的工作，游戏中的学习（可能与学习重叠），游戏中的agent建模的基础（可能与多agent系统重叠），非合作计算环境的协调、规范和形式化方法。该领域还涉及博弈论在电子商务等领域的应用。
--

---
PDF下载：
-->

Berk-Nash_Equilibrium:_A_Framework_for_Modeling_Agents_with_Misspecified_Models.pdf (1.07 MB)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Berk Ber Coordination Consequences Quantitative

相关帖子

使用道具举报

沙发

nandehutu2022

发表于 2022-5-7 02:58:58 |只看作者 |坛友微信交流群

伯克-纳什均衡：一个用错误模型对代理人建模的框架*Ignacio Esponda Demian Pouzo（WUSTL）（加州大学伯克利分校）2019年11月22日摘要我们开发了一个平衡框架，放松了人们对环境有正确特定看法的标准假设。每一个玩家都有一个（可能是误判的）主观模型，该模型描述了作为行动函数的与支付相关的后果的一组可行信念。我们引入了伯克-纳什均衡的概念：每个参与者都遵循一个策略，该策略在给定其信念的情况下是最优的，并且她的信念被限制为她认为可能的一组信念中的最佳。最佳函数的概念形式化为最小化Kullback-Leibler发散，这是内在的，取决于均衡策略。如纳什均衡和纳什均衡等标准均衡。我们通过扩展和结合关于特定错误学习的统计文献和关于游戏学习的经济学文献的结果，为伯克-纳什均衡提供了学习基础。*我们感谢弗拉基米尔·阿斯里扬、皮耶保洛·巴蒂加利、拉里·布鲁姆、亚伦·博多·克里德、西尔瓦恩卡桑、埃米利奥·埃斯皮诺、埃里克·埃斯特、德鲁·福登伯格、尤里·戈罗德尼琴科、斯蒂芬·劳尔曼、娜塔莉亚·拉扎蒂、克里斯托夫·马达雷斯、马修·拉宾、阿里尔·鲁宾斯坦、乔尔·索贝尔、约尔格·斯托耶、几位研讨会参与者，尤其是一位联合编辑和四位匿名裁判，感谢他们提供了非常有益的评论。Esponda：圣路易斯华盛顿大学奥林商学院，布鲁金斯大道1号，圣路易斯大学1133校区信箱。

使用道具举报

藤椅

大多数88

发表于 2022-5-7 02:59:01 |只看作者 |坛友微信交流群

路易，密苏里州63130，iesponda@wustl.edu; 普佐：加州大学伯克利分校经济系，地址：加利福尼亚州伯克利市埃文斯厅530-1号，邮编：94720，dpouzo@econ.berkeley.edu.1引言大多数经济学家认识到，他们模型背后的简化假设往往是错误的。但是，尽管认识到模型可能存在误判，但标准方法（下文指出的例外情况除外）假设经济机构对其环境有正确的特定看法。我们提出了一个平衡框架，放松了这个标准假设，并允许建模者假设经济主体对自己的世界有主观的、可能不正确的看法。一个客观的游戏代表了代理（或玩家，在多个交互代理的情况下）所面临的真实环境。相关状态和私人观测到的信号来自客观概率分布。每个玩家观察herown的私人信号，然后玩家同时选择动作。行动和实现状态决定结果，结果决定回报。此外，每个参与者都有一个主观模型，代表自己对环境的看法。从形式上讲，主观模型是一组概率分布，这些概率分布是玩家自身行为和信息的函数。重要的是，我们允许一个或多个参与者的主观模型被误判，这意味着主观分布集不包括真实的客观分布。例如，消费者可能会认为非线性价格表是线性的，因此对平均价格而非边际价格做出反应。或者，交易者可能没有意识到贸易的价值在一定程度上取决于贸易条件。伯克-纳什均衡是一种策略，即对于每个参与者，其主观模型满足两个条件时，存在一个信念和支持。

使用道具举报

板凳

mingdashike22

发表于 2022-5-7 02:59:04 |只看作者 |坛友微信交流群

首先，考虑到信念，策略是最优的。其次，该信念将概率1置于主观分布的集合上，而不是与真实分布“最接近”的结果，其中真实分布由客观博弈和实际策略决定。“最近”的概念由加权版的库尔贝克-莱布勒散度（也称为相对熵）给出。伯克-纳什均衡包括一个共同框架中的标准和有界理性解概念，如纳什、自我确认（例如，巴蒂加利（1987）、福登伯格和莱文（1993a）、德克尔等人（2004））、完全诅咒（埃斯特和拉宾，2005）和基于类比的期望均衡（杰希尔（2005）、杰希尔和科斯勒（2008））。例如，假设游戏被正确指定（即，每个玩家的先验支持包含真实分布），并且游戏被强烈识别（即，存在唯一的分布，无论是否正确，都与观察到的数据相匹配）。然后伯克-纳什均衡等价于纳什均衡。如果放弃了强烈的认同假设，那么伯克-纳什就是一个自我确认的均衡。除了统一以前的工作之外，我们的框架还为扩展以前的案例和探索新类型的错误提供了一种系统的方法。我们通过研究一个由固定数量的玩家反复玩目标游戏的动态设置，为伯克-纳什均衡（以及使用库尔巴克莱布尔散度作为“距离”的度量）提供了基础。每个玩家都相信环境是静止的，并从一个优先于她的主观模型开始。在每个阶段，玩家根据观察到的结果，根据贝叶斯规则更新他们的信念。

使用道具举报

报纸

大多数88

发表于 2022-5-7 02:59:07 |只看作者 |坛友微信交流群

主要目的是描述当玩家表现最佳但使用可能错误的主观模型学习时的限制行为。主要结果是，如果玩家的行为收敛，那么它收敛到伯克纳什均衡。相反的结果表明，对于某些初始（非教条主义者）先验，我们可以收敛到博弈的任何伯克-纳什均衡，但这一结果并不成立。但是，我们放松了参与者精确优化的假设，从而获得了一个正的收敛结果。对于任何给定的Berk-Nash均衡，我们证明，如果代理近视并做出渐近最优选择（即，优化错误随时间消失），就会收敛到该均衡。长期以来，人们一直对研究持有错误世界观的代理人的行为感兴趣。例子来自不同的领域，包括工业组织、机制设计、信息经济学、宏观经济学、心理学和经济学（例如，阿罗和格林（1973）、基尔曼（1975）、索贝尔（1984）、卡格尔和莱文（1986）、尼亚尔科（1991）、萨金特（1999）、拉宾（2002）），尽管通常没有明确提到错误的学习。然而，大多数文献侧重于特定环境，在开发统一框架方面几乎没有进展。我们的处理方法既有“理性”的方法，也有“有限理性”的方法，因此强调，对不特定参与者的行为建模并不构成对标准框架的重大偏离。Arrow and Green（1973）提供了一种通用的处理方法，并区分了客观游戏和主观游戏。

使用道具举报

地板

何人来此

发表于 2022-5-7 02:59:10 |只看作者 |坛友微信交流群

不过，他们的框架比我们的框架在允许玩家出现的错误类型方面更具限制性。在多个代理的情况下，环境不需要是静止的，因此我们忽略了重复的游戏考虑，玩家会考虑他们的行为如何影响其他人的未来游戏。在第5节中，我们讨论了对具有连续代理的种群模型的扩展。此外，它们不能建立存在或为平衡提供学习基础。最近，Spiegler（2014）引入了一个框架，该框架使用贝叶斯网络在不完全理解相关结构的情况下分析决策。我们的论文还与bandit（如Rothschild（1974）、McLennan（1984）、Easley和Kiefer（1988））和自我确认平衡（SCE）文献有关，这些文献强调，如果实验成本高昂，代理人可能会以错误的信念告终。我们也允许由于反馈不足而导致信念错误，但我们的主要贡献是允许错误的学习。当玩家有错误的模型时，信念可能是不正确的，并且内在地依赖于自己的行为，即使有持续的实验；因此，需要一个平衡框架来描述日常状态行为，即使是在单代理环境中。从技术角度来看，我们扩展并结合了两篇文献的结果。首先，均衡是学习过程的结果这一观点来源于有关游戏学习的文献。

使用道具举报

7楼

nandehutu2022

发表于 2022-5-7 02:59:14 |只看作者 |坛友微信交流群

这篇文献研究明确的学习模型来证明NASH和SCE（例如，福登伯格和克雷普斯（1988）、福登伯格和克雷普斯（1993）、福登伯格和克雷普斯（1995）、福登伯格和莱文（1993b）、卡莱和莱勒（1993））。我们通过允许玩家学习即使在稳定状态下也被错误定义的世界模型来扩展这些文献。其次，我们依赖并贡献了研究贝叶斯后验概率极限行为的文献。该文献的结果已应用于具有正确指定代理的决策问题（例如，Easley和Kiefer，1988）。特别是，鞅收敛定理的应用意味着信念几乎肯定会在主体的主观先验下收敛。然而，如果我不支持正确的分布，那么根据她的先验分布，我就不支持正确的分布。因此，我们采取了不同的方法，并遵循了有关误读学习的统计文献。

使用道具举报

8楼

可人4

发表于 2022-5-7 02:59:18 |只看作者 |坛友微信交流群

这篇文献描述了库尔贝克-莱布尔迪维森斯（Kullback-Leiblerdivergence，1966）、邦克（Bunke）和米尔豪德（Milhaud，1998））的限制性信念。我们对统计数据进行了扩展。一些解释解释了为什么玩家可能会有错误的模型，包括使用启发式（Tversky和Kahneman，1973年）、复杂性（Aragones等人，2005年）、避免过度填充数据的愿望（al-Najjar（2009年）、al-Najjar和Pai（2013年））以及昂贵的关注（Schwartzstein，2009年）。在宏观经济学文献中，SCE一词有时在更广泛的意义上被用来包括代理人模型有误的情况（例如，Sargent，1999）。SCE的两个扩展也可能适用：基于内省的信念限制（如Rubinstein和Wolinsky，1994年）和模糊厌恶（Battigalli等人，2012年）。参见Fudenberg和Levine（1998年、2009年）对该文献的调查。White（1982）指出，Kullback-Leibler分歧也表征了关于特定学习的限制性行为文献，即代理人不仅被动地学习环境，而且通过采取行动积极地学习。我们在第2节介绍了框架和示例，在第3节讨论了与其他解决方案概念的关系，并在第4节提供了学习基础。我们将在第5.2节框架2中讨论假设和扩展。1环境（同时移动）博弈G=<O，Q>由（同时移动）客观博弈O和主观模型Q.客观博弈组成。

使用道具举报

9楼

大多数88

发表于 2022-5-7 02:59:21 |只看作者 |坛友微信交流群

（同时移动）目标游戏是tupleO=hI，Ohm, S、 p，X，Y，f，πi，其中：i是参与者的集合；Ohm 是支付相关状态的集合；S=×i∈ISI是一组信号，其中Si是玩家i的信号集；p是一个概率分布Ohm 为了简单起见，假设它具有完全支持的边缘；我们使用标准符号来表示边际分布和条件分布，例如pOhm|Si（·| Si）表示上的条件分布Ohm 给定Si=Si；X=×i∈IXII是一组动作，其中XII是玩家i的动作集；Y=×i∈iyis是一组（可观察到的）后果，其中yi是参与者i的一组后果；f=（fi）i∈Iis是反馈或结果函数的文件，其中fi:X×Ohm → 依林Ohm 将X转化为玩家i的后果；π=（πi）i∈一、式中πI：Xi×Yi→ R是参与者i的支付函数。为了简单起见，我们证明了上述所有集合都是有限的情况下的结果。目标游戏的时间安排如下：首先，根据p绘制一个状态和一个信号文件。其次，每个玩家私下观察自己的信号。第三，玩家同时选择动作。最后，每个玩家都会观察自己的结果并获得回报。我们隐含地假设参与者至少观察到最大拟似然估计。反馈函数的概念来自SCE文献。此外，虽然πidepend依赖于xi很重要，但它简化了应用中的符号。在工作文件版本（Esponda和Pouzo，2014年）中，我们提供了技术条件，其结果延伸至非最终结果Ohm 玩家i的策略是映射σi:Si→ （十一）。玩家在观察信号si后选择动作Xia的概率用σi（xi | si）表示。

使用道具举报

10楼

mingdashike22

发表于 2022-5-7 02:59:26 |只看作者 |坛友微信交流群

战略规划是战略向量σ=（σi）i∈我设∑表示所有战略文件的空间。修正一个客观的游戏。对于每个策略文件σ，参与者i的结果有一个客观分布，Qiσ：Si×Xi→ （Yi），其中qiσ（Yi | si，xi）=X{（ω，X）-i）：fi（xi，x）-i、 ω）=yi}Xs-iYj6=iσj（xj | sj）pOhm×S-i | Si（ω，s）-i | si），（1）代表所有人（si，xi，yi）∈ Si×Xi×Yi。目标分布代表后果的真实分布，取决于玩家自己的行动和信号，考虑到玩家遵循的目标游戏和策略文件。主观模型。主观模型代表了参与者认为可能的先验结果的一组分布。对于固定的客观博弈，主观模型是tupleQ=hΘ，（Qθ）θ∈Θi，其中Θ=×i∈IΘiandΘiis player I的参数集；Qθ=（Qiθi）i∈一、式中QiθI:Si×Xi→ （Yi）是由θi参数化的游戏者i的结果的条件分布∈ Θi；我们用Qθi（·si，xi）表示条件分布。虽然客观游戏代表真实的环境，但主观模型代表玩家对环境的感知。客观模型和主观模型之间的这种分离在本文中至关重要。备注1。主观模型的一个特例是，每个参与者都了解正在进行的客观博弈，但不确定状态分布、结果函数，以及（在多个参与者的情况下）其他参与者的策略。在这种特殊情况下，游戏者i关于p，fi和σ的不确定性-可以用参数模型pθi，fiθi，σ来描述-iθi，其中θi∈ Θi。

使用道具举报

返回列表

12 3 4 5 6 7 8 下一页

发帖

本版微信群

加JingGuanBbs
拉您进交流群

手机版 |

意见反馈 |

帮助 |

新手入门 |

用户手册 |

友情链接 |

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[量化金融] Berk-Nash均衡：一个具有错误指定的代理建模框架 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群