|
将引理2、3和4结合起来,以证明论文的主要结果(定理2),即一般信号博弈中基于学习的环境。1.2结果概述第2节列出了我们将用于信号游戏的符号,并介绍了我们的学习模型。第3节介绍了Gittins指数,我们用它来分析发送者的学习问题。它还定义了类型兼容性,这是驱动我们结果的偏序。我们说θ型比θ型更能与信号类型兼容,如果θ对某些接收机行为策略的弱最佳响应是θ对相同策略的严格最佳响应。为了将这种静态定义与发送者的最优动态学习行为联系起来,我们证明,在我们的假设下,发送者的学习问题形式上是一个多臂Bandit问题,因此每种类型的最优策略都以Gittins指数为特征。定理1表明,类型上的兼容性顺序等价于其Gittins指数上的顺序:θ是与信号兼容的类型,而不是类型θ当且仅当当θ是(弱)最高的Gittins指数时,如果这两种类型持有相同的信念并具有相同的贴现因子,则它具有严格最高的θ指数。第4节研究发送者和接收者群体的聚合行为。我们定义并描述了发送方和接收方的总体响应,这是对一次性信号博弈中最佳响应函数的分析。首先,我们使用耦合参数将定理1扩展到聚合发送方行为,证明与信号更兼容的类型在聚合中发送信号的频率更高(引理2)。然后我们转向接收机。直觉上,我们预计当接收者是长寿的时候,他们中的大多数人都会有尊重类型兼容性的信念,我们证明了这一点。
|