楼主: 能者818
1287 66

[量化金融] 信号游戏中的学习和类型兼容性 [推广有奖]

61
nandehutu2022 在职认证  发表于 2022-5-31 03:45:38
从信号s的经验频率π(k)(·|θ)得出*π(k)(s)的差值*|θ) 超过2. 同样,writeZθ,kt∈ {0,1}表示第t次绘制是否导致信号s*, 对于EhZθ,kti=π(k)(s*|θ) ,并输入Sn,k:=Pbnλ(θ)ct=1Zθ,kt表示s的总数*超出jnλ(θ)kdraws。我们有E[Sn,k]=jnλ(θ)k·π(k)(s*|θ) ,但是π(k)(s)*|θ)- π*(s)*|θ)<  每当k≥ K、 也就是说,ebias,kn,θ:=PSn,kjnλ(θ)k- π*(s)*|θ)≥ 2.≤PSn,kjnλ(θ)k- π(k)(s)*|θ)≥ 如果k≥ K=P|序号,k- E[锡,钾]|≥nλ(θ)· ≤2经验值-2·(jnλ(θ)k·)jnλ(θ)k霍夫丁的不平等。设Nbiasθ:=P∞n=12 exp-2·(bnλ(θ)c·)bnλ(θ)c, Nbiasθ<∞ 因为总和以与经验相同的速率趋于0(-n) 。这个论点表明,每当k≥ K、 我们有∞n=1偏差,kn,θ≤Nbiasθ。现在让Nbias:=Pθ∈ΘNbiasθ。最后,由于g是正则的,我们引用Fudenberg、He和Imhof(2017)的命题1,以发现存在一些N,因此每当接收器具有大小为N的数据集时≥ N关于θ型的发挥,他的贝叶斯后验概率是θ发挥s的概率*与经验分布的差异不超过. Put Nage:=2Nminθ∈Θλ(θ)。考虑带k的任何稳态ψ(k)≥ K、 概率不小于1-Pθ∈Θebias,kn,θ,一个年龄n的接受者,在每个θ中至少看到了nλ(θ)个θ类型的实例∈ Θ将具有经验分布,以便每种类型的播放概率*与π的差异*(s)*|θ) 作者:lessthan 2. 此外,如果n≥ Nage,则实际上nλ(θ)≥ N表示每个θ,因此相同的概率界适用于接收器在每种θ播放时的贝叶斯后验概率*iscloser小于3 至π*(s)*|θ) 。

62
mingdashike22 在职认证  发表于 2022-5-31 03:45:41
通过建造, 播放*s之后*是对这样一个后路唯一最好的回应。因此,对于k≥ K、 发送方群体执行除*s之后*inψ(k)以nage(1)为界- γk)+(1- γ(k)·∞Xn=0γnk·Xθ∈Θeobsn,θ+ebias,kn,θ.为了解释这个表达式,年龄大于或小于Nage的接收者不超过Nage(1-γk)。在n龄受试者中,不超过pθ∈对于任何类型的θ,θ分数的样本大小小于nλ(θ),而θθ∈Θebias,kn,θ是有足够大样本的有偏样本概率的上界,因此某个类型的经验播放频率*差异超过2 自π*(s)*|θ) 。但由于γk∈ [0,1),∞Xn=0γnk·Xθ∈Θeobsn,θ<∞Xn=0Xθ∈Θeobsn,θ≤ Nobsand公司∞Xn=0γnk·Xθ∈Θebias,kn,θ<∞Xn=0Xθ∈Θebias,kn,θ≤ Nbias。我们得出结论,每当k≥ K、 π(K)(a)*|s*) ≥ 1.- (1)- γk)·(Nage+Nobs+Nbias)。最后,观察到Nage、Nobs、nbias都不依赖于序列π(k),因此N的选择与序列π(k)无关。引理A.2。假设g是正则的。假设有一些*∈ A和v∈ 所以u(θ,s*, 一*) >v、 然后,存在C∈ (0,1),C>0,以便在每个发送方历史记录中yθ,#(s*, 一*|yθ)≥C·#(s)*|yθ)+Cimplies E[u(θ,s*, π(·s)*))|yθ>v.Proof。写入u:=mina∈Au(θ,s*, a) 。存在q∈ (0,1)使得q·u(θ,s*, 一*) + (1)- q) ·u>v.找到一个足够小的 > 0使0<q1-< 1、由于g是正则的,Fudenberg、He和Imhof(2017)的命题1告诉我们存在这样的情况,即历史为yθ的发送者的后验平均信念不小于(1- ) ·#(s)*, 一*|yθ)#(s*|yθ)+C。每当此表达式至少为q时,预期的payoff toθplaying s*超过v。也就是说,必须有(1- ) ·#(s)*, 一*|yθ)#(s*|yθ)+C≥ q<==> #(s)*, 一*|yθ)≥第一季度- #(s)*|yθ)+q1- · C、 放置C:=q1-和C:=q1-· C移除引理。引理A.3。让Ztbe i.i.d。

63
可人4 在职认证  发表于 2022-5-31 03:45:44
伯努利随机变量,其中E[Zt]=1- . 写入序号:=Pnt=1Zt。对于0<C<1和C>0,存在‘, G、 G>0,使得每当0< < \'\',P[序号≥ Cn+Cn≥ G]≥ 1.- G.证据我们利用了Fudenberg和Levine(2006)的引理,这反过来又扩展了Billingsley(1995)的一些不等式。FL06引理A.1:假设{Xk}是一系列i.i.d.Bernoulli随机变量,E[Xk]=u,并确定每个n的随机变量SN:=| Pnk=1(Xk- u)| n。然后,对于任何n,(R)n∈ N、 P马克斯≤n≤(R)nSn>≤·n·u.对于每G>0和每0< < 1,P[Sn≥ Cn+Cn≥ G] =1- P“(n≥ G) nXt=1Zt<Cn+C#=1- P“(n≥ G) nXt=1(Xt- ) > (1)-  - C) n个- C#,其中Xt:=1- Zt。让‘:=(1)- C) 和G:=2C/“”. 假设0< < \'\'. 那么对everyn来说≥ G、 (1)-  - C) n个- C≥ \'\'n- C≥\'\'n、 因此,P[Sn≥ Cn+Cn≥ G]≥ 1.- P“(n≥ G) nXt=1(Xt- ) >\'\'n#根据FL06引理A.1,右侧的概率最多为G 带G:=/(3G’).我们现在证明定理3。定理3:假设π*对接受者严格且耐心稳定。然后满足强兼容性标准。证据让一些人/∈ BR公司((▄J(s,π*)), s) h>0。我们将显示π*(a | s)≤ 3小时。步骤1:确定常数ξ、θJ、aθ、sθ、C、C、G、G和Nrecv。(i) 对于每个ξ>0,定义ξ-近似值(▄J(s,π*)) 在¢J(s,π)以外的类型上,作为权重不大于ξ的概率分布*),ξ(~J(s,π)*)):=np公司∈ (Θ):p(θ)≤ ξθ/∈~J(s,π)*)o、 由于最佳响应对应具有闭合图,因此存在一些ξ>0,因此a/∈ BR公司(ξ(~J(s,π)*)), s) 。(ii)自▄J(s,π)*) 是非空的,我们可以x一些θJ∈~J(s,π)*).(iii)对于各平衡主导型θ∈ Θ\\~J(s,π*), 识别一些路径信号sθsothatπ*(sθ|θ)>0。根据接收机的路径严格性假设,存在一些aθ∈ A sothatπ*(aθ| sθ)=1,此外,aθ是π中sθ的严格最佳响应*.

64
mingdashike22 在职认证  发表于 2022-5-31 03:45:47
根据平衡优势的定义,u(θ,sθ,aθ)>最大值∈Au(θ,s,a)=:vθ。通过对每个θ应用引理A.2∈ Θ\\~J(s,π*), 我们得到一些C∈ (0,1),C>0,所以前θ∈ Θ\\~J(s,π*) 在每个发送方历史中yθ,#(sθ,aθ| yθ)≥ C·#(sθ| yθ)+CimpliesE[u(θ,sθ,π(·| sθ))| yθ]>vθ。(iv)引理A.3,结束’, G、 G>0,如果E[Zt]=1-  i.i.d.Bernoulli和Sn:=Pnt=1Zt,然后每当0< < \'\',P[序号≥ Cn+Cn≥ G]≥ 1.- G.(v) 因为在π*, aθ是每个θ对sθ的严格最佳响应∈ Θ\\~J(s,π*), 来自LemmaA。1我们可以找到一个Nrecvso,对于每个序列π(k)∈ ∏*(g,δk,γk),其中γk→ 1,π(k)→ π*,有对应的Krecv∈ N所以k≥ Krecv隐含π(k)(aθ| sθ)≥ 1.- (1)- γk)·每θ的NRECV∈ Θ\\~J(s,π*).步骤2:确保除3h接收器外的所有接收器都相信ξ(~J(s,π)*)).考虑一些稳态ψ∈ ψ*(g,δ,γ)对于g正则,δ,γ∈ [0,1).在Fudenberg、He和Imhof(2017)的定理2中,将c=ξ·maxθ∈λ(θ)λ(θJ)和δ=。我们得出结论,存在一些nrre(不依赖于ψ),因此每当π(s |θJ)≥c·π(s |θD)对于每种平衡支配型θD/∈~J(s,π)*) andn·π(s |θJ)≥ Nrare,(7)则处于稳态ψ的age-n接收器,其中π=σ(ψ)的概率至少为1- h保持后验信念g(·| y),使得θJis至少是每θD播放sasθDis的可能性的t倍/∈~J(s,π)*). 因此,历史y在s,p(·| s;y)之后产生了一个后验信念,使得p(θD | s;y)p(θJ | s;y)≤λ(θD)λ(θJ)·ξ·λ(θJ)maxθ∈Θλ(θ)≤ ξ。特别是,p(·| s;y)必须为不在| J(s,π)中的每种类型分配不大于ξ的权重*);因此,信仰属于ξ(~J(s,π)*)). 通过构造ξ,ais则不是历史y之后的最佳响应。年龄n满足方程(7)的接收器以小于h的概率播放a,提供π(s |θJ)≥ 每个θD的c·π(s |θD)/∈~J(s,π)*).

65
何人来此 在职认证  发表于 2022-5-31 03:45:50
然而,为了将ain在稳态ψ中的整体概率限制在整个接收器总体内,我们确保方程(7)满足ψ中所有接收器的2h分数。我们认为,当γ足够大时,π=σ(ψ)满足π(s |θJ)的有效条件是≥ (1)- γ) N个*对于某些N*≥ Nrare/h。这是因为在这种情况下,任何老化的试剂≥h1-γ满足方程(7),而接收方的分数大于h1-γ为1-γh1-γ≤ 2h,γ接近1。总之,在步骤2中,我们发现了一个常数nRarea,并表明如果γ接近enoughto 1,那么π=σ(ψ)有π(a | s)≤ 3h如果满足以下两个条件:(C1)π(s |θJ)≥ c·π(s |θD)对于每种平衡支配型θD/∈~J(s,π)*)(C2)π(s |θJ)≥ (1)- γ) N个*对于某些N*≥ 在下一步中,我们证明存在一系列稳态ψ(k)∈ ψ*(g,δk,γk)和δk→ 1,γk→ 1,σ(ψ(k))=π(k)→ π*这样,在每个π(k)中,上述两个条件都满足。使用γk→ 1,我们得出结论,对于足够大的k,我们得到π(k)(a | s)≤ 3h,它依次显示π*(a | s)≤ 由于收敛π(k),3h→ π*.步骤3:提取一个合适的稳态子序列。在引理4的陈述中,把θ:=θJ。我们得到一些数字 函数‘(N),’γ(N,δ)。放置Nratio:=ξG·Nrecvmaxθ∈λ(θ)λ(θJ)和N*:= 最大值(Nratio,Nrare/h)。自π起*耐心是稳定的,它可以写为一些策略的极限π*=利姆→∞π(k),其中每个π(k)与δk是δk-稳定的→ 根据δ-稳定的定义,每个π(k)是极限π(k)=limj→∞π(k,j)与π(k,j)∈ ∏*(g,δk,γk,j)带limj→∞γk,j=1。假设每k≥ 1,δk≥\'\'δ(N*), π(k)和π之间的距离*小于/现在,对于每个k,找到一个足够大的指数j(k),以便(i)γk,j(k)≥ γ(N*, δk),(ii)π(k,j)和π(k)之间的距离小于min(,k) ,和(iii)limk→∞γk,j(k)=1。

66
nandehutu2022 在职认证  发表于 2022-5-31 03:45:54
这产生了一系列k指数稳态,ψ(k,j(k))∈ ψ*(g,δk,γk,j(k))。此后,我们将通过函数j(k)放弃依赖关系,只参考ψ(k)和γk。序列ψ(k)∈ ψ*(g,δk,γk)满足:(1)δk→ 1,γk→ 1.(2) δk≥\'\'δ(N*) 对于每个k;(3) γk≥ \'-γ(N*, δk)对于每个k;(4) π(k)→ π*; (5) ψ(k)与π之间的距离*不大于. 引理4表示,对于每个k,π(k)(s |θJ)≥ (1)- γk)N*. 因此,序列的每个成员都构造了满足条件(C2)。步骤4:平衡主导型试验概率的上限。有待证明的是,最终条件(C1)在步骤3中构建的序列中也得到满足。我们首先确定聚合接收器策略π(k)收敛到π的速率*.根据引理A.1,存在一些Krecvso,k≥ Krecv隐含π(k)(aθ| sθ)≥ 1.-(1)-γk)·Nrecvforeveryθ∈ Θ\\~J(s,π*). 找到下一个足够大的Kerrorso≥ KerroImples(1-γk)·Nrecv<\'(其中’ 在步骤1)中定义。我们声称当k≥ max(Krecv,Kerror),θ型/∈~J(s,π)*) 始终针对播放π(k)(·| sθ)的接收方群体发送信号sθ的发送方小于(1- γk)·Nrecv·g有一种后验信念,即在某些时间段n内,sθ的预期收益不大于vθ≥ G、 这是因为引理A.3,P[Sn≥ Cn+Cn≥ G]≥ 1.- G·π(k)({a 6=aθ}| sθ)≥ 1.- G·(1)- γk)·nRecv,其中sn是指在发送sθ的前n次中,接收器总体响应sθ的次数。但引理A.2保证提供了Sn≥ Cn+C,发件人对sθ的预期付款严格高于vθ,因此我们已确定索赔。最后,找到足够大的Kgittinsk,以便k≥ Kgitts将有效贴现因子δkγkis如此接近1,以至于对于每个θ/∈~J(s,π)*), 如果sθ的使用时间不超过Gtimes,则信号sθ的Gittins指数不能低于vθ。

67
kedemingshi 在职认证  发表于 2022-5-31 03:45:57
(这是可能的,因为先验知识是非教条主义的。)那么对于k≥ 最大值(Krecv、Kerror、KGittins),小于G·(1- γk)·nRecv平衡支配发送方θ的可能性/∈~J(s,π)*) 将玩七次。为了看到这一点,我们观察到,根据前面的说法,sθ的Gittins指数高于s的Gittins指数,而s的指数并不高于其可能的最高收益vθ。这意味着发送方在sθ的Gittins索引低于vθ之前不会播放SunTins。自k起≥ Krecv,在发送方至少播放θGtimes之前,这不会发生,因为k≥ max(Kerror,Krecv),之前的主张证明,在第G次播放sθ后,sθ的预期收益(更确切地说,sθ的Gittins指数)下降到vθ以下的可能性不大于G·(1- γk)·Nrecv。这表明,对于k≥ max(Krecv,Kerror,KGittins),π(k)(s |θ)≤ GNrecv·(1- γk)对于每个θ/∈~J(s,π)*). 但由于π(k)(s |θJ)≥ N*· (1)- γk)其中N*≥ Nratio=ξG·Nrecvmaxθ∈Θλ(θ)λ(θJ),我们看到当k≥ max(Krecv、Kerror、KGittins)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 13:27