楼主: mingdashike22
4414 120

[经济学] 数学博弈论 [推广有奖]

61
何人来此 在职认证  发表于 2022-4-24 19:28:04
设S={σ,σ}并假设Pr(σ)=Pr(σ)=1/2。考虑信息Rima-函数(S=){{ S}}和P(Sigi)={ S}}(S=){ S=,Sig}=P(α)。对于事件E={σ},一个结果sPr(E | P(σ))=1和Pr(E | P(σ))=0Pr(E | P(σ))=1/2和Pr(E | P(σ))=1/2。Ground集合S={σ,σ}对应于事件“两个p层对E发生的可能性的估计不同”。这两个状态σ,σ中的每一个都是(微不足道的)常识。然而,对于一大类信息函数,我们的初始问题有一个确定的答案“否”。例如,如果每一个明显的事件E都是成对不相交集P(σ)的并,我们就称一个信息函数P为strict。建议4.2。假设两个信息函数都是严格的。让E 这是一件非常罕见的事。那么就没有状态σ了*这可能是球员们的共同知识,他们的健康状况估计ηres p。η对E的发生有不同的影响。证据考虑EngEsI= {西格玛PR(Eππ(α))=ε}(i=1, 2)。事件E∩ 这是指当玩家p的估计值为η时,玩家对η的概率进行测量的事件。假设E∩Eis是σ状态下的常识,即存在一个事件F E∩ 如此*∈ F和K(F)=F=K(F)。因为信息函数Pis stri ct,F是成对不相交集P(σ)的并,P(σk),比如。因为F E∩ E、 一个hasPr(E | P(σ))=…=Pr(E | P(σk))=η.6。常识71考虑到前4.14,我们因此发现Pr(E | F)=Pr(E | P(σ)=η)。同样地,Pr(E | F)=η被推导出来,因此η=η如下。例4。1 4. 假设A,B是这样的事件:∩ B=.

62
mingdashike22 在职认证  发表于 2022-4-24 19:28:12
然后条件概率满足:Pr(E|A)=Pr(E|B)==> Pr(E | A)∪ B) =Pr(E | A)。第3部分n人博弈5效用、潜力和均衡在讨论n人博弈本身之前,回顾博弈的基本模型并研究博弈的特征是有用的。其目的是从总体角度对国家和战略决策的价值进行数字评估。1.实用性和潜力1。1.实用性。系统S上的一个实用程序是一个集合u={uσ|σ∈ S} 函数uσ:S→ R、 所谓的U的局部效用函数。我们认为U是一种测量工具,所有这些工具都能让我们评估可能的移动σ7→ τ通过随后的边缘差进行数值计算U(σ,τ)=Uσ(τ)- uσ(σ)如果任何移动的质量σ7→ τ在博弈Γ中是通过效用U来计算的,我们称U为Γ1.2的特征效用。潜力。有“潜力”意味着有能力做某事。在物理学中,势一词是指系统的特征量,其变化导致系统的动态行为。例如,势能可以使物体运动。由此产生的动能对应于势能的变化。引力被认为是由相应的势、所谓的引力场等的变化引起的。从数学上讲,势被表示为实值数值参数。换句话说,系统S上的电势只是一个函数→ r分配给一个状态σ∈ S是一个数值v(σ)。势能v产生相关的效用v={vσ|σ∈ S} 式中,vσ=v表示所有σ∈ S.76.5。效用、势与均衡如果V是S上对策Γ的效用,则势V称为Γ的特征函数。

63
能者818 在职认证  发表于 2022-4-24 19:28:18
移动值σ7→ τi s由边缘差给出V(σ,τ)=v(σ,τ)=v(τ)- v(σ)路径独立性。给定S上的效用U,路径γ=σ7→ σ7→ σ7→ . . . 7.→ σk-17→ σkof系统转换具有总效用权重U(γ)=U(σ,σ)+U(σ,σ)…+U(σk)-1,σk)。如果任何路径的效用权重仅取决于其初始状态σ和最终状态(但不取决于状态σi6=σ,σkin):U(σ7)→ . . . 7.→ σi7→ . . . 7.→ σk)=U(σ,σk)。建议5.1。效用U在S上是路径无关的当且仅当U是从S上的势导出的。如果U是从势U:S导出的→ R、 我们有U(σi)-1,σi)=u(σi)- u(σi)-1) 因此,对于任何γ=σ7→ σ7→ . . . 7.→ σk:U(γ)=kXi=1(U(σi)- u(σi)-1) )=kXi=1u(σi)-K-1Xi=0u(σi)=u(σk)- u(σ)=U(σk,σ),表明U处的th与路径无关。相反,假设U={Uσ|σ∈ S} 是一个路径无关的实用程序。修正一个状态σ,注意效用函数u=uσ本身就是一个势函数。因为U是路径无关的,所以我们有σ,τ∈ sU(σ,σ)+U(σ,τ)=U(σ,τ),因此,U(σ,τ)=U(σ,τ)- U(σ,σ)=U(τ)- u(σ)。因此,U与从潜在U导出的效用是相同的。2.平衡772。当我们讨论效用的平衡时,U={Uσ|σ∈ S} 在系统S上,我们假设每个状态σ都关联了一个邻域fσ S与σ∈ Fσ。这意味着我们将状态转换集中到邻居,即转换到σ7→ τw与τ∈ Fσ。我们现在说,如果系统状态σ产生效用函数的一个局部极值,则它是一个“等平衡”,从该极值到一个邻域的转移似乎是有吸引力的。

64
可人4 在职认证  发表于 2022-4-24 19:28:24
准确地说,我们区分了最大极值和最小极值,因此定义:(1)σ是U-ifuσ(τ)的增益(或收益)平衡≤ uσ(σ)适用于所有τ∈ Fσ;(2) σ是U ifuσ(τ)的成本均衡≥ uσ(σ)适用于所有τ∈ Fσ。许多现实世界中的系统都被假定为受到一个动态过程的影响,该过程最终会根据某种效用度量在平衡状态(或至少近似于非平衡状态)下稳定下来。这一现象在物理学中得到了惊人的观察。但经济理论长期以来一直怀疑,经济系统可能会趋向于均衡状态。如果效用衡量指标表明价值最大化,那么收益均衡是有意义的。如果一个最小值是可取的,一个是成本均衡。备注5.1(收益和成本)。用C表示=-U带有localutility函数的实用程序cσ=-uσ。那么σ是U的增益平衡<==> σ是成本均衡。从抽象的角度来看,收益均衡理论相当于成本均衡理论。2.1. 平衡的存在。在实践中,平衡点的确定通常是一项非常困难的计算任务。事实上,许多效用并不均衡。一般来说,要确定一个给定效用是否存在非平衡并不容易。所以我们对能得出至少存在一个平衡态的条件感兴趣。A.A.古诺(1838年):巴黎理工大学数学研究院,78 5。效用、潜力和平衡2。1.1. 潜在的效用。

65
mingdashike22 在职认证  发表于 2022-4-24 19:28:31
考虑潜在的U:S→ R与派生的效用值u(σ,τ)=u(τ)- u(σ)。这里,有一个条件显然是充分的:(1)如果u(σ)=maxτ∈σu(τ),那么σ是增益平衡。(2) 如果u(σ)=minτ∈σu(τ),则σ是成本均衡。由于有限集上的每个函数都达到了最大值和最小值,因此我们得出了第5.2点的结论。如果S是有限的,那么每一个潜在函数都会产生至少一个收益和一个成本均衡的效用。类似地,我们可以导出坐标空间中表示的系统的平衡点的存在性。建议5。3.如果S可以表示为紧集S 这样的话→ R是连续的,那么u意味着S上的效用至少有一个增益和一个代价相等的平衡。事实上,众所周知,紧集上的连续函数达到最大值和最小值。备注5.2。请注意,本节中给出的条件足以保证平等的存在——无论假设S上的社区结构是什么。2.1.2. 凸面和凹面的u形瓷砖。如果效用不是由势函数隐含的,则即使S的完整性也不足以保证平衡的存在(见例5.1)。例5.1。给出一个效用U相对有限状态的例子,该状态没有g a in,也没有成本均衡。现在,我们推导了状态由非紧凸集S表示的系统上效用U的充分条件 Rm。2.平衡点我们说:oU是凸的,如果每个局部函数us:S→ R是凸的如果每个局部函数都是S,那么U是凹的→ R是凹的。定理5.1。设U是一个具有连续局部效用函数us:S的效用函数→ 非空紧集S上的R Rm。然后(1)如果U是凸的,则存在成本均衡。(2) 如果U是凹的,则存在一个引力平衡。证据

66
nandehutu2022 在职认证  发表于 2022-4-24 19:28:38
定义函数G:S×S→ R和估值G(s,t)=所有s,t的us(t)∈ 然后定理的假设是G满足附录A.1的条件。因此,一个元素∈ S存在于这样的情况下:t=G(S,t)≤ G(s,s)=美国(s)对所有s都适用∈ 因此,S*是U的增益等式(凸情况也用同样的方法证明。)第六章n人博弈n人博弈概括了2人博弈。然而,事实证明,分析双人游戏的特殊技术也适用于这一看似更广泛的背景。例如,交通系统自然就属于这一类。n人博弈的模型假定存在一个有限集n,其中n=|n |元素将她与一个家庭X={Xi | i联系在一起∈ n次非空集席的n}元素i∈ N被认为是球员或经纪人。席席∈ X代表代理i可用的资源集合(或行动、策略、决策等)∈ N.Γ的状态是一个特定的选择x=(xi |i)∈ n)个人资源席∈ Xiby n agents i.因此,所有Γ状态x的集合由直接乘积x=Yi表示∈NXi。备注6.1。用自然数来标记N的元素,并假定N={1,2,…,N},这通常是很方便的,以简化计算。在这种情况下,Γ的状态x可以用形式x=(x,x,…,xn)表示∈ X×X×。×Xn(=X)。我们进一步假设每个玩家∈ N有一个单独的实用性ui={uxi | x∈ 十} 所以uxi(y)评估状态转换x7的值→ y代表i.整个上下文Γ=Γ(Ui | i∈ N) 集合中的玩家及其工具现在描述了N人游戏的欠考虑。82 6. N人游戏性爱。6.1.

67
何人来此 在职认证  发表于 2022-4-24 19:28:46
具有行玩家R和列玩家C的矩阵对策Γ与支付矩阵XP=(p,q)(p,q))(p,q)(p,q)=(+1, -1) (-1, +1 )(-1, +1) (+1, -1).是一个两人游戏,玩家设置N={R,C},策略设置xr={1,2}和XC={1,2}。相应地,状态集是x=XR×XC={(1,1)、(1,2)、(2,1)、(2,2)}。单个效用函数u(i,j)R,u(i,j)C:X→ R取所有(s,t)的值su(i,j)R(s,t)=pst和u(i,j)C(s,t)=qstf∈ 十、潜在的游戏。n人游戏Γ=(Ui | i)∈ N) 如果有一个p势v:X,则称为势对策→ R那么,无论如何∈ N和x,y∈ X边际效用的变化等于潜力的变化:uxi(y)- uxi(x)=v(x,y)=v(y)- 五(十)合作。一组N人的基本博弈模型很容易被推广到一个模型,在这个模型中,一组人(而不仅仅是个人)从某个状态x得到一个效用值∈ 为此,我们称之为子集 N个参与者组成一个联合体,并假设一个单独的ut函数us:X→ 然而,从抽象的数学观点来看,这个广义模型可以被视为标准的N人博弈,具有S etN={S N} 将联盟视为其“超级层”的集合。事实上,我们可以允许每个联盟拥有自己的一套资源。因此,在本章中,我们保留了关于基本参与者集N的基本c模型。第七章将详细研究一类特殊的合作博弈,即所谓的合作博弈。概率模型。n-persongames有许多概率方面。一个是从概率模型开始(见Ex.6.2)。例6.2(模糊游戏)。假设一个游戏Γ∈ n必须在两个备选方案之间作出决定,比如说“0”和“1”,d用概率席选择“1”。

68
kedemingshi 在职认证  发表于 2022-4-24 19:28:52
那么Γ是一个|N |人的游戏,其中每个玩家i都有t heunit intervalXi=[0,1]={x∈ R | 0≤ 十、≤ 1} 作为它的一套资源。联合战略CycEX=(x,…,席,…,Xn)∈ [0,1]N2。平衡点可以用“模糊”的决定来表示,以形成一个协整X 玩家:我将成为X席的成员,概率XI。因此,x是模糊联盟的描述。Γ是奥比恩意义上的模糊合作博弈,如果用我们的术语来说它是一个潜在博弈。另一个模型来自n人GAME的随机化(见第3节)。第7章和第8.1章研究了n人游戏的其他概率方面。n人博弈的动力学∈ N) 在游戏中,一个游戏实例会产生一系列状态转换。这些转换被认为是由于玩家策略选择的改变。我想∈ N将其当前战略XIB替换为战略y∈ Xiwhileall其他玩家j 6=我保留他们的cho ICE xj∈ Xj。然后是状态转换7→ y=x-i(y)结果,其中新状态具有分量syj=如果j=ixjif j 6=i,则为y。请特别注意x-i(xi)=x在该定义下成立。让我们假设setFi(x)={x-i(y)|y∈ Xi}作为x国的社区∈ X代表我的球员∈ 因此,从我的观点来看,X的成员是那些可以通过I改变当前策略席I来实现的状态,提供了所有其他玩家J 6 =保留当前策略XJ。2.均衡增益均衡Γ=Γ(Ui | i∈ N) 是联合战略选择∈ 因此,没有一个玩家有一个效用激励,可以切换到另一种策略,即uxi(x)≥ uxi(z)为al l i保留∈ N和z∈ Fi(x)。完全类似地,成本均衡是通过相反的条件定义的:uxi(x)≤ uxi(z)为al l i保留∈ N和z∈ Fi(x)。J-P.奥宾(1981):模糊合作博弈,数学。

69
nandehutu2022 在职认证  发表于 2022-4-24 19:28:59
运筹学6,1-1384 6。N人博弈这个均衡的概念可以与第2章中的一般定义相一致。假设状态X,想象一下每个玩家我都认为它的当前策略是席。结果效用y值的总和为g(x,y)=Xi∈Nux(x)-i(yi))(y=(yi | yi)∈ Xi))。引理6.1。十、∈ X是Γ(Ui | i)的增益平衡∈ N) 如果只有d个ifG(x,y)≤ G(x,x)代表所有y∈ X.证据。如果x是增益平衡,y=(yi | i∈ N)∈ 十、 我们哈沃西(X)≥ ux(x)-我(易)为了所有的易∈ 席,这意味着G(x,x)≥ G(x;y)。相反地,如果x不是一个引力平衡,则存在一个i∈ N和y∈ Xisuch that0<uxi(x-i(y))- uxi(x)=G(x,xi(y))- G(x,x)。也就是说y=x-i(y)∈ X违反了不平等。引理6.1将对Γ平衡的追求简化为对效用G={gx | x非平衡的追求∈ 十} 其值为gx(y)=G(X,y)。因此,我们可以立即将第5章中关于均衡存在的一般充分条件转移到n人博弈Γ=(Ui | i)中∈ N) 利用效用聚合函数G:(1)如果Γ是一个具有有限集X的有效博弈,那么收益和成本均衡的存在是有保证的。(2) 如果X表示为有限维实参数空间中的非空紧凸集,则→ G(x,y)是连续且凹的,则Γ再次允许平衡。(3) 如果X表示为有限维实参数空间中的非空紧凸集,则→ G(x,y)是连续且凸的,则Γ承认成本平衡m.ex6.3。证明Ex.6.1中的矩阵g不是一个潜在的游戏(提示:状态集是有限的。)3.矩阵游戏的随机化853。

70
何人来此 在职认证  发表于 2022-4-24 19:29:05
矩阵博弈的随机化n人博弈Γ=(Ui | i)∈ N) 如果(i)任何玩家的资源集合i∈ N是有限的。(ii)每位球员i∈ N只有一个实用函数ui:X→ R.对于术语的动机,假设多维矩阵U的坐标席集XAAS索引集的n={ 1,…,n}和thi-nk,特定的In Ex VECtox=(x,…,Xi,…,Xn)。∈ X=X×。×席××…Xnthus指定了一个在U中的位置,其中n维坐标入口=(U(x),ui(x),un(x))∈ 注册护士。现在让我们用以下方式改变矩阵对策的规则:(R)对于每个i∈ N、 玩家i选择一个概率分布p(i)在Xiand上选择元素x∈ xi概率p(i)x。根据规则(R),玩家实际上在玩相关的n人游戏(Ui |i)∈ N) 使用资源集和实用程序功能ui:Pi→ R,其中(1)πs的所有概率分布在席上。(2) ui(p)是ui相对于联合概率分布p=(p(i)|i的期望值∈ N) 球员的名字。n人博弈Γ是矩阵博弈Γ的随机化。假设sum ingN={1,…,n},一个具有给定asui(p(1),…)的预期效用值,p(n))=Xx∈十、Xxn∈Xnui(x,…,xn)p(1)x··p(n)xn。如例6.1所示,一个(非随机)矩阵博弈不一定有均衡。另一方面,请注意坐标生产函数(t,…,tn)∈ Rn7→ t··tn∈ R86 6。N人配子在每个变量中是连续的和线性的。随机博弈Γ的每一个效用函数都是这类函数的线性组合,因此在每个变量中也是连续的和线性的。由于线性离子既是凹的又是凸的,且状态setP=P×。x pn是凸紧的,我们得出结论:定理6.1(纳什)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 06:49