楼主: mingdashike22
4631 120

[经济学] 数学博弈论 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-4-24 19:22:42
两个向量f,g的乘积fog∈ RSI是带有分量乘积的向量,即fog=(fsgs | s∈ S) 。在矩阵A,B的特殊情况下∈ RX×Y A和B的函数乘积称为HADAMARDproductAoB∈ RX×Y(系数(AoB)xy=AxyBxy)。警告:这不是标准的矩阵乘法规则(2)!矩阵A的标准产品∈ RX×Yand B∈ RU×Z仅在U=Y的情况下声明,然后定义为矩阵(2)C=AB∈ RX×z,系数Cxz=Xy∈亚克斯比兹。不是贝尼。在指数集X和Y为有限的情况下,两个矩阵的标准积可能无法很好地定义,因为有限和是有问题的。然而,就本书的目的而言,这并不是障碍:o主要考虑有限金额。备注1.3(希尔伯特空间)。许多博弈论分析可以扩展到希尔伯特s p ACE的框架,也可以扩展到形式(3)的坐标l(S) ={f:S→ R|Xs∈Sfs<∞},其中S是一个可数(可能是单位)集合。内积与规范。两个矩阵a,B的内积hA | Bi∈ RX×y是各成分的乘积之和:hA | Bi=Xx∈XXy∈Y=Xx∈XXy∈YAxyBxy=X(X,y)∈X×Y(AoB)xy。不是贝尼。内积hA | Bi是一个标量数,而不是一个矩阵!J.哈达玛(1865-1963)D.希尔伯特(1862-1943)10 1。真实世界的数学模型在向量的情况下,我们有f,g∈ RS,内部产物hf | gi=XS∈Sfsgs~=fTg,其中后一个表达式假设我们将f和g视为列向量,并用标量hf | gi识别(1×1)-矩阵fTg。例1.1。如果f,g∈ Rnare列向量,然后是fTg∈ R1×1是一个(1×1)矩阵。这与(n×n)-矩阵xfgt有明显区别=fgfg。fgnfgfg。fgn。。。。。。。。。。。。fngfng。

12
kedemingshi 在职认证  发表于 2022-4-24 19:22:48
FGN∈ 向量(或矩阵)f的Rn×n范数∈ RSI定义为kfk=phf | fi=Xs∈S | fs |。向量的范数通常被几何解释为其欧几里得长度。所以One说两个向量f,g∈ 如果满足所谓的毕达哥拉斯定理(4)kf+gk=kfk+kgk,则R是正交的。引理1.1(正交性)。假设有限,坐标向量f,g∈ RS:f和g是正交的<==> hf | gi=0。证据简单的运动。2.3. 数字和代数。实数集合R在通常的实数加法和乘法规则下具有代数结构。R包含自然数的集合n={0,1,2,…,n,…}。因此,R的代数计算规则也可以应用于N,因为两个自然数的总和产生一个自然N数。类似的代数规则可以在其他集合上定义。我们举两个例子。虽然减法和除法不能保证相同。数学预科11个复数。当定义(a,b)+(c,d)=(a+c,b+d)(a,b)·(c,d)=(ab)时,R的计算规则可以扩展到实数对的集合R×R- bd,ad+bd)。关于这个代数的一个方便的表示法是(A,b)=A(1,0)+b(0,1)←→ a+ib,用所谓的虚单位i<-> (0, 1). 请注意,代数然后是Yieldsi<-> (0, 1) · (0, 1) = (-1, 0) <-> -1+i·0=-1.我们将复数集定义为setC={z=a+ib |(a,b)∈ R×R}并将R识别为C:a的子集∈ R←→ (a,0)∈ R×R←→ a+i·0∈ C.C中的代数遵循与R中代数相同的规则,附加规则i=-1.二元代数。

13
kedemingshi 在职认证  发表于 2022-4-24 19:22:54
关于二元集B={0,1},定义加法⊕和乘法 根据下表:⊕0 10 0 11 0和0 10 0 00 1.在这个二元代数中,除法也是可能的,因为等式x y=1有一个唯一的解决方案y“for every”x 6=0。(只有一种情况:y=x=1。)12 1. 真实世界向量代数的数学模型。复数使我们能够在分析实数和乘积时,用复数系数定义向量的和和和乘积。第8章将讨论这种代数技术的应用。在二元规则下,具有(0,1)-系数的向量也是如此。二元代数的一个应用是在第二章分析NIM对策的策略。评论数据结构上是否有明确定义的“正确”或“最佳”加法和乘法规则,可以从数学上揭示它们的真实世界结构?答案通常是“不”。强加的代数总是数学分析师的一种选择,而不是“自然之母”。这通常需要谨慎和真诚。此外,不同的代数设置可能会揭示不同的结构方面,从而带来更多的见解。2.4. 概率,信息和熵。考虑n个互斥事件E,…期望其中任何一个,比如Ei,都“以概率”pi=Pr(Ei)出现。然后这些参数在集合e={e,…,En}上形成概率分布,即和为1:p+…+的非负整数pn=1和p,pn≥ 0.如果我们有更进一步的测量或观测设备f,如果EI发生,则产生数字f,那么这些数字具有预期值(5)u(f)=fp+…+fnpn=nXk=1pipi=hf | pi。在博弈论背景下,概率通常是对事件发生可能性的主观评估。

14
能者818 在职认证  发表于 2022-4-24 19:23:00
赌徒、投资者或普通赌徒可能事先不知道未来会带来什么,但对某些事件的可能性有更多或更少的猜测。这与信息的概念有着密切的联系。2.数学预科。我们认为事件E的强度是一个数值参数,它与概率p=Pr(E)成反比:ERP越小,E的实际发生就越强烈。为了简单起见,让我们以1/p作为主观的强度度量。备注1.4(费希纳定律)。根据费希纳的说法,物理刺激的强度在生理上是对数级的。众所周知的例子是地震的里氏震级或声音的分贝级。在费希纳之后,我们感觉到事件E的强度,我们期望概率p在对数mic尺度上,因此根据函数(6)Ia(p)=loga(1/p)=-logap,其中logap是p相对于a>0基的对数m(见例1.2)。特别是,我们预计“不可能”事件的发生概率为零,其强度为(0)=-loga0=+∞.不是贝尼。事件的数学强度仅取决于其发生的概率,而不取决于其在建模环境中的解释或其在物理环境中的“真实性质”。例1.2(对数)。回想一下:对于任何给定的正数a,x>0,都有一个统一数y=logax,这样x=ay=alogax。其中e=2.718281828。。。是欧拉数,常用的符号是Lnx=logExi。ln x是所谓的自然对数算法,对于所有x>0,其导数(ln x′=1/x)。两个对数函数logax和logbx只相差一个乘法常数。事实上,一个hasalogax=x=blogbx=a(logba)logbx和hencelogax=(logba)·logbx表示所有x>0。G.TH。费希纳(1801-1887)L。

15
mingdashike22 在职认证  发表于 2022-4-24 19:23:06
欧拉(1707-1783)14 1。真实世界信息的数学模型。在信息基础理论中,参数i(p)=-logp是概率为p的事件E提供的信息量。请注意,概率值p可以从信息量I(p)中获得:p=2logp=2-I(p)。这种关系表明,“概率”可以理解为捕捉事件发生时信息量(或缺乏信息)的参数。熵。概率分布为π=(p,…,pn)的事件家族提供的预期信息量称为其熵(7)H(E)=H(π)=nXk=1pkI(pk)=-nXk=1pklogpk,其中,按照惯例,e上的集合为0·log0=0。同样,它应该是不需要注意的:h(E)只取决于参数向量π,而不是对E的真实解释。熵也是热力学中的一个基本概念,例如,它用于确定系统的温度。物理学家更喜欢用基数e而不是基数2,因此用Lnx而不是logx,也就是说,用相应的标度entropyH(π)=-nXk=1pkln-pk=(ln2)·H(π)。系统系统是在任何给定时刻处于特定状态的实体、经济实体或其他实体。用S表示所有可能状态σ的集合,用S来标识系统。这当然是一个非常抽象的定义。在实践中,必须以适合具体数学分析的方式描述系统状态。为了初步了解其含义,让我们看一些例子。由于C.E.香农(1916-2001)3。国际象棋。

16
大多数88 在职认证  发表于 2022-4-24 19:23:12
一个系统由国际象棋的名称产生,如下所示:棋子的状态是国际象棋棋盘上棋子的特定配置,以及两个棋手(“B”或“W”)下一步要绘制的信息。如果C是所有可能的国际象棋配置的集合,那么一个状态可以被描述为一对σ=(C,p)和C∈ C和p∈ {B,W}。以类似的方式,纸牌游戏在一个系统中占有一席之地,该系统描述了纸牌在玩家之间的可能分布,以及玩家下一步要移动的信息。经济交换经济的模型包括一组试剂和一组特定商品。给i探员的包裹∈ N是adata vectorb∈ RG,其中组件BG表示束b由良好的BGG单元组成∈ G.用B表示所有可能的束的集合。交换经济的状态现在用β:N图来描述→ B(或向量β∈ BN)该特定代理i的特定捆绑β(i)∈ B.与之密切相关的是对总体经济状况的描述。我们考虑一组经济统计数据。假设这些统计数据在给定时刻取数值,相应的经济状态由数据向量给出∈ 重新保存统计值是其组成部分。决定。在一般的微分系统d中,我们得到一个集合N={N,N,…}假设每个代理∈ N必须对给定的类型做出决定,也就是说,我们假设N必须在其“决策集”Di中选择一个元素。n i的联合决定是一个向量d=(d,d,…)=|i∈ N)∈ D×D×··=易∈NDI描述了集合N的决策状态。在博弈论的背景下,代理人的决策通常对应于从某些可行的策略集合中选择策略。决策系统无处不在。

17
nandehutu2022 在职认证  发表于 2022-4-24 19:23:18
例如,在交通情况下,N可以是一组想要从个人出发点到个人目的地旅行的人。假设每个人我都从一组可能的Pip中选择了一条路径Pi。然后是16-1的状态。现实世界的数学模型相关的交通系统是N组成员的路径的有限选择π,我们是一个具有路径值分量的数据向量:π=(π| i∈ N) .4。GamesA gameΓ包含一组代理(或玩家)和一个系统的相对人,该系统与该游戏有关。一个具体的游戏实例γ从一些初始状态σ开始,并考虑移动的等式,即状态转移σt→ σt+1根据Γ的规则是可行的。在t步之后,系统从状态σ演变为一系列(可行的)运动σ中的状态σ→ σ→ . . . → σt-1.→ σt。我们指的是相关序列γt=σσ····∑t-1σt表示时间t时Γ的阶段,并用(8)Γt={γt|t是时间t时Γ的可能阶段}表示t步后所有可能阶段的集合。如果游戏实例γ在阶段γt=σσ····∑t中结束,那么σ是γ的最终状态。值得注意的是,S中可能有许多st at e序列不一定是Γ的阶段,因为根据Γ的规则,它们是不可行的。这个非正式的讨论表明了如何从一个抽象的角度来定义一个一般的博弈:o一个博弈是一组具有∑∑··∑t性质的有限状态序列γ-1σt∈ Γ ==> σ∑··∑t-1.∈ Γ.成员们∈ Γ被称为Γ的阶段。因此,国际象棋将被抽象地定义为所有可能的合法国际象棋动作序列的集合。

18
kedemingshi 在职认证  发表于 2022-4-24 19:23:24
然而,这个集合非常大,在计算上难以处理。在具体的实际情况下,博弈Γ的特征是一组规则,这些规则允许我们检查一个状态序列γ对Γ是否可行,也就是说,它属于那个潜在的巨大集合Γ。这些规则通常还涉及一组玩家(或代理人),这些玩家(或代理人)通过在时间t=0、1、2……的后续点上采取某些行动并做出某些选择来“影响”游戏的演化。。4.让我们在这一点上对“影响”的精确数学含义保持一点模糊。这将在以后的特殊游戏环境中变得清晰。例如,在国际象棋的一个例子中,一个人知道在给定的时间t,哪个棋手在移动。然后,这个棋手可以根据国际象棋规则,将系统从当前状态σtint确定地移动到下一个状态eσt+1。然而,许多游戏都涉及随机过程(如rollin gdice或shu f fling cards),其结果事先未知,因此玩家不可能确定地选择所需的后续状态。备注1.6。当一场比赛在时间t=0的状态eσ中开始时,通常不清楚它将在哪个阶段结束(或者是否结束)。目标和实用程序。游戏中的玩家通常有特定的目标,根据这些目标,他们试图影响游戏的发展。当然,一个严格的数学模型需要用数学术语清楚地表述这些目标。此类目标的一个典型例子是一组效用函数sui:Γ→ R(i)∈ N) 它与每个p层i相关联∈ N实数ui(γ)∈ R为阶段γ后的效用值∈ Γ实现了。当然,它的预期效用对于玩家在游戏中的战略决策至关重要。我们用一个赌博的例子来说明这一点。例1.3。

19
可人4 在职认证  发表于 2022-4-24 19:23:31
考虑一个具有100欧元资本的玩家,在一个情境中,赌注可以放在一个(0, 1)值随机变量x的结果上,概率为p=pr {x=1 },q= pr {x=0 }=1。- p、 假设:o如果玩家在游戏中投资f欧元,并且事件{X=1}发生,玩家将获得2f欧元。在{X=0}事件中,投资f将丢失。问题:f的最佳投资金额是多少*对球员来说?要回答这个问题,请观察玩家下注后的总端口对开本是x=x(f)=100+f,概率p100- 为了这个例子,让我们假设游戏者有一个效用函数u(x),并希望s最大化x的预期效用,即效用函数(f)=p·u(100+f)+q·u(100)- f) .18.1。现实世界的数学模型让我们考虑两种情况:(i)u(x)=x和henceg(f)=p(100+f)+1(100- f) 带导数eg′(f)=p- q=2p- 1.如果p<1/2,g(f)i在f中单调递减*= 这是最好的决定。在p>1/2的情况下,g(f)单调增加,因此,全投资f*= 100是最好的。(ii)u(x)=lnx和henceg(f)=p ln(100+f)+q ln(100-f) 用导数eg′(f)=p100+f-q100- f=100(p- q)-f10000+f(0≤ F≤ 100).在这种情况下,g(f)单调增加直到f=100(p- q) 然后单调递减。所以最好的投资选择是F*= 100(p- q) 如果p≥ q、 如果p<q,我们有100(p- q) <0。因此f*= 0将是最佳投资选择。不是贝尼。例1.3中效用函数u(x)=x的玩家在概率为p>1/2的情况下面临资本完全损失的风险。效用函数u(x)=lnx的玩家永远不会经历资本完全损失。例1.4。分析了效用函数u(x)=x的投资者在例1.3中的下注问题。

20
可人4 在职认证  发表于 2022-4-24 19:23:38
代表收益的效用函数通常是“凹”的,这意味着当参考量较小时,边际效用收益比参考量较大时更高。作为说明,假设u:(0,∞) → R是一个可微效用函数。然后导数u′(x)代表边际效用值atx。如果导函数为7,则u是凹的→ u′(x)随x.4单调减小。对数函数f(x)=ln x具有严格递减的导数f′(x)=1/x,因此是凹效用的一个(重要)例子。利润和成本。在专业游戏中,我假设玩家的目标是最大化他们的效用ui。在成本博弈中,人们试图尽可能地降低自己的效用。备注1.8。利润博弈和成本博弈的概念是密切相关的:与公用事业UIA的利润博弈在形式上等同于与公用事业ci的成本博弈=-用户界面。术语学。一个有N个玩家的游戏叫做N人游戏。如果N的基数为N=|N |,则N人博弈也被简化为N人博弈。两人游戏的特殊情况是基本的,我们将在后面看到。决策和战略。为了追查特工的身份∈ 在一场游戏中,经纪人可以从一系列策略中选择一种策略。联合战略选择=(si | i)∈ N) 通常会影响游戏的发展。我们用一个著名的博弈论谜题来说明这种情况:例1.5(囚徒的伊莱玛)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-6 01:15