你好,欢迎来到经管之家 [登录] [注册]

设为首页 | 经管之家首页 | 收藏本站

  • 博弈论基础

    [Money=30]博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论(gametheory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。在前面几章中,除了寡头市场外,无论是消费者的个人效用函数,还是厂商的利润函数,都只依赖于他自己的选择,而与其他人的选择无关。在这里,经济作为一个整体,各个经济主体的选择是相互影响的。但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。这个参数就是价格。除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。而在本章所介绍的博弈论中,消费者的个人效用函数或厂商的利润函数不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。某一消费者或厂商的最优选择是其它某一些经济主体选择的函数。博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。行动是指参与人的决策变量。战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。结果是指博弈者感兴趣的要素的集合。均衡是所有参与人的最优战略或行动的组合。上述概念中,参与人、行动、结果统称为博弈规则。博弈分析的目的是使用博弈规则决定均衡。二、博弈的分类可以从不同的角度对博弈进行分类。根据博弈者选择的战略,可以将博弈分成合作博弈(cooperativegames)与非合作博弈(non-cooperativegames).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到竞争对手可能采取的行为的条件下,独立地进行产量与价格的决定,则称这种博弈为非合作博弈。根据参与人行动的先后顺序,可以将博弈分成静态博弈(staticgame)与动态博弈(dynamicgame)。静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(gamesofcompleteinformation)和不完全信息博弈(gamesofincompleteinformation)。完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下进行的博弈就是不完全信息博弈。在以下的几节中,首先介绍非合作博弈,然后介绍合作博弈。而非合作博弈的介绍又分成四种情况分别介绍。这四种情况是:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。第二节完全信息静态博弈一、占优战略均衡一般来说,由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数,因而每个参与人的最优战略选择依赖于所有其他参与人的战略选择。但在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。换句话说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominantstrategies)。以博弈论中最著名的囚徒困境(prisoner’sdilemma)为例。两个合伙作案的犯罪嫌疑人被抓住了。警方怀疑他们作了许多的案子,但除了其中的一小部分外,警方手中并没有他们作案的确切证据,因而对这两个犯罪嫌疑人犯罪事实的认定及相应的量刑取决于他们自己的供认。假定警方对两名犯罪嫌疑人实行隔离审讯,二者无法订立攻守同盟。同时警方局明确地分别告诉这两名犯罪嫌疑人,他们面临着来以下后果。即如果犯罪嫌疑人与其同伙都供认其全部犯罪事实,那么,由于其罪行的严重性,两人各判8年徒刑。如果某一犯罪嫌疑人供认其全部犯罪事实,而其同伙抵赖,则供认者坦白从宽,从轻判处1年徒刑,而不供认者抗拒从严,从重判处10年徒刑。如果两个犯罪嫌疑人都不供认警方所不知道的犯罪事实。那么,根据已经掌握的证据,只能判处他们每人2年徒刑。表7-1囚徒困境囚徒B坦白抵赖囚徒A坦白-8,-8-1,-10抵赖-10,-1-2,-2这两个犯罪嫌疑人所面临的后果可以用表7-1来表示。表中,正数值表示参与人有所得,负数值表示参与人有所失。在表7-1中,每个犯罪嫌疑人都有两种可供选择的战略:坦白或抵赖。但不论同伙选择什么战略,每个犯罪嫌疑人的最优战略是坦白。以犯罪嫌疑人A为例。当犯罪嫌疑人B选择坦白时,A如也选择坦白,则被判处8年徒刑,A如选择抵赖,则将被判处10年徒刑。因而A选择坦白比选择抵赖好。当犯罪嫌疑人B选择抵赖时,A如选择坦白,则被判处1年徒刑,A如选择抵赖,则将被判处2年徒刑。因而A选择坦白还是比选择抵赖好。因此,坦白是犯罪嫌疑人A的占优战略。对于犯罪嫌疑人B来说,坦白同样也是他的占优战略。在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与人的占优战略的基础上达到均衡,这种均衡称为占优战略均衡。在表7-1中,“A坦白,B也坦白”就是占优战略均衡。应该指出的是,占优战略均衡只要求所有的参与人是理性的,而并不要求每个参与人知道其他参与人也是理性的。因为,不论其他参与人是否理性,占优战略总是一个理性参与人的最优选择。在表7-1中,如果每个犯罪嫌疑人都选择抵赖,则每人将被判处2年徒刑。对于两个犯罪嫌疑人来说,这显然比每人判处8年徒刑要好。但由于AB两人均从个人角度出发,如果不存在某种约束,他们不可能在“A和B一起抵赖”的基础上达到均衡。囚徒困境反映了一个深刻的问题,这就是个人理性与团体理性的冲突。微观经济学的基本观点之一,是可以通过市场机制这只“看不见的手”,在人人追求自身利益最大化的基础上达到全社会资源的最优配置。囚徒困境是对上述基本观点的挑战。二、重复剔除的占优战略均衡在绝大多数博弈中,占优战略均衡是不存在的。尽管如此,在有些博弈中,我们仍然可以用占优的逻辑找出均衡。表7-2按按钮对于吃食量的影响按按钮的猪吃到的猪食数量大猪小猪大猪4单位4单位小猪7单位1单位两猪同时5单位3单位以博弈论中另一个著名的智猪博弈(boxedpigs)为例。猪圈里有两头猪,大猪和小猪。猪圈的一头有一个猪食槽,另一头安装着一个控制着猪食供应的按钮。按一下按钮,将有8个单位的猪食进入猪食槽,供两头猪食用。可供大猪和小猪选择的战略有两种,自己去按按钮,或者等待另一头猪去按按钮。如果某一头猪作出自己去按按钮的选择,它必须付出下列代价:第一,它需要支付相当于2个单位猪食的成本;第二,由于按钮远离猪食槽,它将成为猪食槽边的后到者,从而减少能够吃到的猪食数量。具体情况如表7-2所示。表7-3智猪博弈小猪按按钮等待大猪按按钮3,12,4等待7,-10,0智猪博弈的后果如表7-3所示。表中的数字表示不同情况下每头猪所吃到的猪食数量减去按按钮的成本之后的净支付水平。表7-3表明,在这个博弈中,无论大猪选择什么战略,小猪的占优战略均为等待。而对大猪来说,其最优战略依赖于小猪的选择。如果小猪选择等待,大猪的最优战略是按按钮;如果小猪选择按按钮,则大猪的最优战略是等待。换句话说,大猪没有占优战略。什么是这一博弈的均衡解呢?假定小猪是理性的,它肯定会选择自己的占优战略——等待。再假定大猪知道小猪是理性的,则大猪会正确地预测到小猪会选择等待,根据小猪的这一选择,大猪选择了在此前提下自己的最优战略——按按钮。在这种情况下大猪和小猪的支付水平分别是2单位和4单位。这是一个多劳不多得、少劳不少得的均衡。在寻找智猪博弈的均衡解时,我们所使用的做法可以归纳如下:首先找出某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略的新的博弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;重复进行这一过程,直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合,就是这个博弈的均衡解,称为“重复剔除的占优战略均衡”(iterateddominanceequilibrium).这里所说的劣战略(dominatedstrategies),是指在其他博弈参与人战略为既定的条件下,某一参与人可能采取的战略中,对自己相对不利的战略。严格劣战略(strictlydominatedstrategies)则是指:无论其他博弈参与人采取什么战略,某一参与人可能采取的战略中,对自己相对不利的战略。在智猪博弈中,我们首先剔除了小猪的严格劣战略“按按钮”。在剔除掉小猪的这一选择后的新的博弈中,小猪只有等待一个战略,而大猪有两个战略可供选择。我们再剔除新博弈中大猪的严格劣战略“等待”,从而达到重复剔除的占优战略均衡。在现实生活中有许多智猪博弈的例子。例如,在股份公司中,股东承担着监督经理的职能。但不同的股东从监督中得到的收益大小不一样。在监督成本相同的情况下,大股东从监督中得到的收益显然多于小股东。因此,股份公司中监督经理的责任往往由大股东承担,小股东则搭大股东的便车。与前面讨论的占优战略均衡相比,重复剔除的占优战略均衡不仅要求博弈的所有参与人都是理性的,而且要求每个参与人都了解所有的其他参与人都是理性的。在上例中,如果大猪不能排除小猪按按钮的可能性,按按钮就不一定是大猪的最优选择。三、纳什均衡纳什均衡(Nashequilibrium)是指这样一种均衡。在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略策略决定的情况下,他选择了最优战略。纳什均衡是完全信息静态博弈解的一般情况。构成纳什均衡的战略组合一定是在重复剔除严格劣战略过程中无法被剔除的战略组合。在占优战略均衡中,无论所有其他参与人选择什么战略,一个参与人的占优战略都是他的最优战略。显然,这一占优战略也必定是所有其他参与人选择某一特定战略时该参与人的最优战略。因此,占优战略均衡一定是纳什均衡。在重复剔除的占优战略均衡中,最后剩下的唯一战略组合,一定是在重复剔除严格劣战略过程中无法被剔除的战略组合。因此,重复剔除的占优战略均衡也一定是纳什均衡。表7-4性别战女方看足球逛商店男方看足球3,10,0逛商店0,01,3纳什均衡所包括的情况远不止占优战略均衡和重复剔除的占优战略均衡。以博弈论中经常提到的性别战(battleofthesexes)为例。谈恋爱中的男女通常是共渡周末而不愿意分开活动的。但对于周末干什么,男女双方各自有着自己的偏好。男方喜欢看足球比赛,女方喜欢逛商店。不同选择下男女双方的得失见表7-4。在这个博弈中,存在着两个纳什均衡。男女双方或者一起去看足球,或者一起去逛商店。如果没有进一步的信息,我们无法确定男女双方在上述博弈中会作出什么选择。与重复剔除的占优战略均衡一样,纳什均衡不仅要求博弈的所有参与人都是理性的,而且要求每个参与人都了解所有的其他参与人都是理性的。第三节完全信息动态博弈一、子博弈精炼纳什均衡在动态博弈中,参与人的行动有先后顺序,而且后行动的参与人在自己行动之前可以观测到先行动者的行动,并选择相应的战略。由于先行动者拥有后行动者可能选择战略的完全信息,因而先行动者在选择自己的战略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。表7-5房地产开发博弈(静态)B开发不开发A开发-3,-31,0不开发0,10,0以某一房地产开发博弈为例,表7-5显示了静态条件下双方参与人的得失。房地产开发商A是先行动者。在行动之前,A对竞争者B的战略进行了预测。在行动开始前的A看来,如果不计得失,B有四种战略可选择。第一,无论A是否开发,B都要开发。第二,如果A开发,B也开发;如果A不开发,B也不开发。表7-6A对B的预测B开发,开发开发,不开发不开发,开发不开发,不开发A开发-3,-3-3,-31,01,0不开发0,10,00,10,0第三,如果A开发,B就不开发;如果A不开发,B就开发。第四,无论A是否开发,B必定不开发。将B可能采取的选择与表7-5中博弈双方相应选择的得失结合起来,可以得出表7-6。在表7-5中,存在着两个纳什均衡,即(A开发,B不开发)和(A不开发,B开发)。而在B可能选择的战略中,战略一虽然包括了上述后一种纳什均衡,但没有包括前一种纳什均衡;战略四虽然包括了上述前一种纳什均衡,但没有包括后一种纳什均衡;至于战略二,则上述两种纳什均衡都没有包括;只有战略三包括了上述两种纳什均衡。换句话说,如果B选择战略三,那么,不论A作出什么选择,B的回应都达到纳什均衡。而在给定B会采取战略三(即如果A开发,B就不开发;如果A不开发,B就开发)来回应A的选择的前提下,开发是A的占优战略。因而A选择了开发。以上的分析方法,称为子博弈精炼纳什均衡(sub-gameperfectNashequilibrium)。子博弈是原博弈的一部分,它本身可以作为一个独立的博弈进行分析。例如,在表7-5中,每一列或每一行都是一个子博弈。任何博弈本身则被称为自身的一个子博弈。只有当某一战略组合在每一个子博弈(包括原博弈)上都构成一个纳什均衡,这一战略组合才是子博弈精炼纳什均衡。仍然以前面提到的房地产开发博弈为例,这里涉及到包括原博弈在内的三个子博弈。由于A是先行动者,那么,在A选择了开发之后,B的回应构成了子博弈甲,如表7-5的第一行,这里的纳什均衡是A开发,B不开发。在A选择了不开发之后,B的回应也构成了子博弈乙,如表7-5的第二行,这里的纳什均衡是A不开发,B开发。而整个表7-5,则表示A在有可能选择开发或不开发的情况下,B的回应。它既是原博弈,又是自身的子博弈。这里存在着本段中提到的两个纳什均衡。而前面提到的B的四种战略中,只有战略三在子博弈甲、乙中都构成纳什均衡,其它的战略至少在子博弈甲、乙之一中不构成纳什均衡,因而这一博弈中唯一的子博弈精炼纳什均衡,就是(开发,{不开发,开发}),即作为后行动者的B选择战略三,而作为先行动者的A选择开发。就特定情况而言,除了(开发,{不开发,开发})之外,参与人也可以选择其它战略。在上述房地产开发博弈中,在A选择开发时,无论B选择战略三还是战略四(即,无论A是否开发,B必定不开发),其结果——A开发,B不开发——都是构成纳什均衡的。而子博弈精炼纳什均衡方法所要剔除的,正是这种只在特定情况下是合理的,而在其它情况下不合理的战略组合。二、重复博弈以上讨论的动态博弈有这样一个特点。这就是,参与人在前一个阶段的选择将决定随后的子博弈的结构。在上述房地产开发博弈中,子博弈甲不同于子博弈乙。当A选择了开发后,子博弈乙就被排除了。这样的动态博弈称为序贯博弈(sequentialgames)。动态博弈中另外一类是所谓的重复博弈(repeatedgames)。顾名思义,重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为阶段博弈(stagegame)。影响重复博弈均衡结果的主要因素,是博弈重复的次数和信息的完备性。重复次数的重要性来自参与人在短期利益和长期利益之间的权衡。当博弈只进行一次时,每个参与人都只关心一次性的支付;但如果博弈重复多次,参与人可能会为了长远利益而牺牲眼前利益,从而选择不同的均衡战略。就信息的完备性而论,当一个参与人的支付函数还不为其他参与人所知时,该参与人可能有积极性建立一个良好的声誉以换取长远利益。在这里,我们只讨论博弈重复的次数。表7-7产品定价博弈B低价高价A低价24,2440,8高价8,4032,32我们用一个产品定价博弈的例子来分析重复博弈。表7-7显示了这一博弈的有关情况。该表表明,在一次性的完全信息静态博弈中,两个参与人A与B均有占优战略,占优战略均衡为双方都定低价。而一次性博弈意味着没有人能够对其他参与人的行为进行奖励或报复。而在动态的重复博弈中,所有参与人过去的行为都是观测得到的,因而某一参与人可以通过自己在本阶段博弈中的选择,来回应其他参与人在以前的阶段博弈中的行为。以产品定价博弈为例。如果上一次阶段博弈中,B选择了高价,使得也选择了高价的A得到了好处,那么A可以在本阶段博弈中继续选择高价作为对B的奖励。如果在上一次阶段博弈中,B选择了低价,使得选择了高价的A受到了损失,那么A可以在本阶段博弈中选择低价作为对B的报复。博弈重复的次数对参与人的选择有什么样的影响呢?我们分两种情况来讨论。先看博弈重复次数无限时的情况。以表7-7所举的产品定价博弈为例。如果B选择与A合作维持产品高价,则B各阶段所得是(32,32,32,32...);如果B选择不与A合作,并在第一阶段通过选择低价使得选择高价的A受到损失,A则在以后各阶段的博弈中选择低价以报复,则B各阶段所得为(40,24,24,24...)。换句话说,B在第一高等博弈中因不与A合作而得到的额外好处,将因为A在以后各阶段所采取的报复性选择而抵消。重复博弈若干次后,B的不合作态度将导致得不偿失的后果。在这里,A所采取的战略称为冷酷战略(grimstrategies)。按照这种战略,A起初选择合作;但如果B在某一阶段博弈中选择不合作的话,A将永远选择不合作。A这样做的理由是:选择不合作(低价),他各阶段的所得是24;而选择合作(高价),他各阶段的所得少于24,因为B在某一阶段博弈中的不合作排除了双方合作获得双赢的可能。因此,A有坚持冷酷战略的积极性。而B为了减少损失,也就只能一直不合作下去。换句话说,冷酷战略意味着任何一个参与人的一次性不合作将触发永远的不合作。在这种情况下,重复博弈的所有参与人慑于冷酷战略的严重后果,有积极性维持合作。再看博弈重复次数有限时的情况。博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略——给自己的产品制定低价,从而构成与完全信息静态博弈相同的占优战略均衡。所有参与人在最后阶段博弈中都会不约而同地选择低价战略,这意味着无论B在倒数第二阶段——即最后阶段以前的那个阶段——博弈中采取什么战略,A在最后阶段都将采取低价战略。因此,在倒数第二阶段中,B就没有必要因为担心A的报复而采取高价战略。换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,n次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复n次。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。在这里,阶段博弈纳什均衡的唯一性是一个重要条件。如果纳什均衡是唯一的,上述结论就不一定成立。三、动态博弈战略行动在动态博弈中,参与人为了使得其他参与人的选择对自己有利,往往采取一些行动来影响其他参与人对于自己行为的预期。这些行为称为战略行动(strategicmove)。以下是一些战略行动的例子。1.首先行动优势首先行动优势(first-moveradvantage)是指,在博弈中首先作出战略选择并采取相应行动的参与人可以获得较多的利益。例如,在前面提到的性别战中,存在着两个纳什均衡,即两人一起看足球比赛或逛商店。男方偏好看足球比赛,而女方偏好逛商店。在这种情况下,男方仅仅提出要看足球比赛是不够的,他应该采取行动,先买好足球票。从而使女方因感到“男朋友十分想看这场比赛”或因感到“买球票不容易,不看可惜”而接受两人一起看足球比赛的选择。2.确实可信的威胁表7-8房地产开发博弈(B承诺后)B开发不开发A开发-3,-31,-5不开发0,10,-5确实可信的威胁(crediblethreat)是指,博弈的参与人通过某种行动改变自己的支付函数,从而使得自己的威胁显得可信。参与人为改变博弈结果而采取的措施称为承诺(commitment)。表7-9A对B的预测(B承诺后)B开发,开发开发,不开发不开发,开发不开发,不开发A开发-3,-3-3,-31,-51,-5不开发0,10,-50,10,-5我们再来看前面提到过的房地产开发博弈。在这一例子中,B所选择的战略一(无论A是否开发,B都要开发)之所以不是子博弈精炼纳什均衡,是因为存在着如同表7-5和表7-6所表示的支付函数。如果A在作出选择之前,B与某一客户签订合同,规定B在一定期限内向客户交付一定面积的住房,如果B不能按时履约,则赔偿客户5单位货币。有了这样一个承诺,表7-5就变成表7-8,在完全信息静态博弈下,B就有了占优战略——开发。因而B的第一种战略——无论A是否开发,我都要开发——就成为确实可信的威胁。表7-6就变成表7-9,因而这一博弈的子博弈精炼纳什均衡,也就从原来的(开发,{不开发,开发})变成现在的(不开发,{开发,开发})。第四节不完全信息静态博弈前面介绍的博弈都包含一个基本假设,即完全信息假设。按照这一假设,每个参与人对所有其他参与人(对手)的类型、战略和支付函数都有精确的了解。但是,在许多情况下,参与人对对手的了解往往是不够精确的。这种情况下的博弈就是不完全信息博弈。表7-10市场进入博弈A高成本低成本默许阻挠默许阻挠B进入40,50-10,030,100-10,140不进入0,3000,3000,4000,400举例来说,某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,那么,正如表7-10后两列所表示的,A企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡——A阻挠,B不进入。如果阻挠的成本高,那么,正如表7-10前两列所表示的,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡——A默许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在上述例子中,阻挠成本就是A的私人信息。高阻挠成本和低阻挠成本则是两种不同的类型。显然,在这里,B所遇到的,是不确定性条件下的选择问题。因为B不仅不知道A的类型(是高还是低),而且不知道不同类型的分布概率。解决这类问题的方法之一,就是把不确定性条件下的选择转换为风险条件下的选择。在风险条件下,B虽然不知道A的类型,但可以知道不同类型的分布概率。将不确定性条件下的选择转换为风险条件下的选择,称为海萨尼转换(theHarsanyitransformation)。按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是公共知识。用上例来说,公共知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率,而且意味着A也清楚B知道这一概率。通过海萨尼转换,不完全信息博弈变成了完全但不完美信息博弈(gamesofcompletebutimperfectinformation)。这里的不完美信息,就是指其他参与人只知道某一参与人某些方面类型的分布概率,而不知道该参与人在这些方面的真实类型。在上述转换的基础上,海萨尼提出了贝叶斯纳什均衡(BayesianNashequilibrium)。对此,可以作如下解释:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。贝叶斯纳什均衡是一种类型依赖型战略组合。在给定自己的类型和其他参与人类型的分布概率的条件下,这种战略组合使得每个参与人的期望效用达到了最大化。回到上面提到的市场进入的例子。在这个例子里,对于挑战者B来说,原垄断者A在阻挠成本方面,存在着两种可能性:高成本或低成本。B不知道A的阻挠成本究竟是高是低,但他知道A在这两种不同阻挠成本下会作出的选择,以及不同阻挠成本(类型)的分布概率。假定高成本的概率为x,则低成本的概率为(1-x)。如果A的阻挠成本高,A将默许B进入市场;如果A的阻挠成本低,A将阻挠B进入市场。在这两种情况下,如表7-10所示,B进入的支付函数分别是得到40和失去10。因此,B选择进入所得到的期望利润为40x+(-10)(1-x),选择不进入的期望利润为0。简单的计算表明,当A阻挠成本高的概率大于20%时,挑战者B选择进入得到的期望利润大于选择不进入的期望利润。此时,选择进入是B的最优选择。此时的贝叶斯纳什均衡为,挑战者B选择进入,高成本原垄断者选择默许,低成本原垄断者选择阻挠。第五节不完全信息动态博弈在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。如上所述,在不完全信息条件下,博弈的参与人知道其他参与人可能有哪几种类型,也知道不同的类型与相应战略选择之间的关系。但他们并不知道其他参与人的真实类型。在不完全信息静态博弈中,我们是通过海萨尼转换,即通过假定其他参与人知道某一参与人的所属类型的分布概率,来得出博弈的贝叶斯纳什均衡结果的。而在不完全信息动态博弈中,问题变得更加简单。博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。他只是对这一概率分布有自己的主观判断,即有自己的信念。博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。并根据这种不断变化的信念,作出自己的战略选择。对应于不完全信息动态博弈的均衡概念是精炼贝叶斯均衡(perfectBayesianequilibrium)。这个概念是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。具体来说,精炼贝叶斯均衡是所有参与人战略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。采用上一节的例子,可以将贝叶斯规则的分析思路表达如下。挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是20%(此时A为了保持垄断带来的高利润,不计成本地拼命阻挠);如果A属于低阻挠成本类型,B进入市场时A进行阻挠的概率是100%。博弈开始时,B认为A属于高阻挠成本企业的概率为70%,因此,B估计自己在进入市场时,受到A阻挠的概率为:0.7×0.2+0.3×1=0.440.44是在B给定A所属类型的先验概率下,A可能采取阻挠行为的概率。当B进入市场时,A确实进行阻挠。使用贝叶斯法则,根据阻挠这一可以观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.7(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.44=0.32根据这一新的概率,B估计自己在进入市场时,受到A阻挠的概率为:0.32×0.2+0.68×1=0.744如果B再一次进入市场时,A又进行了阻挠。使用贝叶斯法则,根据再次阻挠这一可观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.32(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.744=0.086这样,根据A一次又一次的阻挠行为,B对A所属类型的判断逐步发生变化,越来越倾向于将A判断为低阻挠成本企业了。以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用。尽管A企业有可能是高成本企业,但A企业连续进行的市场进入阻挠,给B企业以A企业是低阻挠成本企业的印象,从而使得B企业停止了进入地市场的行动。应该指出的是,传递信息的行为是需要成本的。假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传递信息的目的。只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用。传递信息所支付的成本是由信息的不完全性造成的。但不能因此就说不完全信息就一定是坏事。研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作。理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性。这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人。如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事。gedion发表于2006-5-1818:05:00阅读全文(16)|回复(0)|引用通告(0)|编辑[/Money]

  • [转帖]纳什博弈论的原理与应用

     1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯•诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现---非合作博弈的均衡,即"纳什均衡"并不是一帆风顺的。1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯•诺依曼、列夫谢茨(数学系主任)、阿尔伯特•塔克、阿伦佐•切奇、哈罗德•库恩、诺尔曼•斯蒂恩罗德、埃尔夫•福克斯……等全都在这里。博弈论主要是由冯•诺依曼(1903-1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯•诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯•诺依曼遇到经济学家奥斯卡•摩根斯特恩(OskarMorgenstern),并与其合作才使博弈论进入经济学的广阔领域。1944年他与奥斯卡•摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯•诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈---"纳什均衡"应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的"放弃",使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为"纳什均衡"的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为"非合作博弈"的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维•盖尔之功,就在遭到冯•诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯•诺依曼的"最小最大原理"(minimaxsolution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯•诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的"经纪人",代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在"核心的刊物"上发表多少篇文章。按照这个标准可能纳什还不一定够资格。1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。  纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯•诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。囚犯的两难处境大理论中的小故事要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲"囚犯的两难处境"的例子,每本书上的例子都大同小异。博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,"由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。"斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择--坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当•斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁---3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为"纳什均衡",也叫非合作均衡。因为,每一方在选择策略时都没有"共谋"(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。"囚徒的两难选择"有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个"纳什均衡",也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。"纳什均衡"首先对亚当•斯密的"看不见的手"的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:"通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。"从"纳什均衡"我们引出了"看不见的手"的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,"纳什均衡"提出的悖论实际上动摇了西方经济学的基石。因此,从"纳什均衡"中我们还可以悟出一条真理:合作是有利的"利己策略"。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的"己所不欲勿施于人"。但前提是人所不欲勿施于我。其次,"纳什均衡"是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以"纳什均衡"是对冯•诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。从"纳什均衡"的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于"囚徒的两难处境"这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。价格战博弈:现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会"没事儿偷着乐"。在这里,我们可以解释厂家价格大战的结局也是一个"纳什均衡",而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个"纳什均衡"。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或"纳什均衡"可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalrygame)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:"把你自己的战略建立在假定对手会按其最佳利益行动的基础上"。事实上,完全竞争的均衡就是"纳什均衡"或"非合作博弈均衡"。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。污染博弈:假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入"纳什均衡"状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个"看不见的手的有效的完全竞争机制"失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。贸易自由与壁垒:这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个"纳什均衡",这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。

  • 奥克兰大学的博弈论handbook

    作者是johnhillas。英文版。这是目录:Chapter1.GeneralEquilibriumTheory31.Thebasicmodelofacompetitiveeconomy42.Walrasianequilibrium83.EdgeworthBoxes104.TheFirstandSecondFundamentalTheoremsofWelfareEconomics175.Exercises20Chapter2.NoncooperativeGameTheory281.NormalFormGames302.ExtensiveFormGames423.ExistenceofEquilibrium54Chapter3.Auctions591.Introduction602.TypesofAuction623.AnalysisoftheAuctionsI:PrivateValues664.Bibliography78

  • 基于博弈论的经济行为研究

    硕士论文《基于博弈论的经济行为研究》【作者中文名】[url=]刘焕蕊[/url];【导师】[url=]李宗诚[/url];【学位授予单位】[url=]苏州大学[/url];本文首先扼要介绍了十多年来我国旅游业的发展状况和主要存在的问题,问题主要表现为市场失灵和ZF失灵两个方面;接着主要简要阐述我国旅游经济活动中三类经济“行为人”的经济行为的意义和作用。然后根据成本理论和博弈成本理论知识,针对具体的经济“行为人”在旅游经济活动中的交易成本作了具体的分析和说明,为构建后面的博弈模型奠定了基础。主要的分析在第四部分,通过针对旅游经营者和旅游消费者,旅游经营者与ZF管理部门,旅游企业之间,主要的三类经济“行为人”之间构建博弈模型来分析旅游经济中存在问题的根源和具体的理论解决方法,最后得出我国旅游经营市场要畅通运行必须加强旅游资源价值估算和初始权界定理论研究,并界定开发权责问题;在遵循市场经济规律的前提下,加大ZF对旅游企业的环境、资金支持力度,提高其盈利能力并减弱外部经济的“溢出效应①”,为参与国际竞争...

  • [下载]Binmore《博弈论与社会契约:卷2公平博弈》

    GameTheoryandtheSocialContract,Vol.2:JustPlaying(EconomicLearningandSocialEvolution)byKenBinmore(Author)Hardcover:507pagesPublisher:TheMITPress(July17,1998)Language:EnglishReview"KenBinmore'sGameTheoryandtheSocialContractisthemostimportantworkinsocialphilosophysinceJohnRawls'TheoryofJustice.Itishighlyoriginal,insightful,andwillbeafocalpointforsocialtheory."--BrianSkyrms,DistinguishedProfessorofPhilosophyandProfessorofEconomics,UniversityofCalifornia,IrvineProductDescriptionInVolume1ofGameTheoryandtheSocialContract,KenBinmorerestatedtheproblemsofmoralandpoliticalphilosophyinthelanguageofgametheory.InVolume2,JustPlaying,heunveilshisowncontroversialtheory,whichabandonsthemetaphysicsofImmanuelKantforthenaturalisticapproachtomoralityofDavidHume.Accordingtothisviewpoint,afairnessnormisaconventionthatevolvedtocoordinatebehavioronanequilibriumofasociety'sGameofLife.ThisapproachallowsBinmoretomountanevolutionarydefenseofRawls'soriginalpositionthatescapestheutilitarianconclusionsthatfollowwhenorthodoxreasoningisappliedwiththetraditionalassumptions.Usingideasborrowedfromthetheoryofbargainingandrepeatedgames,BinmoreisledinsteadtoaformofegalitarianismthatvindicatestheintuitionsthatledRawlstowritehisTheoryofJustice.Writtenforaninterdisciplinaryaudience,JustPlayingoffersapanoramictourthrougharangeofnewanddisturbinginsightsthatgametheorybringstoanthropology,biology,economics,philosophy,andpsychology.Itisessentialreadingforanyonewhothinksitlikelythatethicsevolvedalongwiththehumanspecies.ContentsApologyviiSeriesForewordxviiReadingGuidexixAcknowledgmentxxivIntroduction:SettingtheScene10.1WhitherAway?10.2TheArtofCompromise10.2.1NonsenseuponStilts30.2.2SocialContracts40.2.3Reform60.2.4TheOriginalPosition80.2.5Bargaining130.3MoralPhilosophy150.3.1TraditionalPhilosophicalCategories160.3.2FindeSiècle170.4NoncooperativeGameTheory200.4.1TheUltimatumGame210.4.2Anomalies?29Document0.5CooperativeGameTheory380.5.1GamesinCoalitionalForm380.6NashProgram420.7Implementation491NuancesofNegotiation591.1RealisticBargainingModels591.2BargainingProblems60

  • [下载]Binmore《博弈论与社会契约:卷1公正博弈》

    GameTheoryandtheSocialContract,Vol.1:PlayingFair(Hardcover)byhttp://www.amazon.com/exec/obidos/search-handle-url?%5Fencoding=UTF8&search-type=ss&index=books&field-author=Ken%20Binmore">KenBinmore

  • [下载]Springer08《[帕累托最优、博弈论与均衡》(Pareto Optimality, Game Theory and Equilibria )

    ParetoOptimality,GameTheoryandEquilibria(SpringerOptimizationandItsApplications)byAltannarChinchuluun(Editor),PanosM.Pardalos(Editor),A.Migdalas(Editor),LeonidasPitsoulis(Editor)Hardcover:868pagesPublisher:Springer;1edition(July18,2008)Language:EnglishProductDescriptionThiscomprehensiveworkexaminesimportantrecentdevelopmentsandmodernapplicationsinthefieldsofoptimization,control,gametheoryandequilibriumprogramming.Inparticular,theconceptsofequilibriumandoptimalityareofimmensepracticalimportanceaffectingdecision-makingproblemsregardingpolicyandstrategies,andinunderstandingandpredictingsystemsindifferentapplicationdomains,rangingfromeconomicsandengineeringtomilitaryapplications.Thebookconsistsoftwenty-ninesurveychapterswrittenbydistinguishedresearchersintheaboveareas.ContentsPreface.....................................................VIIListofContributors........................................XVIIPartIGameandGameTheoryMinimax:ExistenceandStabilityHoangTuy......................................................3RecentAdvancesinMinimaxTheoryandApplicationsBiagioRicceri...................................................23OnNoncooperativeGames,MinimaxTheorems,andEquilibriumProblemsJohannesB.G.Frenk,G碼borKassay...............................53NonlinearGamesFerencSzidarovszky..............................................95ScalarAsymptoticContractivityandFixedPointsforNonexpansiveMappingsonUnboundedSetsGeorgeIsac.....................................................119CooperativeCombinatorialGamesImmaCuriel....................................................131AlgorithmicCooperativeGameTheoryXiaotieDeng,QizhiFang.........................................159ASurveyofBicooperativeGamesJes磚sM.Bilbao,JulioR.Fern碼ndez,NievesJim磂nez,JorgeJ.L磑pez...187CostAllocationinCombinatorialOptimizationGamesYannisMarinakis,AthanasiosMigdalas,PanosM.Pardalos...........217XIVContentsTime-DependentEquilibriumProblemsAntoninoMaugeri,CarmelaVitanza...............................249DifferentialGamesofMultipleAgentsandGeometricStructuresPanosM.Pardalos,VitaliyA.Yatsenko,AltannarChinchuluun,ArtyomG.Nahapetyan...........................................267ConvexityinDifferentialGamesValentinOstapenko...............................................307GameDynamicProblemsforSystemswithFractionalDerivativesArkadiiA.Chikrii...............................................349ProjectedDynamicalSystems,EvolutionaryVariationalInequalities,Applications,andaComputationalProcedureMonica朑abrielaCojocaru,PatriziaDaniele,AnnaNagurney.........387StrategicAuditPoliciesWithoutCommitmentKalyanChatterjee,SanfordMorton,ArijitMukherji..................407OptimalityandEfficiencyinAuctionsDesign:ASurveyRogerL.Zhan...................................................437PartIIMultiobjective,KKT,BilevelSolutionConceptsandanApproximationKuhn朤uckerApproachforFuzzyMultiobjectiveLinearBilevelProgrammingGuangquanZhang,JieLu,TharamDillon..........................457ParetoOptimalityDinhTheLuc...................................................481MultiobjectiveOptimization:ABriefOverviewMassimoPappalardo.............................................517ParametricMultiobjectiveOptimizationRentsenEnkhbat,JurgenGuddat,AltannarChinchuluun..............529PartIIIApplicationsTheExtendedLinearComplementarityProblemandItsApplicationsinAnalysisandControlofDiscrete-EventSystemsBartDeSchutter................................................541ContentsXVTrafficAssignment:EquilibriumModelsMichaelFlorian,DonaldW.Hearn.................................571InvestmentParadoxesinElectricityNetworksMetteBj鴕ndal,KurtJ鴕nsten.....................................593AlgorithmsforNetworkInterdictionandFortificationGamesJ.ColeSmith,ChurlzuLim.......................................609GameTheoreticalApproachesinWirelessNetworksMankiMin......................................................645MultiobjectiveControlofTime-DiscreteSystemsandDynamicGamesonNetworksDmitriiLozovanu................................................665AMilitaryApplicationofViability:WinningCones,DifferentialInclusions,andLanchesterTypeModelsforCombatGeorgeIsac,AlainGosselin.......................................759StaticsandDynamicsofGlobalSupplyChainNetworksAnnaNagurney,JoseCruz,FuminoriToyasaki......................799GameTheoryModelsandTheirApplicationsinInventoryManagementandSupplyChainAltannarChinchuluun,AthanasiaKarakitsiou,AthanasiaMavrommati...........................................833[此贴子已经被作者于2008-7-1912:22:08编辑过]

  • 股市博弈论

    前言以道氏理论、波浪理论、形态分析理论等为代表的传统技术分析理论,从道琼斯和艾略特以来基本处于停滞不前的状态,虽然内容也在不断丰富,但基本上是在同一层次上变换形式,并没有什么质的突破。作者认为,造成这种情况的原因在于,传统的技术分析理论都隐含了一个有问题的理论前提,它们的研究思路本质上都是在把股市看做是一个不受参与者自身行为影响的客观系统,而没有考虑到人的操作对股市的影响。作为一种近似,这样处理可以给初级研究带来方便,也可以产生一批有价值的成果,但这种不准确的近似不利于对市场进行深入研究。市场由千千万万投资人构成,他们相互作用相互影响,形成一个密切关联相互影响不可分割的整体,每个人的操作都必然的影响着股市的运动,特别是当资金量比较大的时候对市场的影响更大。在理论上,由于传统理论的近似比较粗略,不适合对股市运动规律进行深入研究,所以,有很多股市现象在传统理论中只能是知其然不知其所以然,无法给出合理的解释。如为什么波浪理论的时间之窗往往形成重要的关键点?为什么一定的K线组合可以作为买卖信号?这造成传统技术分析理论至今仍停留在原始的归纳总结阶段,不能上升到理论高度。这反过来又限制了对股市深层次规律的进一步概括总结,造成了技术分析研究的停滞不前。在实践方面,如果只是做个股评家说说话不进行操作,那这种简化的研究是可以的;如果自己的资金比较少,对市场影响不大,这种近似也还问题不大;但如果是资金量比较大,或者使用与自己类似的操作方法的人比较多,那么用这种理论来指导操作就有比较大的问题。传统理论没有给出在资金量比较大时操作方法的理论指导。本书彻底扬弃了传统技术分析的理论体系,而在博弈论的基础上重构了技术分析的理论。博弈论把股市看成一个竞局,投资人处于博弈对抗中,投资决策是一个博弈计算过程。博弈计算与人们习惯的按照科学规律思考问题不同,它面对的系统不是僵死按一种规律变化,而是有多种变化发展的可能的活的系统。所以博弈计算必须要有对手意识,考虑对手的存在,考虑到对手存在多种可能的选择,同时还要考虑到对手在计算时也会考虑到我的存在和我的多种选择的可能等等。博弈计算更符合股市决策的实际情况,所以,本书对股市规律的论述较传统的技术分析理论更清晰,且对操作更有指导意义。本书分为上中下三篇。上篇《理解股市》,主要是从博弈的角度把股市放到一个大背景下,通过与其它竞局的横向比较来揭示股市博弈的特性,使人对股市有一个完整的宏观把握。中篇《研究股市》,深入到股市内部,研究在股市的具体条件下衍生的博弈特点和规律。中篇又分为上下两部分,《理论篇》和《实战篇》。两篇的区别在于:《理论篇》主要研究股市博弈规律,而《实战篇》则主要从操作的角度考虑问题,把博弈规律变成实际的操作方法。《理论篇》中讨论了股市竞局局面、博弈规律;《实战篇》讨论了监测股市的指标工具、各种操作思路操作方法以及仓位管理方法等。中篇是股市研究的主要内容,本书只是开了一个头,还有大量的工作需要在实践中研究总结。下篇《战胜股市》讨论怎样在实战中运用这些规律和方法获取利润。兵法云,“知己知彼百战百胜”,中上篇所讨论的都是股市,属于知彼,下篇《战胜股市》所讨论的主要是操作主体的问题,属于知己。下篇主要涉及到人的自我约束和潜能的发挥,这些内容看似与股市较远,其实正是在股市实际操作中取得成功的关键,比中篇的股市实用知识更为重要。事实上,可以有解决了知己问题却没有完全解决知彼的投资家,但决不可能有参透了市场但却没有解决自我约束问题的成功者。打个比喻,上篇相当于应用引力理论和广义相对论等天体物理学理论讨论各种可能存在的星系结构及其性质,可以推导出如当星系中恒星数量和质量变化时星系的结构和性质会发生怎样的变化等知识,将太阳系的基本数据带入方程,可以得到类似太阳系这样的星系的结构和基本性质。中篇相当于太阳系的理论,它所讨论的不是抽象的恒星、行星和卫星,而是具体的太阳、地球和月亮,以及金星、木星、水星、火星、土星、天王星、海王星、冥王星等等。这些特定的星球都是在太阳系演化过程中的特定条件下形成的,任何天体力学理论都推不出这些具体的星系结构,只有实际观测才能知道。而这些具体的星系结构和性质又是与人类生活关系最密切的,一年365天,一月29.53天,太阳黑子有11年的活动周期等,都直接影响着人类的生活。至于遥远的星系中还存在别的什么结构奇特的星系固然对理论研究者来说是个非常有趣的问题,但对普通人来说则并不重要。《理论篇》相当于取太阳中心坐标的理论,研究者把自己置身于太阳系之外观察太阳系的运动。这在研究太阳系的结构和运动规律时是方便的,在向别人描述时也更容易理解,但如果要进行实际的天文观测,则仅有这样的描述就不够了。仰望天空,它的运动与太阳中心模型完全不一样,因为人不是站在太阳系之外,而是站在地球上的一个点上观察太阳系,太阳中心模型和实际观测不能直接对应,倒是托勒密的天体模型更接近直接观察的结果,因为它是以地球为中心的。要想在观测中应用太阳中心模型,还需要一次坐标转换,以地球为中心坐标描述星体的运动轨道。这相当于《实战篇》。天文学家和非专业人员的最大不同在于,常人理解的天文学中只有宇宙和星空,最多再加上望远镜,而天文学加理解的天文学则要丰富的多具体的多,它不仅包括天文学知识,还包括观测方法、观测设备以及气象知识,甚至还需要有心理学知识。比如一个天象的起始时间只是一瞬间,不同人在确定这一时刻时由于反应速度和行为习惯的不同,会有零点几秒的差异。这属于工程心理学的研究范围,与天文学没有直接关系,对非专业人员来说无关紧要,但对天文学家来说则是一个必须解决的重要问题,否则会影响到所有观测资料的价值。事实上,宇宙中的一切是遥远而抽象的,它只存在于人的思想中,而现实中看似与天文学毫无关系的观测方法、观测设备以及气象、心理学知识才是具体的,正是这一切支撑起了天文学的大厦,为人们的思想畅游宇宙提供了现实的基础。所以,对天文学家来说,这类和天文学没有直接关系的知识对实际观测的作用比天文知识本身更重要。同理,对一个不是站在市场之外,而是在实际操作中的投资人来讲,本书下篇所讨论的内容也比股市知识本身更为重要。类似的,也可以把这几部分内容比做:上篇——生理学,研究各种生物的生理活动;中篇·理论篇——基础医学,研究正常人生理活动的医学生理学和研究疾病的发生、发展的病理学;中篇·实战篇——医疗方法,包括药剂、手术、各种现代化的医疗方法以及按摩、针灸、气功、祝由等传统医疗方法;下篇——临床经验和知识,如病者心理的知识等。从实用角度讲,只要有后两部分就可以治病了,民间医学和传统医学基本上就处于这种状态;但要想让这些医疗方法和经验知识可以有效的传授和学习并不断发展,则必须系统的建立前两部分。本书的重点也在这两篇上。作为一种全新的股市技术分析理论,本书只是开了一个头,还有大量研究工作等待去做。相信“股市博弈论”将伴随着中国证券市场的发展而逐步发展,并对中国证券市场的完善做出贡献。

  • [下载]《动态非合作博弈论》(Dynamic Noncooperative Game Theory )

    DynamicNoncooperativeGameTheory(ClassicsinAppliedMathematics)(Paperback)byTamerBasar(Author),GeertJanOlsder(Author)Paperback:519pagesPublisher:SocietyforIndustrialandAppliedMathematics;2edition(January1,1999)Language:EnglishProductDescriptionRecentinterestinbiologicalgamesandmathematicalfinancemakethisclassic1982textanecessityonceagain.Unlikeotherbooksinthefield,thistextprovidesanoverviewoftheanalysisofdynamic/differentialzero-sumandnonzero-sumgamesandsimultaneouslystressestheroleofdifferentinformationpatterns.Thefirsteditionwasfullyrevisedin1995,addingnewtopicssuchasrandomizedstrategies,finitegameswithintegrateddecisions,andrefinementsofNashequilibrium.Readerscannowlookforwardtoevenmorerecentresultsinthisunabridged,revisedSIAMClassicsedition.Topicscoveredincludestaticanddynamicnoncooperativegametheory,withanemphasisontheinterplaybetweendynamicinformationpatternsandstructuralpropertiesofseveraldifferenttypesofequilibria;NashandStackelbergsolutionconcepts;multi-actgames;Braessparadox;differentialgames;therelationshipbetweentheexistenceofsolutionsofRiccatiequationsandtheexistenceofNashequilibriumsolutions;andinfinite-horizondifferentialgames.BookDescriptionThistextprovidesanoverviewoftheanalysisofdynamic/differentialzero-sumandnonzero-sumgamesandsimultaneouslystressestheroleofdifferentinformationpatterns.Fullyrevisedin1995,thiseditionfeaturesnewtopicssuchasrandomizedstrategies,finitegameswithintegrateddecisions,andrefinementsofNashequilibrium.ContentsPrefacetotheClassicsEditionxiPrefacetotheSecondEditionxiii1IntroductionandMotivation11.1PreliminaryRemarks11.2PreviewonNoncooperativeGames31.3OutlineoftheBook121.4Conventions,NotationandTerminology13PartI2NoncooperativeFiniteGames:Two-PersonZero-Sum172.1Introduction172.2MatrixGames182.3ComputationofMixedEquilibriumStrategies292.4ExtensiveForms:Single-ActGames362.5ExtensiveGames:Multi-ActGames452.6Zero-SumGameswithChanceMoves572.7TwoExtensions602.7.1Gameswithrepeateddecisions612.7.2Extensiveformswithcycles632.8Action-DependentInformationSets652.8.1Duels662.8.2Asearchlightgame662.9Problems702.10Notes753NoncooperativeFiniteGames:N-PersonNonzero-Sum773.1Introduction773.2BimatrixGames783.3N-PersonGamesinNormalForm883.4ComputationofMixed-StrategyNashEquilibriainBimatrixGames953.5NashEquilibriaofN-PersonGamesinExtensiveForm973.5.1Single-actgames:Pure-strategyNashequilibria1003.5.2Single-actgames:Nashequilibriainbehavioralandmixedstrategies1163.5.3Multi-actgames:Pure-strategyNashequilibria1183.5.4Multi-actgames:Behavioralandmixedequilibriumstrategies1263.5.5OtherrefinementsonNashequilibria1283.6TheStackelbergEquilibriumSolution1313.7Nonzero-SumGameswithChanceMoves1483.8Problems1533.9Notes1594StaticNoncooperativeInfiniteGames1614.1Introduction1614.2eEquilibriumSolutions1624.3Continuous-KernelGames:ReactionCurves,andExistenceandUniquenessofNashandSaddle-PointEquilibria1684.4StackelbergSolutionofContinuous-KernelGames1794.5ConsistentConjecturalVariationsEquilibrium1864.6QuadraticGameswithApplicationsinMicroeconomics1904.7BraessParadox2034.8Problems2054.9Notes210PartII5GeneralFormulationofInfiniteDynamicGames2155.1Introduction2155.2Discrete-TimeInfiniteDynamicGames2165.3Continuous-TimeInfiniteDynamicGames2245.4MixedandBehavioralStrategiesinInfiniteDynamicGames..2305.5ToolsforOne-PersonOptimization2335.5.1Dynamicprogrammingfordiscrete-timesystems2335.5.2Dynamicprogrammingforcontinuous-timesystems...2365.5.3Theminimumprinciple2415.6RepresentationsofStrategiesAlongTrajectories,andTimeConsistencyofOptimalPolicies2475.7ViscositySolutions2555.8Problems2605.9Notes2626NashandSaddle-PointEquilibriaofInfiniteDynamicGames2656.1Introduction2656.2Open-LoopandFeedbackNashandSaddle-PointEquilibriaforDynamicGamesinDiscreteTime266CONTENTSix6.2.1Open-loopNashequilibria2676.2.2Closed-loopno-memoryandfeedbackNashequilibria...2766.2.3Linear-quadraticgameswithaninfinitenumberofstages2886.3InformationalPropertiesofNashEquilibriainDiscrete-TimeDynamicGames2926.3.1Athree-persondynamicgameillustratinginformationalnonuniqueness2926.3.2Generalresultsoninformationallynonuniqueequilibriumsolutions2966.4StochasticNonzero-SumGameswithDeterministicInformationPatterns3036.5Open-LoopandFeedbackNashandSaddle-PointEquilibriaofDifferentialGames3106.5.1Open-loopNashequilibria3106.5.2Closed-loopno-memoryandfeedbackNashequilibria...3206.5.3Linear-quadraticdifferentialgamesonaninfinitetimehorizon3336.6ApplicationsinRobustControllerDesigns:H°°-OptimalControl3426.7StochasticDifferentialGameswithDeterministicInformationPatterns3506.8Problems3556.9Notes3617StackelbergEquilibriaofInfiniteDynamicGames3657.1Introduction3657.2Open-LoopStackelbergSolutionofTwo-PersonDynamicGamesinDiscreteTime3667.3FeedbackStackelbergSolutionUnderCLPSInformationPattern3737.4(Global)StackelbergSolutionUnderCLPSInformationPattern3767.4.1Anillustrativeexample(Example7.1)3767.4.2Asecondexample(Example7.2):Followeractstwiceinthegame3827.4.3LinearStackelbergsolutionoflinear-quadraticdynamicgames3857.4.4Incentives(deterministic)3927.5StochasticDynamicGameswithDeterministicInformationPatterns3967.5.1(Global)Stackelbergsolution3967.5.2FeedbackStackelbergsolution4027.5.3Stochasticincentiveproblems4037.6StackelbergSolutionofDifferentialGames4077.6.1Theopen-loopinformationstructure4077.6.2TheCLPSinformationpattern4127.7Problems4187.8Notes4218Pursuit-EvasionGames4238.1Introduction4238.2NecessaryandSufficientConditionsforSaddle-PointEquilibria.4248.2.1TheIsaacsequation4258.2.2Upperandlowervalues,andviscositysolutions4328.3Capturability4348.4SingularSurfaces4428.5SolutionofaPursuit-EvasionGame:TheLadyintheLake...4488.6AnApplicationinMaritimeCollisionAvoidance4518.7RoleDeterminationandanApplicationinAeronautics4568.8Problems4648.9Notes467AppendixAMathematicalReview471A.1Sets471A.2NormedLinear(Vector)Spaces472A.3Matrices473A.4ConvexSetsandFunctionals473A.5OptimizationofFunctionals474AppendixBSomeNotionsofProbabilityTheory477B.1IngredientsofProbabilityTheory477B.2RandomVectors478B.3IntegralsandExpectation480B.4NormsandtheCauchy-SchwarzInequality481AppendixCFixedPointTheorems483Bibliography485ListofCorollaries,Definitions,Examples,Lemmas,Propositions,RemarksandTheorems507Index515

  • 博弈论与经济行为 [美]冯·诺伊曼 摩根斯顿著 王文玉 王宇译

    【作 者】[http://book.lrbook.com/search?Field=2&sw=美"target="_blank">美]http://book.lrbook.com/search?Field=2&sw=冯"target="_blank">冯·http://book.lrbook.com/search?Field=2&sw=诺伊曼"target="_blank">诺伊曼http://book.lrbook.com/search?Field=2&sw=摩根斯顿"target="_blank">摩根斯顿著http://book.lrbook.com/search?Field=2&sw=王文玉"target="_blank">王文玉http://book.lrbook.com/search?Field=2&sw=王宇"target="_blank">王宇译【丛书名】http://book.lrbook.com/search?sw=20世纪经济学经典译丛&Field=5"target="_blank">20世纪经济学经典译丛【形态项】504【读秀号】000004830040【出版项】生活·读书·新知三联书店,2004【ISBN号】7-108-02152-8/F224.32/N986:1【原书定价】50.00(上下册)【主题词】http://book.lrbook.com/search?sw=对策论&Field=4"target="_blank">对策论http://book.lrbook.com/search?sw=应用&Field=4"target="_blank">应用http://book.lrbook.com/search?sw=经济学&Field=4"target="_blank">经济学【参考文献格式】[http://book.lrbook.com/search?Field=2&sw=美"target="_blank">美]http://book.lrbook.com/search?Field=2&sw=冯"target="_blank">冯·http://book.lrbook.com/search?Field=2&sw=诺伊曼"target="_blank">诺伊曼http://book.lrbook.com/search?Field=2&sw=摩根斯顿"target="_blank">摩根斯顿著http://book.lrbook.com/search?Field=2&sw=王文玉"target="_blank">王文玉http://book.lrbook.com/search?Field=2&sw=王宇"target="_blank">王宇译.博弈论与经济行为(上册).生活·读书·新知三联书店,2004.[img]

AB
CD
ABCDEFGHIJKLMNOPQISTUVWXYZ