热烈欢迎北京大学国家发展研究院唐方方教授于10月12日15点接受人大经济论坛的在线访谈活动。感谢唐老师抽出时间和大家进行在线的学术交流~大家现在可以在下面回复提问。欢迎大家热烈提问。PS:的问题提问者会获得50论坛币的奖励VIP,不止是论坛币!!!唐方方老师现任职务北京大学国家发展研究院教授;北大国际(BiMBA)教授;研究范围实验经济学,低碳经济与气候变化,博弈论与产业组织,电子商务及网络营销。教育背景1981-1985年,成都科技大学应用数学系本科,获运筹学理学学士学位;1985-1988年,上海交通大学管理学院硕士研究生,获系统工程工学硕士学位;1989-1990年,英国伯明翰大学经济系留学;1990-1991年,交通运输研究所(英国运输部与利兹(Leeds)大学联办)研究员;1991-1996年,波恩-伦敦经济学院-卢汶-巴黎-特拉维夫欧洲数量经济学博士项目,师从泽尔腾教授(ReinhardSelten)和海萨尼教授(JohnC.Harsanyi)(两位大师与纳什教授一起获1994年诺贝尔经济学奖),获数量经济学与信息学博士;工作经历1.1996-1997年,任以色列希伯来耶路撒冷大学社会科学院统计学系大学访问教授及理学部交互决策研究中心博士后研究员,与奥曼教授(RobertA.Aumann,2005年诺贝尔经济学纪念奖得主)以及ShmuelZamir教授等共同工作;2.1997-2001年,先后任教于新加波国立大学社会科学院经济学系和南洋理工大学南洋商学院应用经济学系;3.2001-2008年,任教于香港中文大学市场学系,2005-2008年,担任香港中文大学市场学系研究生管理委员会成员,2006-2008年担任香港中文大学-XianEMBA管理委员会成员和香港中文大学酒店与旅游管理学院委员会成员;4.2003年,受聘为南开大学特聘讲座教授、泽尔腾实验室学术主任;5.2005年,受聘为西南交通大学特聘讲座教授、西蒙·泽尔腾(HerbertSimon&ReinhardSelten)行为决策研究实验室学术主任;6.2007年,应林毅夫教授之邀回国筹建国家政策实验室,2008年夏天正式全职加入北京大学,担任中国经济研究中心国家政策实验室主任;7.2009年,受聘为浙江大学社会科学研究院特聘研究员;8.2010年,受聘为西南财经大学特聘讲座教授、经济学实验室学术主任;学术成果1997年获实验经济学会的HeinzSauermann奖(两年一度);入选2008年度教育部新世纪人才支持计划;在国际一流学报上发表了四十余篇经济学与管理科学方面的学术论文,其与Knetsch,Jack教授和RichardThaler教授合作的两篇论文:TheEndowmentEffectandRepeatedMarketTrials:IstheVickreyAuctionDemandRevealing?和DependenceofEconomicValues:FurtherEvidenceandSomePredictablePatterns.InMorrisAltman被前沿进展类丛书重印与收录全书;自1994年起,在香港财经日报《信报》社长林山木邀请下,为该报开设“经济观点”每周专栏,在华人财经界有广泛影响力;中文论文明码标价市场网上与网下价格离差研究,与宗计川合著,《经济学动态》,2010年第1期。我国铁矿石国际贸易定价权问题研究,与苏良合著,《战略管理》2010年第1期。科学发展观下的中国低碳经济与碳交易,与苏良合著,《中国经济》2010年第2期低碳经济规则下的世界与中国,与宗计川合著,《时事报告》,2009年第12期。经济学实验室研究方法论述,与宗计川合著,《财经问题研究》2009年10期。B2C市场的价格竞争研究综述及其对中国民航电子票务的启示,与傅浩合著,《经济问题探索》2006年02期。B2C电子商务市场两类零售商的价格比较:DC、DV市场的实证研究傅浩,与傅浩、刘磊磊合著,《消费经济》2006年4期。酒店网上预订价格离差实证研究——以北京、上海和广州三地为例,与宗计川,黄帏,马俊合著,《南开管理评论》2007年12月。从送礼的行为经济学说开去,《书城》2000年1月。
人民大学附中副校长王金战,在中国卓越校长(局长)峰会上,“炮轰”中国教育体制,抨击家庭教育和学校教育存在的弊疾,称中国的教育体制就是逼着“牛”和“马”赛跑。(中国新闻网 11月14日) 王金战说“好学生”好比就是“马”、“坏学生”好比就是“牛”。“马和牛赛跑,牛肯定输,但这不能够证明牛的无能,而是安排这种比赛的人的无能。”这句话说的多好呀!这个比喻多么的贴切呀!本来是风马牛不相及的事物,在中国的教育体制下扯在一起,听起来居然恰到好处。 中国教育这些年可谓是在冰雪道路上一直遭受着冷风吹,对教育体制的谩骂一直未断过,只有这样,它才能往更温暖的道路上延伸,才能推动对教育发展。学生本无好坏之分,只不过如今只重视成绩单的教育下,按照我们都不自觉的将先后顺序分成了好与坏。如今“好学生像马、坏学生像牛”把我们的教育市场变成了“赛兽场”,真是莫大的讽刺! 记得小时候看电影,每次电影开始的时候我总是习惯性的问爸爸,哪个是好人,哪个是坏人。爸爸总说自己看。等我长大了,爸爸告诉我,其实人不应该用好与坏来分的,每个人都有好的一面和不好的一面,正所谓人无完人。所以我觉得要做好中国的教育,第一点要做的就是把“好坏”这种形容词从我们人的身上拿下去,更不该出现在成长的学生身上。 教育体制绝非几个人说是什么就是什么,应该客观分析中国高等教育的现状。总是拿出有自己的国情来说辞,所以素质教育喊了好几年了,没啥显著效果。如果中国教育是一场“牛马大赛”,那么教育者们看到的只是马的速度,却没有看到牛的力量。钱学森先生走了,他留下的遗憾是:“为什么现在我们的学校总是培养不出杰出人才”。 教育已经成为社会的一种常态,应该以平常心对待,教育是我们人生必经的心理、人格、能力成熟的过程,这需要社会、家庭、学校共同努力,让学生们以一个“乐于为之”的态度接受,自我求索,那么我们的教育才会从“牛马大赛”转变为“人才培养场”。作者:万晓阳
转帖时有删节(我认为对解释无用的删掉了)恋爱中的人,也类似于走入了囚徒困境。如果双方都不变心,那是最好的结局,在天愿为比翼鸟,在地愿为连理枝嘛;如果都变了心,效果也不坏,你走你的阳关道,我过我的独木桥嘛;如果一方变了心,另外找到了更好的情侣,一方却还傻乎乎地忠贞不二,那么,另觅新欢的一方是幸福的,比两人都不变心的结果还幸福,因为他找见了更好的情人,而被抛弃的一方是最不幸的,比两人都变心的结果更不幸,因为他承担的压力既来自于对方的太幸福,也来自于自己的太不幸福。按照囚徒困境的分析结论,恋人最好是都防范对方一些,不奢望天荒地老,也不怕分道扬镳,怕只怕对方另有所爱而自己却还执迷不悟。所以,恋人最天真的选择是天荒地老,最理性的选择是分道扬镳,最糟糕的选择是被另有新欢的对方无情抛弃。既然天真的结局过于不真实,糟糕的结局过于心痛,那么唯一的出路就是要么不再付出爱,要么有所保留的爱,千万别把爱当成生命来对待。但是,现实中的恋人,大都希望天荒地老,没有谁愿意回头是岸,甚至被对方抛弃了也不死心。为什么会这样呢?因为纵爱的恋人与纵火的囚徒,其博弈状况有一个重大的不同。囚徒被警方抓住之后,是隔离审查的,因此无法订立功守同盟,即便能够订立,谁能保证自己或对方永远不毁约呢?恋人就不一样了,他们被爱情抓住以后,一般并不是隔离的,而是整天泡在一起。泡在一起干什么呢?除了发誓,还是发誓!人生发誓最多的时期,大概就是恋爱期。发什么誓呢?无非就是什么非你不娶啊非你不嫁啊的一类誓言罢了,目的只有一个,就是让对方相信自己能够天荒地老而此情不渝。他们希望彼此忠诚,从而换来一个好的博弈结果。而且为了防止对方变心,总要设法让对方相信,遇到我是你三生有幸,而我遇到你也是万世不毁。可是,世间没有什么誓约是永恒的。所有爱情的悲剧,都从背弃誓约开始,而天下又似乎没有没有誓约的爱情。天各一方的恋人,更不容易恋爱成功,像被隔离审查的囚徒一样,除了违背誓约,他没有更好的选择。所以,要想在恋爱中成为赢家,你最好是不遵守爱的诺言,如此才能走出“囚徒困境”。然而,这个结论在实际上是有问题的。因为,恋爱成功的人并不少见,厮守一生的人也不少见,你不能说他们都是勉强的。我相信,多数情侣的爱情生活过得还是可以的。那么,究竟是什么机制让他们信守誓约呢?这也可以从博弈论中找到答案。这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。“重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报。我把它叫做“以其人之道,还治其人之身”。“一报还一报”的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。为了决出一个结果来,爱克斯罗德又举行了第二轮竞赛,特别邀请了更多的人,看看能否从一报还一报策略那儿将桂冠夺过来。这次有62个程序参加了竞赛,结果是一报还一报又一次夺魁。竞赛的结论是无可争议的。好人,或更确切地说,具备以下特点的人,将总会是赢家。1.善意的;2.宽容的;3.强硬的;4.简单明了的。回过头来,再说恋爱。恋爱过程,一般都是重复博弈的过程,恋人有无数次的机会做到“以其人之道,还治其人之身。那么,在这个重复博弈的过程中,谁将是情场上的赢家呢?谁将在博弈中获胜呢?其实,胜利也总是属于那些善意的、宽容的、强硬的、简单明了的恋人们。反之,恶意的、尖刻的、软弱的、复杂的恋人们往往才会败北。善意而不是恶意地对待恋人,一般都能做到,无须多说。什么是宽容而不尖刻地对待恋人呢?我们看一些例子就知道了,幸福的恋人可能并不是忠贞不二的,当然也肯定不是见异思迁的,他们能够生活得愉快,关键是能够彼此宽容,既宽容对方的缺点,甚至也宽容他偶尔的不忠贞。而尖刻地对待恋人的人,对恋人的偶尔不忠贞总是不肯迁就的人,往往也都不会幸福。《倚天屠龙记》中的周芷若就是不肯宽容张无忌的逃婚之举,甚至要寻愁报复,最终只能遗憾终生了。什么是强硬而不软弱地对待恋人呢?其实就是在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身。这其中,当然是有限度的。黄蓉能够赢得郭靖的爱,就是因为她强硬而不软弱,对郭靖与华铮的亲热行为,从来都有极其强烈的敏感与斩钉截铁地回报,当然,每次发脾气都是有限度的,而且她能宽容郭靖。而穆念慈对杨康是过于软弱的,她没有掌握好强硬的原则,因而她的爱情生活注定是不幸的。什么是简单明了而不是山环水绕地对待恋人呢?实验证明,在博弈过程中,过分复杂的策略使得对手难于理解,无所适从,无法建立稳定的合作关系。事实上,在一个非零和的环境里,“城府深严”并不能显现“不测之威”,所谓“兵不厌诈”也并非有用的信条。相反,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。要让恋人明白你说的是什么,切忌让对方猜来猜去的,造成误会。因为不简单明了地对待恋人最终导致误会而分手的爱情悲剧并不少癌所以,爱情的手段,还是简单一点好,让恋人一看就明白,免去了很多猜谜的时间。至于剩下的时间嘛,哈哈,你们可以用来对天发誓啊!本来应该提防恋人才能在恋爱中获胜的简单博弈模型,因为有了不绝于耳的爱情誓言,更因为有了对善意的、宽容的、强硬的、简单明了的原则的把握和利用,人世间才有了很多幸福而美丽的爱情。我想,最高的博弈境界,应该是忘掉博弈,忘掉善意的、宽容的、强硬的、简单明了的等诸多博弈原则,而进入浑然忘我的境界。记得杨过在苦苦等待16年后,因为无法等来龙姑娘而纵身跳入寒潭,最后终于与小龙女团聚之后,深有感触地说了一句话:“看来,人,还是钟情一些好)是的,人,还是钟情一些好。真的。作者:江枫来源:风之恋
原标题:美报分析中国“见死不救”因何屡见不鲜 新华网北京10月26日电美国《华盛顿邮报》网站24日发表题为《中国的旁观者问题:人群漠视危境中的女子》的文章,认为“既不干涉别人也不帮助别人”的这种旁观者情结在中国十分普遍,问题的根源十分复杂。 在北京,一个26岁女子的脖子卡在两根护栏之间,旁观者采取了越来越广为人知的恶劣做法:坐视不管。监控录像画面显示,有十几个人打量这名女子,还拍了照片。她无助地在北京熙来攘往的街头待了半个小时,才有人施以援手。警察解救了她,并且送往医院。 在中国,旁观者不肯救助需要帮助的人,本周发生在北京的这起事件再次引发了国内争论和国人的自我反省。 2011年,佛山一名两岁女童小悦悦的可怕遭遇迫使中国正视旁观者问题。此事件发生后,美国《大西洋》月刊的詹姆斯·法洛斯写道:“在中国的所有外国人都听到过那句话,说的是要躲开别人的厄运引来的麻烦,所以不要帮助在公共场所受伤或遇到困难的人。” 中国的旁观者问题十分普遍,但又非常错综复杂,所有人都有自己的解释。也许最常见的一种就是“少管闲事”,既不干涉别人,也不帮助别人。张丽佳(音)在英国《卫报》上撰文解释说:“在我看来,症结在于一个描述思想状态的词汇:少管闲事,也就是说,如果不关你的事,就不要插手。在我们的文化中,缺乏一种向陌生人表示同情的意愿。我们从小接受的教育要求我们对关系网里的人———家人、朋友、同事———表达善意,但不会对陌生人这样做,特别是当这种善意有可能损害你的利益时。” 这种说法很令人信服,被普遍接受,尤其是关注中国的西方人的接受。大家比较有分歧的问题是,为什么中国的父母要教孩子少管闲事。有人认为是因为儒家思想,但日本和韩国也同样信奉儒家思想,却不存在这种臭名昭著的旁观者问题。 也许更有说服力的原因是中国激烈争夺资源的历史。数百年来,该国经常发生饥荒和政治动荡,最近一次是20世纪50年代末的大跃进和1966年-1976年的WHDGM。 隐含的意思是,同胞就是与你争夺生存机会的对手,而不是能向你提供支持的人。社会学家早就发现,如果基本资源匮乏,生存是一种竞争,那么人往往会变得比较自私,展现出更加反社会的行为。 另一种常见理论是,现行的一些东西容易把中国社会引向不利于好心人的方向。特别是1992年之后,中国经济进一步转型,经济成功被放在首要位置,就催生了一种超级资本主义竞争。 对于旁观者问题,中国国内最经常提出的解释是,你不应该帮助别人,因为他们可能会把你告上法庭。(作者麦克斯·费希尔)
作者:lshun最近某电视台正在热放三国演义,看到关羽败走麦城这一段,视友(看电视的朋友)争论起来,有人认为当时蜀国与魏、吴结怨很深,而荆州位于魏和吴夹击之中,必然失守,诸葛亮应该认识到这一点,但还是让关羽留守荆州,因此关羽之死诸葛亮应负一部分责任。笔者持不同的看法,从博弈论的角度论证关羽之死责任不在诸葛亮,而在于关羽自己不会用博弈论。正因为荆州位于魏和吴的夹击之中,时时处于不稳定之中,才有刘备不远千里去攻取西川,争取一个稳固的根据地。因此说守卫荆州确实是一件难事,但并不是说肯定失守。我们可以建立一个博弈模型来进行考虑。当时的实力分析:(1)魏、吴单独和关羽交锋。魏、吴单独和关羽比处于下风或至少势均力敌(从关羽和曹操的交战中可以看出这一点),任何一方和关羽力拼必然损兵折将,另一方则可趁虚而入,不仅能够取得荆州大部分地区,还避免了和关羽正面交锋的损失。设此时单独作战收益为X,因为单独作战,另一方会偷袭,从而自己得不到荆州,有X0。(2)双方都对关羽作战,则关羽首尾不能兼顾,关羽必败。但此时魏吴也会有一定的损失,取胜后为拼抢共同胜利的果实——荆州,双方也会再起战事,因此此时的收益必定不如本方不战而偷袭所得的收益,设此时双方的收益各为Y2(0(3)双方都不对关羽力拼,则偷袭不会成功,魏吴的收益均为零。我们可以把此博弈的支付矩阵列表如下力拼偷袭力拼(Y2,Y2)(X,Y1)偷袭(Y1,X)(0,0)注:XY2,更坏的结果莫过于自己力拼,对方偷袭,自己将遭受损失(X
ThePre-KernelasaTractableSolutionforCooperativeGamesAnExerciseinAlgorithmicGameTheorySeries:TheoryandDecisionLibraryC,Vol.45Meinhardt,HolgerIngmar2014,XXXIII,242p.8illus.,3illus.incolor.http://images.springer.com/sgw/books/medium/9783642395482.jpgAboutthisbook1,Characterizesafairdivisionruleofgametheorybyconvexanalysis2,Proposestractableformulatosolvefairdivisionproblemsinreallifesituations3,ProvidesalgorithmstoimplementvectorizedandparallelcomputerprogramsdesignedtosolvefairdivisionproblemsThispresentbookprovidesanalternativeapproachtostudythepre-kernelsolutionoftransferableutilitygamesbasedonageneralizedconjugationtheoryfromconvexanalysis.Althoughthepre-kernelsolutionpossessesanappealingaxiomaticfoundationthatletsoneconsiderthissolutionconceptasastandardoffairness,thepre-kernelanditsrelatedsolutionsareregardedasobscureandtootechnicallycomplextobetreatedasarealalternativetotheShapleyvalue.Comprehensibleandefficientcomputabilityiswidelyregardedasadesirablefeaturetoqualifyasolutionconceptapartfromitsaxiomaticfoundationasastandardoffairness.Wereviewandthenimproveanapproachtocomputethepre-kernelofacooperativegamebytheindirectfunction.TheindirectfunctionisknownastheFenchel-Moreauconjugationofthecharacteristicfunction.Extendingtheapproachwiththeindirectfunction,weareabletocharacterizethepre-kernelofthegrandcoalitionsimplybythesolutionsetsofafamilyofquadraticobjectivefunctions.ContentLevel»ResearchKeywords»ConvexAnalysis-CooperativeGameTheory-FairDivision-Fairness-Fenchel-MoreauConjugation-Pre-KernelSolutionsRelatedsubjects»Applications-EconomicTheory-GameTheory/MathematicalMethods-TheoreticalComputerScienceTableofcontents/Preface/SamplepagesDownloadTableofcontents(pdf,43kB)DownloadPreface1(pdf,45kB)DownloadSamplepages1(pdf,126kB)回复免费[hide][/hide]
博弈论精要(童话版)作者不详北望经济学园这篇寓言的作者把博弈论的一些基本的理论要素表现在这篇精悍的德文章中写得的确非常精妙,大家不妨耐心品位以下.那蚂蚁一直在旁边袖手微笑,待到此时,方才向狐狸说道:“狐兄豪气干云,小弟十分敬佩,倒想领略一番。”狐狸笑道:“不知蚁兄是要下里巴人还是要阳春白雪?”蚂蚁奇道:“下里巴人又如何?阳春白雪又如何?”狐狸缓缓说道:“下里巴人,至俗也,便是那乡间七旬老母,犹能听得手舞足蹈,击节而歌。却可惜譬如那山溪之水,来势汹汹,去也匆匆,入骨不过三分矣。”“那阳春白雪,又当如何?”狐狸道:“夫阳春白雪也,一望无垠,恰似大海潮生,初时广袤沉静,星光点点,不觉有异。然细心听处,远方隐隐似有天籁之音,像那闷雷滚过,却又悠扬有如长笛呜咽。待到听得更是真切之时,又有冰河破碎,清泉下流,入小河,汇大江,浩浩荡荡,终归大海,成了万丈涛声,千年不绝。”蚂蚁叹道:“怎信世间能有如此神奇之学问。你且先让我们听听那下里巴人罢)狐狸道:“博弈便是赌博。”绛仙不满道:“我说不准赌博的)蚂蚁摇手道:“姑娘莫恼,刚才既是我说要下里巴人,才有赌博这些鄙陋之事,须不要怪狐兄。”狐狸宛尔笑道:“姑娘也可把它看作打架。博弈之要义,先要知你是谁,要看你出手,然后我的还手必要是最有利自己。此为最基本。”“然高手过招,赢在料敌机先。纵然彼先出手,但既知我是谁,故出手后,必要想以我之能,当如何还手。彼出招与我还招,构成一个局面,非但可定我之生死,亦可以定彼之生死。彼必要选择对其最有利的局面为先着。是故彼未出手,我已知其意矣。”“那也未必)绛仙插嘴道,“我可以用对方从来没有见过的天山折梅手,对方防不胜防,便无从计算得失了。”“姑娘莫急,”狐狸道,“博弈论中,什么样的人用哪些招数,都是事先假定好的,也是大家各方都知道的,而且大家都知道大家知道的,却不允许你弄些稀奇古怪的旁门左道来捣乱。”“狐兄之意我已知之,”蚂蚁沉吟道,“于我方,最想知道的是对方如何出手,只要确定对方的招数,我便可以在此前提下选择于自己最有利的应对措施,得到一个我的盈利函数。然而对方也能想象到我盈利函数最大化下的出招,并因此计算他自己的所得。对方所出招必定是能使他盈利最大的招数。”“所以我便可知对方如何出招,对方也知我会如何应对。我若不如此应对,必定吃亏;对方若不如此出招,必定不能使其利益最大。”“Nod,”狐狸点头,“这些招数的组合,便成为了一条均衡路径。”“但凡事总要未雨绸缪,难保中途哪个出错,出了一个对他自己不利的臭招,你下一招也得针对新情况,解决新问题。”“所以,对于局中人任何招数,无论香臭也罢,如果真的发生了,我们就要根据前面蚁兄说的原则重新计算出招和应招。但是我们只朝前看,不算旧帐。”“如果每一个回合的每一招(无论这一招的出现如何愚蠢)我们都想好了其后的最佳出招和应招,即任何招数的出现,其后都有均衡路径;而最长的那条均衡路径,为整个博弈的均衡路径。那么,我们就算完事大吉,高枕无忧了。”但文书还是不服气:“你这个总是分了出招的先后顺序,所以别人出后你可以悠然地选择自己最优的。倘若你们都是同时出招,你看到对手出招时,你的剑也已经刺出,变不了招,岂非全都乱了套?”狐狸笑道:“文书想的周到。不过这个虽原理与前无异,倒也不好用话来说,且先等它一等。”“狐兄总是这么刚愎自用,”绛仙幽幽地叹口气,“俗话说,画虎画皮难画骨、知人知面不知心。你怎么就一定知道对方是什么人?”狐狸的心不觉颤了一下,因为很久以前自己也曾这般叹过,故而听来分外熟悉。不过这好比微风吹起的一丝涟漪,很快就从水面的这边,掠过水面的那边,然后就消失了。狐狸道:“按博弈论的要求,我们即便不知道对方一定是什么人,但却知道他属于哪一类人的概率。譬如是好人的概率是2/3,坏人的概率是1/3。能够知道这个,我们也可以作出选择了。”“但是......”绛仙欲言又止,因为她想到了1/3的那种可能,所以她并不满意狐狸的这个回答。但是她知道这已经是最好的回答。所以也不再问。狐狸笑着把眼睛从她身上扫过。“先前我们知道博弈中每个人是什么类型,然后我们可以算出每个人的盈利函数,每个人的决策,便是根据这盈利函数来的。现在我们只知道每个人属于哪个类型的概率,也还是一样按照刚才的步骤进行,只不过盈利函数成为数学期望值罢了。无论先出招还是后出招,都是一样希望自己的盈利期望最大。”文书嚅嗫道:“这个数学期望......”狐狸乐了:“大二数学便有这些东东,文书缘何记不得了?譬如你有1/3的可能得到9元钱,有2/3的可能得到18元钱,那你可能得到钱的数学期望便是9*1/3+18*2/3=15元。一个量乘以自身的概率,便是数学期望。”说到这里,狐狸不觉朝蚂蚁望了一下:“现在所说,虽力图下里巴人,但......”蚂蚁已知其意,挥手道:“下里巴人也不应是文书这样的幼儿园水平,概率的起码意义要懂)“换言之,”蚂蚁笑道,“即便国人素质低,狐兄要说的,也至多是阳春白雪,未可算是艳阳高照。在下还听的懂,尽管放心的说下去。”狐狸摇头道:“我要说的,就要说完了。现在我们在每个局中人的类型、每种类型局中人的各个招数上,都各假设一个概率,这些概率假设可全用符号来表示未知量,它们可以代表小数,也可以代表0,也可以代表1。”“但是引入这些符号之时,便要这些符号之间满足概率上的约束,譬如归一化约束。作为代数式,这种约束是可以满足的。”“此时,局中人选择策略,实质上便是计算概率。概率为0,便不选此策略;概率为1,便一定选此策略,概率若为小数,则为混合策略。”“令μa,μb,μc......为A,B,C......决策顺序中局中人所属类型的概率向量(各个决策顺序的局中人可同可不同,但我们只把顺序作为区分标准),βa,βb,βc......为分布在相应局中人各招数上的概率向量。注意,这儿μa,βa等都是向量,譬如μa=(μa1,μa2,......μan)。”“由此可以列出依照A,B,C......的先后次序决策时,各人的盈利代数式:Ua=fa(μa,μb,μc......;βa,βb,βc......βn)Ub=fb(μa,μb,μc......;βa,βb,βc......βn)......Un=fn(μa,μb,μc......;βa,βb,βc......βn)”“现在先不考虑出招较早的那些人,首先考虑最后一个决策者,他当取βn*使得Un*=maxfn(μa,μb,μc......;βa,βb,βc......βn)的βn*策略。此时,βn*βn可以表示为μa,μb,μc......;βa,βb,βc......βn-1的函数式。因此可得(n-1)个决策者的盈利式为:Un-1*=maxfb1(μa,μb,μc......;βa,βb,βc......βn-1)βn-1同样又确定βn-1*,并消掉βn-1变量,依次类推。最后确定μa*后,把μa*的数值代入其它所有人的策略代数式,即可求得依先后顺序计算的所有局中人均衡策略。此时,各人的盈利函数为代数方程,自变量概率向量在0-1区间又是连续的,因此完全可用解方程的办法来求极值。”“博弈论的全部内容,我便已说完了。”文书呆了一呆,并不相信自己的耳朵,急忙从包里抱出本5、600页厚的《博弈论》,嘴里嚷嚷道:“打死我都不信,那博弈论里面有什么完全信息、不完全信息、静态动态、占优弱劣、多重性、贝叶斯、有限、无限、颤抖手、序贯......那么多花样,你却拿这几句话来打发我,而且还是夹杂在童话故事中间)“文书说得有一定道理,”蚂蚁也接口道,“倘若有如此简单,这些经济学家也不成其为经济学家了。狐兄终究是年少,须知武学一道,总是要循序渐进,不好来半点浮躁的。”“我也如此说过他好多次了,他总是不听。”绛仙看了狐狸一眼,眼神中倒有一大半是怨色。不过狐狸最受不了这种温柔的责备,因为这个时候还招也罢,不还招也罢,大约都是显得自己愚蠢。“当真是没有这么简单,”狐狸暗自思忖,“譬如此时我便计算不出最优策略。”但是文书看到大家都支持他,狐狸又没有作声,顿时感到自己把天底下最充分的理由都占全了。于是打开书本,按书上的条目一条一条的问狐狸问题:“譬如你就没有说什么是完全信息)“这个区分重要么?”“不重要么?”狐狸火了:“本公子不知道什么是完全信息一样可以搞定)“哈哈哈哈,”文书大乐,“狐兄开什么玩笑?什么是完全信息这种最基本的东东都不懂,还要搞定?”它便笑着边转动脑袋望着蚂蚁和绛仙。不过蚂蚁和绛仙都没有笑。绛仙有点担心的望着狐狸。这使得文书很扫兴。蚂蚁镇静地道:“不妨等狐兄说完搞定的办法。”狐狸朝蚂蚁投去感激的一眼,转向文书:“你说说什么是完全信息,看我能否搞定?”文书便照着书本念了:“完全信息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性......”“Toosimple!toonaive)狐狸不等文书说完就打断了,“你所说的完全信息便是我以上方程中μa,μb,μc......均事先确定为0或1的情况)文书不料被如此打断,脸上一红,急忙又翻过一页:“那完美信息呢?”“摆脱)狐狸微笑中夹杂一丝嘲讽,“每次你说一个东东,请随即念它的书本定义,好节省大家的时间)文书有点恼羞成怒,但是它克制住了自己:“完美信息,便是指你对别人究竟是什么人和他曾经采取了什么具体行动都一清二楚,没有半点含糊)狐狸两眼朝天,懒懒地说:“就是μa,μb......βa,βb......都是0或者1。”“纳什均衡:给定别人不动,没有人有兴趣动?”“每个人盈利函数对于自己策略β的偏导小等于0。注意啊,这儿是偏导,可不是全导!全导可是要好多人都可能调整策略了。”狐狸答得太快了,文书决定把刚才蚂蚁的那个重磅炸弹扔出来:“怎么解决静态均衡的问题,你还一直没有说过呢)“Sigh!”狐狸啐了一声。“你一样列出各人盈利函数多项式;然后对个人赢利函数取对自己策略的偏导为零得出方程式,每个人都有自己的方程式。把这些方程式联解的解,就是静态博弈之均衡。”文书急忙去翻下页,嘴里叽里咕哝的,想是十分的不满意。它头也不抬:“子博弈精炼纳什均衡?”不过狐狸也不含糊:“μa,μb......βa,βb......都是0或者1时得出的均衡就是子博弈精炼纳什均衡)“不完全信息博弈?”“μa,μb......都是小数)“贝叶斯纳什均衡?”“只要我那代数式成立便是贝叶斯纳什均衡)“海萨尼转换?”“这是废话,不需要!你把μ换成β便是,符号变一变,计算上没有什么大不了的改进,画蛇添足)“不完全信息静态......”“什么静态都跟我刚才说的方法一样)“精炼贝叶斯均衡......”“停停!怎么个精炼法?”“哼哼,”文书感觉大是欣喜。它骄傲地说:“听好了!精炼贝叶斯均衡就是......修改后验概率。”它念了十分钟。蚂蚁和绛仙都糊涂了。“Robbish)狐狸不耐烦地道,“莫不是知道某β已经发生,来确定某μ是否合理?”“你按我那式子计算出来的均衡策略解集中,倘若没有某β,岂不就μ出了矛盾?当然是要修改μ,此时便需要进一步精炼;倘若解集中就有某β,则此均衡就没有问题,就是那精炼贝叶斯均衡吧?说起来不过就是以前μ已知,求β;变为β已知,求μ而已!何必再安些名词出来?”“那,不完美信息博弈的精炼贝叶斯均衡......”“同上)文书的脸色有些难看:“序贯均衡?”“呵呵,你那序贯均衡无非是不想让人们在非均衡路径上乱来,所以想着任何零概率事件都赋予正的小概率,好利用条件概率的性质到所有决策上是么?我那代数表达式在所有策略上都有概率符号,不管它是零概率也好还是其它什么也好,保证在哪儿都不会乱来!岂非不就是序贯均衡?”“颤抖手均衡呢?”“只要第一步用代数式来表达,就也是颤抖手均衡!绝对没有那些乱七八糟的怪现象出现)文书语气开始有些软了。“你能说说显示原理么?”“不就是所谓的纳什均衡么?给定每个人的性质,可以设计出一个纳什均衡。要是其中有一个人谎报自己的情况,便是单独偏离了此均衡,故结果定然对他不利。所以他的唯一选择就是说实话。”“我便不信)绛仙叫道,“你根本不了解别人的情况,居然就能让别人说实话)“是啊,这个显示原理也有个前提,就是其它所有人都说的是实话的前提下,单个人不会偏离均衡而说谎。倘若其它多数人都是说谎,便不是单个人偏离均衡,而是多数人偏离均衡了,此时谁能保证偏离不会得到更大的利益呢?所以社会环境的确是重要啊)“无名氏定理又是怎么回事?”“这个是无限次重复博弈中的东东。一般说来,博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方老好人吃亏。所以便引入惩罚机制:谁TMD违约,以后就要处罚他,使他不敢违约。这便是无名氏定理的要义。”“处罚的方式有很多,譬如既然已经违约,这个人是不值得相信的了,别人也决计不会再想和他合作,所以便可能选择一个对这个人最不利的纳什均衡策略,使得此人受损——你知道,在无限重复博弈中,倘若损失不考虑时间贴现,则违约人因此受到的损失当是无穷大;如果时间贴现为0,则违约人不会因惩罚而受到任何损失,所以必有一个贴现值居于中间,使得凡大于此贴现时的损失,超过违约人一次违约的利益。”“当然了,其它人倒未必一定要永远处罚下去,只要一段时期损失累计大于违约利益后,大家又可以合作,倘若再违约,再开始一段时期的处罚。所以违约必亏,大家便永远合作了。”文书黯然把书合上了。狐狸笑道:“还有么?”文书耸了耸肩。
TheDEAGameCross-EfficiencyModelandItsNashEquilibrium长期以来,DEA研究一直将决策单元看成是一个“黑箱”。只分析这个“黑箱”外部的输入和输出,严重限制了DEA的研究内容和应用范围。一个组织的运行方式、体制结构等内部因素都会对其效率产生重要的影响,DEA研究理应“打开黑箱”。对于如何破解“黑箱”内部的奥秘,作者想到一种自己所熟悉和掌握的路径——博弈论。“DEA分析组织效率时,决策单元内部和不同决策单元之间就是一个博弈的过程。”Inthispaper,weexaminethecross-efficiencyconceptindataenvelopmentanalysis(DEA).Crossefficiencylinksonedecision-makingunit's(DMU)performancewithothersandhastheappealthatscoresarisefrompeerevaluation.However,anumberofthecurrentcross-efficiencyapproachesareflawedbecausetheyusescoresthatarearbitraryinthattheydependonaparticularsetofoptimalDEAweightsgeneratedbythecomputercodeinuseatthetime.OnesetofoptimalDEAweights(possiblyoutofmanyalternateoptima)mayimprovethecrossefficiencyofsomeDMUs,butattheexpenseofothers.Whilemodelshavebeendevelopedthatincorporatesecondarygoalsaimedatbeingmoreselectiveinthechoiceofoptimalmultipliers,thealternateoptimaissueremains.IncaseswherethereiscompetitionamongDMUs,thissituationmaybeseenasundesirableandunfair.Toaddressthisissue,thispapergeneralizestheoriginalDEAcross-efficiencyconcepttogamecrossefficiency.Specifically,eachDMUisviewedasaplayerthatseekstomaximizeitsownefficiency,undertheconditionthatthecrossefficiencyofeachoftheotherDMUsdoesnotdeteriorate.Theaveragegamecross-efficiencyscoreisobtainedwhentheDMU'sownmaximizedefficiencyscoresareaveraged.ToimplementtheDEAgamecross-efficiencymodel,analgorithmforderivingthebest(gamecross-efficiency)scoresispresented.Weshowthattheoptimalgamecross-efficiencyscoresconstituteaNashequilibriumpoint.
.1博弈论与现代企业管理一定的规则约束,依靠信息,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。http://www.sjd.com.cn/notes/file2001181.htm2博弈论与信息经济学厦门大学管理学院,董保民,教学与研究的网站,主要内容:博弈论,信息经济学,微观经济学,管理经济学,产业组织理论。http://www.gametheories.net3.博弈论协会-致力于博弈论的调查、研究和应用。http://www.gametheorysociety.org4.国际博弈理论述评-包括理论、方法和博弈理论的具体应用。http://journals.wspc.com.sg/igtr/igtr.html5博弈理论-教师和学生用的博弈论网站,提供博弈论演讲、书籍和活动等。http://www.gametheory.net6.博弈论博弈论英文站点。http://www.iturls.com/TechHotspot/TH_ae.asp7博弈论和经验经济学-有哈佛大学经济系教授AlRoth搜集的论文、书目、摘要、会议信息和有指向其它网络资源的链接。还有一个组织严密的博弈论年代表。http://www.economics.harvard.edu/~aroth/alroth.html8博弈论的历史-按时间顺序排列。http://william-king.www.drexel.edu/top/class/histf.html9博弈论的经典案例:囚徒困境作者:孔祥云王玉荣。http://mbacom.533.net/case.htm10.囚犯的两难处境-以在线网路方式表现囚犯的两难问题。http://www.princeton.edu/~mdaniels/PD/PD.html.11现代性、国家和地方性三者的博弈关系评吴毅著《村治变迁中的权威与秩序——20世纪川东双村的表达》/荣敬本。http://www.booker.com.cn/gb/pape...00005/hwz212745.htm
归纳了博弈论的基本概念及博弈论的分类,能给初学者一个大致的逻辑框架。------------------------------博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。行动是指参与人的决策变量。战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。结果是指博弈者感兴趣的要素的集合。均衡是所有参与人的最优战略或行动的组合。上述概念中,参与人、行动、结果统称为博弈规则。博弈分析的目的是使用博弈规则决定均衡。二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperativegames)与非合作博弈(non-cooperativegames).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。根据参与人行动的先后顺序,可以将博弈分成静态博弈(staticgame)与动态博弈(dynamicgame)。静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(gamesofcompleteinformation)和不完全信息博弈(gamesofincompleteinformation)。完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下进行的博弈就是不完全信息博弈。完全信息静态博弈一、占优战略均衡一般来说,由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数,因而每个参与人的最优战略选择依赖于所有其他参与人的战略选择。但在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。换句话说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominantstrategies)。①囚徒困境(prisoner’sdilemma)囚徒困境反映了一个深刻的问题,这就是个人理性与团体理性的冲突。微观经济学的基本观点之一,是可以通过市场机制这只“看不见的手”,在人人追求自身利益最大化的基础上达到全社会资源的最优配置。囚徒困境是对上述基本观点的挑战。二、重复剔除的占优战略均衡在绝大多数博弈中,占优战略均衡是不存在的。尽管如此,在有些博弈中,我们仍然可以用占优的逻辑找出均衡。②智猪博弈(boxedpigs)在这个博弈中,无论大猪选择什么战略,小猪的占优战略均为等待。而对大猪来说,其最优战略依赖于小猪的选择。如果小猪选择等待,大猪的最优战略是按按钮;如果小猪选择按按钮,则大猪的最优战略是等待。换句话说,大猪没有占优战略。什么是这一博弈的均衡解呢?假定小猪是理性的,它肯定会选择自己的占优战略——等待。再假定大猪知道小猪是理性的,则大猪会正确地预测到小猪会选择等待,根据小猪的这一选择,大猪选择了在此前提下自己的最优战略——按按钮。在寻找智猪博弈的均衡解时,我们所使用的做法可以归纳如下:首先找出某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略的新的博弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;重复进行这一过程,直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合,就是这个博弈的均衡解,称为“重复剔除的占优战略均衡”(iterateddominanceequilibrium).三、纳什均衡纳什均衡(Nashequilibrium)是指这样一种均衡。在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略策略决定的情况下,他选择了最优战略。纳什均衡是完全信息静态博弈解的一般情况。构成纳什均衡的战略组合一定是在重复剔除严格劣战略过程中无法被剔除的战略组合。在占优战略均衡中,无论所有其他参与人选择什么战略,一个参与人的占优战略都是他的最优战略。显然,这一占优战略也必定是所有其他参与人选择某一特定战略时该参与人的最优战略。因此,占优战略均衡一定是纳什均衡。在重复剔除的占优战略均衡中,最后剩下的唯一战略组合,一定是在重复剔除严格劣战略过程中无法被剔除的战略组合。因此,重复剔除的占优战略均衡也一定是纳什均衡。完全信息动态博弈一、子博弈精炼纳什均衡在动态博弈中,参与人的行动有先后顺序,而且后行动的参与人在自己行动之前可以观测到先行动者的行动,并选择相应的战略。由于先行动者拥有后行动者可能选择战略的完全信息,因而先行动者在选择自己的战略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。子博弈精炼纳什均衡(sub-gameperfectNashequilibrium)。子博弈是原博弈的一部分,它本身可以作为一个独立的博弈进行分析。例如,在表7-5中,每一列或每一行都是一个子博弈。任何博弈本身则被称为自身的一个子博弈。只有当某一战略组合在每一个子博弈(包括原博弈)上都构成一个纳什均衡,这一战略组合才是子博弈精炼纳什均衡。二、重复博弈以上讨论的动态博弈有这样一个特点。这就是,参与人在前一个阶段的选择将决定随后的子博弈的结构。在上述房地产开发博弈中,子博弈甲不同于子博弈乙。当A选择了开发后,子博弈乙就被排除了。这样的动态博弈称为序贯博弈(sequentialgames)。动态博弈中另外一类是所谓的重复博弈(repeatedgames)。顾名思义,重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为阶段博弈(stagegame)。影响重复博弈均衡结果的主要因素,是博弈重复的次数和信息的完备性。重复次数的重要性来自参与人在短期利益和长期利益之间的权衡。当博弈只进行一次时,每个参与人都只关心一次性的支付;但如果博弈重复多次,参与人可能会为了长远利益而牺牲眼前利益,从而选择不同的均衡战略。就信息的完备性而论,当一个参与人的支付函数还不为其他参与人所知时,该参与人可能有积极性建立一个良好的声誉以换取长远利益。冷酷战略(grimstrategies):A起初选择合作;但如果B在某一阶段博弈中选择不合作的话,A将永远选择不合作。博弈重复次数有限时的情况。博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略——给自己的产品制定低价,从而构成与完全信息静态博弈相同的占优战略均衡。从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,n次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复n次。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。在这里,阶段博弈纳什均衡的唯一性是一个重要条件。如果纳什均衡是唯一的,上述结论就不一定成立。三、动态博弈战略行动在动态博弈中,参与人为了使得其他参与人的选择对自己有利,往往采取一些行动来影响其他参与人对于自己行为的预期。这些行为称为战略行动(strategicmove)。1.首先行动优势首先行动优势(first-moveradvantage)是指,在博弈中首先作出战略选择并采取相应行动的参与人可以获得较多的利益。2.确实可信的威胁确实可信的威胁(crediblethreat)是指,博弈的参与人通过某种行动改变自己的支付函数,从而使得自己的威胁显得可信。参与人为改变博弈结果而采取的措施称为承诺(commitment)。不完全信息静态博弈在许多情况下,参与人对对手的了解往往是不够精确的。这种情况下的博弈就是不完全信息博弈。举例来说,某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,那么,正如表7-10后两列所表示的,A企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡——A阻挠,B不进入。如果阻挠的成本高,那么,正如表7-10前两列所表示的,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡——A默许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在上述例子中,阻挠成本就是A的私人信息。高阻挠成本和低阻挠成本则是两种不同的类型。显然,在这里,B所遇到的,是不确定性条件下的选择问题。因为B不仅不知道A的类型(是高还是低),而且不知道不同类型的分布概率。解决这类问题的方法之一,就是把不确定性条件下的选择转换为风险条件下的选择。在风险条件下,B虽然不知道A的类型,但可以知道不同类型的分布概率。将不确定性条件下的选择转换为风险条件下的选择,称为海萨尼转换(theHarsanyitransformation)。按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是公共知识。用上例来说,公共知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率,而且意味着A也清楚B知道这一概率。通过海萨尼转换,不完全信息博弈变成了完全但不完美信息博弈(gamesofcompletebutimperfectinformation)。这里的不完美信息,就是指其他参与人只知道某一参与人某些方面类型的分布概率,而不知道该参与人在这些方面的真实类型。在上述转换的基础上,海萨尼提出了贝叶斯纳什均衡(BayesianNashequilibrium)。对此,可以作如下解释:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。贝叶斯纳什均衡是一种类型依赖型战略组合。在给定自己的类型和其他参与人类型的分布概率的条件下,这种战略组合使得每个参与人的期望效用达到了最大化。回到上面提到的市场进入的例子。在这个例子里,对于挑战者B来说,原垄断者A在阻挠成本方面,存在着两种可能性:高成本或低成本。B不知道A的阻挠成本究竟是高是低,但他知道A在这两种不同阻挠成本下会作出的选择,以及不同阻挠成本(类型)的分布概率。假定高成本的概率为x,则低成本的概率为(1-x)。如果A的阻挠成本高,A将默许B进入市场;如果A的阻挠成本低,A将阻挠B进入市场。在这两种情况下,如表7-10所示,B进入的支付函数分别是得到40和失去10。因此,B选择进入所得到的期望利润为40x+(-10)(1-x),选择不进入的期望利润为0。简单的计算表明,当A阻挠成本高的概率大于20%时,挑战者B选择进入得到的期望利润大于选择不进入的期望利润。此时,选择进入是B的最优选择。此时的贝叶斯纳什均衡为,挑战者B选择进入,高成本原垄断者选择默许,低成本原垄断者选择阻挠。根据参与者类型的公共知识获得参与者行动的概率,依此决定下一步策略。不完全信息动态博弈在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。如上所述,在不完全信息条件下,博弈的参与人知道其他参与人可能有哪几种类型,也知道不同的类型与相应战略选择之间的关系。但他们并不知道其他参与人的真实类型。在不完全信息静态博弈中,我们是通过海萨尼转换,即通过假定其他参与人知道某一参与人的所属类型的分布概率,来得出博弈的贝叶斯纳什均衡结果的。而在不完全信息动态博弈中,问题变得更加简单。博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。他只是对这一概率分布有自己的主观判断,即有自己的信念。博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。并根据这种不断变化的信念,作出自己的战略选择。对应于不完全信息动态博弈的均衡概念是精炼贝叶斯均衡(perfectBayesianequilibrium)。这个概念是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。具体来说,精炼贝叶斯均衡是所有参与人战略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。采用上一节的例子,可以将贝叶斯规则的分析思路表达如下。挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是20%(此时A为了保持垄断带来的高利润,不计成本地拼命阻挠);如果A属于低阻挠成本类型,B进入市场时A进行阻挠的概率是100%。博弈开始时,B认为A属于高阻挠成本企业的概率为70%,因此,B估计自己在进入市场时,受到A阻挠的概率为:0.7×0.2+0.3×1=0.44,0.44是在B给定A所属类型的先验概率下,A可能采取阻挠行为的概率。当B进入市场时,A确实进行阻挠。使用贝叶斯法则,根据阻挠这一可以观察到的行为,B认为A属于高阻挠成本企业的概率变成,A属于高成本企业的概率=0.7(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.44=0.32,根据这一新的概率,B估计自己在进入市场时,受到A阻挠的概率为:0.32×0.2+0.68×1=0.744,如果B再一次进入市场时,A又进行了阻挠。使用贝叶斯法则,根据再次阻挠这一可观察到的行为,B认为A属于高阻挠成本企业的概率变成,A属于高成本企业的概率=0.32(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.744=0.086这样,根据A一次又一次的阻挠行为,B对A所属类型的判断逐步发生变化,越来越倾向于将A判断为低阻挠成本企业了。以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用。尽管A企业有可能是高成本企业,但A企业连续进行的市场进入阻挠,给B企业以A企业是低阻挠成本企业的印象,从而使得B企业停止了进入地市场的行动。应该指出的是,传递信息的行为是需要成本的。假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传递信息的目的。只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用。传递信息所支付的成本是由信息的不完全性造成的。但不能因此就说不完全信息就一定是坏事。研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作。理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性。这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人。如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事。根据参与者类型的公共知识以及参与者历史行为来获得参与者行动的概率,依此决定下一步策略。如果作为想要博弈论的一个入门级选手,你可以看看这几本书:https://bbs.pinggu.org/thread-2868092-1-1.htmlhttps://bbs.pinggu.org/thread-1576108-1-1.htmlhttps://bbs.pinggu.org/thread-2408829-1-1.htmlhttps://bbs.pinggu.org/thread-2611528-1-1.html如果你认真想学,除了众所周知的张维迎教授的《博弈论与信息经济学》:https://bbs.pinggu.org/thread-1260759-1-1.html(pdf)https://bbs.pinggu.org/thread-2874974-1-1.html(课件)还可以看看各大学的教学大纲都会学一点什么:https://bbs.pinggu.org/thread-2865300-1-1.html或者看看外国人都讲什么:https://bbs.pinggu.org/thread-1197890-1-1.htmlhttps://bbs.pinggu.org/thread-1172815-1-1.html如果你还想深入研究:https://bbs.pinggu.org/thread-1192139-1-1.html如果想通过视频来学习,这个还不错~https://bbs.pinggu.org/thread-2143232-1-1.html