楼主: allin8255
15815 29

[教与学] 有人研究微分博弈吗? [推广有奖]

11
wildnoble 发表于 2012-2-2 11:03:20 |只看作者 |坛友微信交流群
我在研究学习,有兴趣的联系我一起讨论啊

使用道具

12
zgkd2006b 发表于 2012-2-2 11:24:47 |只看作者 |坛友微信交流群
第一次听。新

使用道具

13
相印 发表于 2012-2-2 14:46:52 |只看作者 |坛友微信交流群
微观博弈?微分博弈?

使用道具

14
stlanchen 发表于 2012-2-2 15:27:54 |只看作者 |坛友微信交流群
对于一个离散的动态博弈,如果它的时间差趋于零,那么这个博弈就变成了一个时间连续的博弈,这就是微分博弈了。有些人不加区分的把动态博弈和微分博弈等同,这是不严谨的。这里的关键就在时间的连续与否,即微分博弈一定要是在时间连续的状况下描述冲突。

彼得罗相的《动态合作博弈》(第二版)算是初级读物,由他的学生高红伟翻译。最后两章就是讲微分博弈的。

《Cooperative Stochastic Differential Games》 算是高阶的,作为彼得堡学派的学生,这个不可不读。

《动态合作——尖端博弈》算是一本导读性的书,前半部讲静态博弈,后半部算是对CSDG的导读,

使用道具

15
gdc1985 发表于 2012-3-16 21:08:51 |只看作者 |坛友微信交流群
stlanchen 发表于 2012-2-2 15:27
对于一个离散的动态博弈,如果它的时间差趋于零,那么这个博弈就变成了一个时间连续的博弈,这就是微分博弈 ...
请问,如果想学习Non-Cooperative N-Players Differential game的话,应该从哪里入手呢?(比如看哪本书、哪篇论文),非常感谢!!!

使用道具

16
stlanchen 发表于 2012-3-17 01:26:22 |只看作者 |坛友微信交流群
gdc1985 发表于 2012-3-16 21:08
请问,如果想学习Non-Cooperative N-Players Differential game的话,应该从哪里入手呢?(比如看哪本书、哪篇 ...
1、杨荣基和彼得罗相合著的那本《动态合作——尖端博弈论》第六章就是一个非合作微分博弈的概述(详述参见3),介绍了决定性和随机两类博弈和开环、闭环、反馈三种解法;

2、彼得罗相的《动态合作博弈》是圣大应用数学系本科的参考书,汉语版第七章是二人零和的微分博弈,俄语版第六章非零和非合作的;

3、Cooperative Stochastic Differential Games的第一章第二章皆是非合作博弈。以及彼得罗相的Differential Games of Pursuit

4、其它诸如Isaacs的、Basar的、Айзекс、Starr……你可以自己查阅。至于入手,嗯,就彼得罗相的那本《动态合作博弈》,名字动态+合作,其实高红伟前辈自己根据第二版改的,原名就是“博弈论”,而且第一版只到微分博弈(不包括合作情况的),后来才添了后三章(其中两章是合作微分博弈)。顺便说一句,俄语第二版是今年出的,估计高红伟前辈是上次来做访问学者的时候拿手稿翻译的,所以汉语版是08年的,而且作者名单上也少了研究所另两个老师的名字。

使用道具

17
lvqutian 在职认证  发表于 2012-3-19 22:56:54 |只看作者 |坛友微信交流群
真学术。。。不懂

使用道具

18
zhanghuida0571 发表于 2012-4-1 13:46:53 |只看作者 |坛友微信交流群
微分博弈主要是用来研究什么的呢?不懂。求问。

使用道具

19
r9205009 发表于 2012-4-1 23:04:31 |只看作者 |坛友微信交流群
合作微分博弈问题研究    班允浩  
【摘要】: 微分博弈论的起源可追溯于20世纪40年代。1965年,随着Isaacs写成《微分博弈》这部经典之作,以及贝尔曼(Bellman,1957)的《动态规划》和庞特里亚金(Pontryagin,1962)的《最优过程的数学理论》,确定性微分博弈理论得以奠基。然而在诞生之初,微分博弈主要作为控制理论的研究拓展,且较多应用于航空、航海和军事领域。随着时光推移,更多的学者开始关注并深入研究微分博弈,并用不懈的努力推动博弈理论向高级形式的进化,挑战应用数学理论等级制度中经典理论处于最底层的成规。 近三十年来,博弈论已经形成了一个完整的理论体系,博弈论思想和方法亦逐渐成为主流经济学的重要分析范式,其应用范围涵盖整个经济学领域,并逐步向社会学、生物学、物理学等社会科学与自然科学拓展。当今经济社会的重要特征是高度的生产专门化和经营协作化,由对抗走向合作,由竞争转为协同已经成为各个经济主体的共识,大到主权国家与国际经济合作组织,小到微观厂商或经济个体,都非常重视合作与协同发展。许多对于经济合作问题的分析和解释都是建立在合作博弈理论基础上的。然而,现实中的经济合作问题并非如静态合作博弈模型所刻画与解释的一样,由于时间的流逝进展及经济决策主体周遭环境的变迁,静态框架下的最优均衡也许不再适用,无法保证经济合作的顺利进行。合作微分博弈理论能够为解决这个问题提供一条有效途径。合作微分博弈可以理解为在连续时间维度内,由拥有无限可供选择策略,追求整体理性和个体理性的合作参与者瞬时作出的,能够直接影响其他所有参与者的行为互动。 静态合作博弈要求存在具有约束力的合作协议,并具有明确的整体支付分配方案,其强调满足整体理性下的公平和效率。而将时间因素及无限策略引入静态合作博弈后,在静态环境中具有约束力的协议的前提条件下,必须同时满足由最初协议指定的均衡解法必须满足时间一致性,原因在于,微分博弈本身要求其均衡解法必须时间一致的,即满足子博弈一致性。由此,一个合作微分博弈的均衡解法,必须满足时间一致性,保证所有参与者沿着最优状态轨迹,按照最初共同制定的最优准则下的分配方案,持续合作,每个时刻都不发生偏离,直至合作结束。但这里仅提出了一个分配作为合作微分博弈均衡解法的必要条件,必须制定一种能确保实现这一分配方案的机制,从而保证合作顺利进行,亦即只有此机制的保障下,作为均衡解法的分配方案才有意义。 文章题为《合作微分博弈问题研究》,旨在对合作微分博弈理论进行深入研究后,就制定一种满足时间一致性,且能够保证最优准则下的分配方案得以持续有效的支付分发机制,提出几点具有价值的建议。对于最初共同制定的最优准则不做展开研究,仅将研究重点置于在最优准则既定条件下,如何时间一致地实现由最优准则确定的分配方案。将此种机制应用于实践,分析和解释经济现象,处理经济问题,将合作微分博弈理论与现实经济活动紧密联系。 首先从时间连续性及策略无限性角度定义了微分博弈,并在此基础上证明了微分博弈纳什均衡的存在性。给出了合作微分博弈的结构,并对其基本元素的经济学含义做了深入分析和解释。并讨论了共态变量、汉密尔顿函数和横截条件的经济学解释。同时给出了非合作微分博弈均衡解法的时间一致性准则,在此基础上又给出了合作微分博弈均衡解法的时间一致性准则,即时间一致性确保贯彻整个合作博弈,整体理性和个体理性都得到维持,且沿着博弈的最优状态轨迹,在当前开始的合作博弈的分配方案,即使应用于随后开始的合作博弈,仍然为最优。然而,合作的成功不仅要求其均衡解法的时间一致性,同时也要求必须有能够确保此时间一致性的机制。 应用合作微分博弈均衡解法的时间一致性准则,文章引入了带有“瞬时平衡得偿”的“支付分发机制”,旨在利用这种机制,保证最初共同制定的最优准则下的均衡分配方案满足时间一致性,并持续有效,从而确保合作顺利进行。支付分发机制由瞬时平衡得偿与最优终点支付构成,前者即为参与者的瞬时所得,是一种双向的支付流动。而对于“分发”的理解,应从联盟层面上升到“自然”的高度。联盟价值是时时创造的,同样支付也是时时分配的。这即是“自然”在博弈的每个时刻,从联盟所有成员处汇总创造的价值的同时,瞬间将其分发回联盟成员的手中,当然“自然”分发行动的准则即为最初由所有联盟参与者共同锁定的最优准则。“自然”的分发行为建基于既定的最优准则,是时间一致的;同时最优准则规制的每个分配,也因为“自然”这个特殊的分配主体,亦为时间一致。同时,归纳了文章中给出的支付分发机制与Yeung和Petrosyan (2005)针对随机微分合作设计的分配程序的四点差别,即基本思想不同、研究框架及使用技术的差异、对于最优终点支付的处理有异以及对结论的检验不同。证明了可实现时间一致性分配的支付分发机制必须满足:(1)沿着最优轨迹的每个时点,参与者的得偿总和等于双方在使用最优合作策略时的瞬时支付总和;(2)参与者在任意时间区间内所分得的瞬时平衡得偿总和的现值与其终点支付的现值之和,不少于其在非合作情况下的价值函数;(3)沿着博弈的最优轨迹,参与者在任意时点开始的博弈中所分得的支付都等于,其在随后某一时点开始的另一个博弈中所分得的支付的现值,加上其在当前博弈与后来博弈之间所收到的所有瞬时平衡得偿的现值。而最优状态在两个极其接近的时点的变化进展等于状态的瞬时变化。 为了更好的理解瞬时平衡得偿,在二人合作的框架下分析了其内在含义及经济学解释。合作参与者在任意时点获得的瞬时平衡得偿为三项总和:其一,根据最初制定的最优准则,参与者从整体合作支付中分得的边际部分;其二,根据最初制定的最优准则,参与者从以下两项中所得,分别为:其自身的非合作支付的边际部分;当此时的最优状态动态系统由非合作路径转至合作路径时,对其非合作支付的瞬时影响;其三,根据最初制定的最优准则,参与者从以下两项中所得,分别为:对手参与者的非合作支付的边际部分;当时最优状态动态系统由非合作路径转至合作路径时,对对手参与者非合作支付的瞬时影响。 在研究了支付可转移博弈后,考虑了支付不可转移情况下的整体理性,证明了帕累托有效控制的特征。在二人博弈情况下,帕累托边界可以被宽泛的视为一个递减函数。证明了一般非凸博弈中的帕累托最优均衡存在性的必要条件。并通过一个联合广告开发的实际经济问题做了深入分析和探讨。 同时,研究了微分博弈中的个体理性——时间一致性和合意性。证明了时间一致性和合意性的条件,若状态增加一单位,则参与者的个体支付的增加数量,无论在合作情况下还是在非合作情况下,都是一样的;若在博弈的初始阶段采取合作方式是满足个体理性的,则合作将一直是个体理性的;若合作解法是时间一致性的,则其亦为合意的。 文章将理论紧密联系实际经济问题,重视理论对现实经济问题的分析和解释能力。建立了技术联盟的合作微分博弈模型,研究并设计技术联盟的支付分发机制,并通过Matlab程序验证了此机制能够保证分配方案的时间一致性。认为技术联盟中成员收益分配是影响技术联盟正常运行和稳定发展的关键因素,通过建立两个合作微分博弈模型,分别研究具有两个参与者和多个参与者的技术联盟。针对二人技术联盟问题,设计一套支付分发机制,使纳什讨价还价均衡分配准则得以一直维持,确保达成稳定的合作计划;针对三人技术联盟问题,规划了一种带有瞬时平衡得偿的支付分发机制,使动态沙普利值得以被一直执行,确保三方达成时间一致的合作方案。 文章的主要成果可以归纳三点。其一,从时间连续性和策略无限性双重角度定义了微分博弈;其二,引入带有“瞬时平衡得偿”的“支付分发机制”,并将其作为确保合作最优准则持续被遵循,合作计划自始至终有效持续的保障机制,由此机制给出的合作微分博弈分配解法满足时间一致性,从而确保了合作的成功;其三,构建了技术联盟的合作微分博弈模型,设计能够实现时间一致性分配的支付分发机制;并通过Matlab程序进行模拟分析,验证了结论的合理性。
兩情若是久長時,又豈在朝朝暮暮

使用道具

20
chybrh 发表于 2013-2-21 20:50:10 |只看作者 |坛友微信交流群
太深了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 03:46