楼主: EVERSONIC
7937 5

[教与学] [请教]这个零和博弈的矩阵怎么解? [推广有奖]

  • 0关注
  • 0粉丝

硕士生

32%

还不是VIP/贵宾

-

威望
0
论坛币
24056 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1607 点
帖子
282
精华
0
在线时间
9 小时
注册时间
2004-12-22
最后登录
2022-5-25

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

这个零和博弈的纳什均衡怎么算? 0 1 -1 2 2 -3

A有两个纯策略,B有三个纯策略.如果是纳什均衡,A以(p,q)的概率选择两个纯策略,B以(a,b,c).是不是应该保证A的混合策略使B的任何策略收益相等?

谢谢.

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:零和博弈 纳什均衡 混合策略 矩阵 博弈

抗日不抗宫崎峻,反美不反签证官
沙发
sungmoo 发表于 2005-9-16 10:14:00 |只看作者 |坛友微信交流群
收益怎么是单维的?

使用道具

藤椅
EVERSONIC 发表于 2005-9-16 10:53:00 |只看作者 |坛友微信交流群

零和博弈,把收益矩阵的负矩阵就是另一个人的收益矩阵.

写开是这样:

(0,0) (1,-1) (-1,1) (2,-2) (2,-2) (-3,3)

抗日不抗宫崎峻,反美不反签证官

使用道具

板凳
sungmoo 发表于 2005-9-16 11:25:00 |只看作者 |坛友微信交流群

主要是不清楚第一种表达里的支付矩阵是谁的。

[此贴子已经被作者于2005-9-16 11:28:19编辑过]

使用道具

报纸
sungmoo 发表于 2005-9-16 12:32:00 |只看作者 |坛友微信交流群

刚才和一位网友探讨了有关问题。

对于对方的某个混和策略,本方要寻找一个最优的混和策略(使本方期望收益最大的混和策略),或者说,本方所选择的混和策略即对方混和策略的“反应函数”。特例是本方的最优反应是某个纯策略(一种特殊的混和策略)。

混和策略均衡应该描述这样一个状态:给定其他方的某个混和策略,各方都不愿意再修改自己的混和策略(当然也可以是某个纯策略)。

本题要用到线性规划的方法。

设M是A的收益阵(不妨设为2*3矩阵),则-M是B的收益阵,a(2维向量,分量即概率)是A的混和策略,b(3维向量,分量即概率)是B的混和策略。则对于给定的b,a'Mb即A的期望收益。选择a,使a'Mb最大,得到A的最优反应a*(是b的函数)。同理,得到B的最优反应b*(是a的函数)。联立a*与b*,得均衡解。

给定b,{a*}=argmax(a'Mb);给定a,{b*}=argmin(a'Mb);a、b均符合概率规范性要求。

使用道具

地板
sungmoo 发表于 2005-9-16 12:41:00 |只看作者 |坛友微信交流群
以下是引用EVERSONIC在2005-9-15 22:31:11的发言:…如果是纳什均衡…是不是应该保证A的混合策略使B的任何策略收益相等?…

应该表述为:给定对方的混和策略,本方的最优混合策略里面,概率不为0的那几个纯策略(而不是“任何纯策略”)应该得到相同的支付。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-10 13:40