纯策略纳什均衡(博弈论纯策略纳什均衡)
本文目录一览:
关于博弈论的纳什均衡题目 急急急急急!
可以通过划线法求纯策略纳什均衡和混合纳什策略。
纯策略纳什均衡(博弈论纯策略纳什均衡)
定义 :
指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。
分类 :
纯策略纳什均衡”和“混合策略纳什均衡
“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
案例:
1. 价格战
两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。
2. 囚徒困境
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈分析
A╲B坦白抵赖
坦白 -8, -80, -10
抵赖 -10, 0-1, -1
关于案例,的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:如他坦白,如果我抵赖,得坐10年,如果我坦白最多才8年;如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。
3. 智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
4. 饿狮博弈
设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。设狮子E睡着了,狮子F敢不敢吃掉狮子E?是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。
纳什均衡的影响可以概括下边六个方面:
1. 改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2. 扩展了经济学研究经济问题的范围
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3. 加强了经济学研究的深度
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4. 形成了基于经典博弈的研究范式体系
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5. 扩大和加强了经济学与其他科学、自然科学的联系
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6. 改变了经济学的语言和表达方法
在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。
扩展资料:
纳什均衡的由来:
纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。
战略是由玩家能够施行的纯战略所组成的。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付。因为机率是连续的,所以即使战略是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什平衡,例如“钱问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略平衡。
参考资料来源:
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。
又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 应对 。 如果两个博弈的局中人的策略组合分别构成各自的 应对 ,那么这个组合就被定义为纳什均衡。
在给出纳什均衡解释前,我们先得把一个概念说清楚应对。
纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的对应,则称该局势是一个 纳什均衡
如果一个局中人的某个策略对其他局中人的任何策略都是对应,那么这个策略就是该局中人的 占优策略
在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。
首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略
其实不管局中人 2 是抗拒还是坦白,对于局中人的应对都是坦白。从而可以看出纳什均衡点并不一定是整体的解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里应对是无论对手进行策略对自己都是策略,在 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。
这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q
妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同
当丈夫给出概率分布不会让妻子在看足球和看,关于
以我对丈夫了解他更喜欢看足球,
局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。设局中人 1 的策略分布不变,局中人 2 策略选择的效用为
剪刀—石头—布的混合 纳什均衡态
任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
纯战略的纳什均衡是什么
可以通过划线法求纯策略纳什均衡和混合纳什策略。
定义 :
指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。
分类 :
纯策略纳什均衡”和“混合策略纳什均衡
“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
案例:
1. 价格战
两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。
2. 囚徒困境
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈分析
A╲B坦白抵赖
坦白 -8, -80, -10
抵赖 -10, 0-1, -1
关于案例,的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:如他坦白,如果我抵赖,得坐10年,如果我坦白最多才8年;如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。
3. 智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
4. 饿狮博弈
设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。设狮子E睡着了,狮子F敢不敢吃掉狮子E?是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。
纳什均衡的影响可以概括下边六个方面:
1. 改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2. 扩展了经济学研究经济问题的范围
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3. 加强了经济学研究的深度
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4. 形成了基于经典博弈的研究范式体系
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5. 扩大和加强了经济学与其他科学、自然科学的联系
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6. 改变了经济学的语言和表达方法
在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。
扩展资料:
纳什均衡的由来:
纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。
战略是由玩家能够施行的纯战略所组成的。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付。因为机率是连续的,所以即使战略是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什平衡,例如“钱问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略平衡。
参考资料来源:
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。
又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 应对 。 如果两个博弈的局中人的策略组合分别构成各自的 应对 ,那么这个组合就被定义为纳什均衡。
在给出纳什均衡解释前,我们先得把一个概念说清楚应对。
纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的对应,则称该局势是一个 纳什均衡
如果一个局中人的某个策略对其他局中人的任何策略都是对应,那么这个策略就是该局中人的 占优策略
在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。
首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略
其实不管局中人 2 是抗拒还是坦白,对于局中人的应对都是坦白。从而可以看出纳什均衡点并不一定是整体的解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里应对是无论对手进行策略对自己都是策略,在 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。
这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q
妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同
当丈夫给出概率分布不会让妻子在看足球和看,关于
以我对丈夫了解他更喜欢看足球,
局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。设局中人 1 的策略分布不变,局中人 2 策略选择的效用为
剪刀—石头—布的混合 纳什均衡态
任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
混合策略表示的是博弈方对各个纯策略的偏好程度,混合策略纳什均衡是对多次博弈达到均衡结局的各个纯策略选择的概率估计
什么是纳什均衡?
可以通过划线法求纯策略纳什均衡和混合纳什策略。
定义 :
指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。
分类 :
纯策略纳什均衡”和“混合策略纳什均衡
“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
案例:
1. 价格战
两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。
2. 囚徒困境
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈分析
A╲B坦白抵赖
坦白 -8, -80, -10
抵赖 -10, 0-1, -1
关于案例,的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:如他坦白,如果我抵赖,得坐10年,如果我坦白最多才8年;如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。
3. 智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
4. 饿狮博弈
设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。设狮子E睡着了,狮子F敢不敢吃掉狮子E?是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。
纳什均衡的影响可以概括下边六个方面:
1. 改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2. 扩展了经济学研究经济问题的范围
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3. 加强了经济学研究的深度
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4. 形成了基于经典博弈的研究范式体系
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5. 扩大和加强了经济学与其他科学、自然科学的联系
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6. 改变了经济学的语言和表达方法
在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。
扩展资料:
纳什均衡的由来:
纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。
战略是由玩家能够施行的纯战略所组成的。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付。因为机率是连续的,所以即使战略是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什平衡,例如“钱问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略平衡。
参考资料来源:
为什么纳什均衡不一定是占优策略?
可以通过划线法求纯策略纳什均衡和混合纳什策略。
定义 :
指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。
分类 :
纯策略纳什均衡”和“混合策略纳什均衡
“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
案例:
1. 价格战
两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。
2. 囚徒困境
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈分析
A╲B坦白抵赖
坦白 -8, -80, -10
抵赖 -10, 0-1, -1
关于案例,的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:如他坦白,如果我抵赖,得坐10年,如果我坦白最多才8年;如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。
3. 智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
4. 饿狮博弈
设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。设狮子E睡着了,狮子F敢不敢吃掉狮子E?是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。
纳什均衡的影响可以概括下边六个方面:
1. 改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2. 扩展了经济学研究经济问题的范围
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3. 加强了经济学研究的深度
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4. 形成了基于经典博弈的研究范式体系
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5. 扩大和加强了经济学与其他科学、自然科学的联系
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6. 改变了经济学的语言和表达方法
在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。
扩展资料:
纳什均衡的由来:
纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。
战略是由玩家能够施行的纯战略所组成的。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付。因为机率是连续的,所以即使战略是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什平衡,例如“钱问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略平衡。
参考资料来源:
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。
又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 应对 。 如果两个博弈的局中人的策略组合分别构成各自的 应对 ,那么这个组合就被定义为纳什均衡。
在给出纳什均衡解释前,我们先得把一个概念说清楚应对。
纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的对应,则称该局势是一个 纳什均衡
如果一个局中人的某个策略对其他局中人的任何策略都是对应,那么这个策略就是该局中人的 占优策略
在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。
首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略
其实不管局中人 2 是抗拒还是坦白,对于局中人的应对都是坦白。从而可以看出纳什均衡点并不一定是整体的解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里应对是无论对手进行策略对自己都是策略,在 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。
这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q
妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同
当丈夫给出概率分布不会让妻子在看足球和看,关于
以我对丈夫了解他更喜欢看足球,
局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。设局中人 1 的策略分布不变,局中人 2 策略选择的效用为
剪刀—石头—布的混合 纳什均衡态
任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
混合策略表示的是博弈方对各个纯策略的偏好程度,混合策略纳什均衡是对多次博弈达到均衡结局的各个纯策略选择的概率估计
简单来说,占优策略是不管对方有什么策略,"我"都有的策略,不会随着情况不同改变。而纳什均衡则是,根据对方的选择来决定自己的策略,会根据情况而变。
所以,占优策略均衡一定是纳什均衡,而纳什均衡却不一定是占优策略均衡。
纳什均衡
可以通过划线法求纯策略纳什均衡和混合纳什策略。
定义 :
指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。
分类 :
纯策略纳什均衡”和“混合策略纳什均衡
“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
案例:
1. 价格战
两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。
2. 囚徒困境
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈分析
A╲B坦白抵赖
坦白 -8, -80, -10
抵赖 -10, 0-1, -1
关于案例,的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:如他坦白,如果我抵赖,得坐10年,如果我坦白最多才8年;如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。
3. 智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
4. 饿狮博弈
设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。设狮子E睡着了,狮子F敢不敢吃掉狮子E?是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。
纳什均衡的影响可以概括下边六个方面:
1. 改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2. 扩展了经济学研究经济问题的范围
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3. 加强了经济学研究的深度
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4. 形成了基于经典博弈的研究范式体系
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5. 扩大和加强了经济学与其他科学、自然科学的联系
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6. 改变了经济学的语言和表达方法
在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
博弈论(2)—纳什均衡
可以通过划线法求纯策略纳什均衡和混合纳什策略。
定义 :
指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。
分类 :
纯策略纳什均衡”和“混合策略纳什均衡
“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
案例:
1. 价格战
两家公司打价格战时,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。
2. 囚徒困境
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈分析
A╲B坦白抵赖
坦白 -8, -80, -10
抵赖 -10, 0-1, -1
关于案例,的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保。这两个人都会有这样一个盘算过程:如他坦白,如果我抵赖,得坐10年,如果我坦白最多才8年;如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
从“纳什均衡”中引出“看不见的手”原理的一个悖论: 从利己目的出发,结果损人不利己,既不利己也不利他。
3. 智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
4. 饿狮博弈
设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。设狮子E睡着了,狮子F敢不敢吃掉狮子E?是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
影响:
纳什均衡理论 奠定了现代主流博弈理论和经济理论的根本基础 。
纳什均衡的影响可以概括下边六个方面:
1. 改变了经济学的体系和结构
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2. 扩展了经济学研究经济问题的范围
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3. 加强了经济学研究的深度
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4. 形成了基于经典博弈的研究范式体系
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5. 扩大和加强了经济学与其他科学、自然科学的联系
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6. 改变了经济学的语言和表达方法
在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。
扩展资料:
纳什均衡的由来:
纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。
战略是由玩家能够施行的纯战略所组成的。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付。因为机率是连续的,所以即使战略是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什平衡,例如“钱问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略平衡。
参考资料来源:
用反应法分析纯策略纳什均衡的方法如下:
1、对博弈者2的每一种策略,找出使得博弈者1收益的策略,并在相应的收益数值下划线
2、对博弈者1的每一种策略,找出使得博弈者2收益的策略,并在相应的收益数值下划线
3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。
所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。
如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。
又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 应对 。 如果两个博弈的局中人的策略组合分别构成各自的 应对 ,那么这个组合就被定义为纳什均衡。
在给出纳什均衡解释前,我们先得把一个概念说清楚应对。
纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的对应,则称该局势是一个 纳什均衡
如果一个局中人的某个策略对其他局中人的任何策略都是对应,那么这个策略就是该局中人的 占优策略
在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。
首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略
其实不管局中人 2 是抗拒还是坦白,对于局中人的应对都是坦白。从而可以看出纳什均衡点并不一定是整体的解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里应对是无论对手进行策略对自己都是策略,在 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。
这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q
妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同
当丈夫给出概率分布不会让妻子在看足球和看,关于
以我对丈夫了解他更喜欢看足球,
局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。设局中人 1 的策略分布不变,局中人 2 策略选择的效用为
剪刀—石头—布的混合 纳什均衡态
任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系 836084111@qq.com 删除。