什么是纳什均衡解?

其实呢,我只知道Nash balance,是老大跟我说的。

纳什均衡理性解 纳什均衡原理纳什均衡理性解 纳什均衡原理


纳什均衡理性解 纳什均衡原理


纳什均衡理性解 纳什均衡原理


原理他也没说,举例说吧,如果你喜欢一个女孩子,然后一直追不到她,那么就找几个朋友,把她身边的朋友们全部追走,那么你就有很大的可能追到那个女孩了。

求那什均衡解?

博弈的纳什均衡解,纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。

混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

什么是纳什均衡?

纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。

一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。

扩展资料:

纳什均衡的由来:

纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。

所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。

战略是由玩家能够施行的纯战略所组成的。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。

混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付。因为机率是连续的,所以即使战略是有限的,也会有无限多个混合战略。

当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。

故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。

并不是每个赛局都会有纯战略纳什平衡,例如“钱问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。

甚至,有些赛局能同时有纯战略和混合战略平衡。

参考资料来源:

纳什平衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。

一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的值,与此同时,其他所有博弈者也遵循这样的策略。

扩展资料

经典案例:囚徒困境

设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌 疑人,警方给出的政策是:

如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年。

如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

参考资料来源:百度百科-纳什均衡

通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是的策略;给定我的策略,你的策略也是你的策略。即双方在对方给定的策略下不愿意调整自己的策略。

在纳什均衡中,每一个理性的参与者都不会有单独改变策略的冲动。

处类似“囚徒困境”这样的博弈中,背叛是两种策略之中的支配性策略。因此,这场博弈中可能达到的纳什均衡结果,就是双方参与者都背叛对方。

试想一个简单的博弈,张三和李四这两个员工都想要加薪。如只有一个员工要求加薪,老板会答应:但要是两个人都要求加薪,老板就会生气,并把两个人统统开除。这场博弈有两个纳什均衡,一个是只有张三要求加薪,另一个是只有李四要求加薪。两个员工都不要求加薪并不是纳什均衡,因为当两个人知道对方没有提出要求时,就会后悔自己的选择。两个人都要求加薪也不是纳什均衡,因为两个人事后都会后悔自己被开除。稳定而自私的结果,就是一个纳什均衡。

极简博弈论之一:极小极大与纳什均衡

如果你是两个孩子的母亲,要给两个馋嘴的孩子分一块蛋糕,不管怎么分,的结果总是,有一个孩子(甚至是两个孩子)觉得自己的那块更小。

这是博弈论中的一个经典问题:分蛋糕。该怎么分才能让两个孩子都满意?博弈论可以帮我们破了这个局。

我们把分蛋糕问题暂且搁到一边,先来认识一下博弈论的两位——冯·诺依曼和约翰·纳什。

冯·诺依曼(后文简称冯)有两个领域的鼻祖,他被称为“计算机之父”,现代计算机的原型正是出自冯的设计,这个原型一直沿用到今天,他还被称为“博弈论之父”,因为他最早对零和博弈进行了深入研究,提出了“极小极大原理”。

约翰·纳什(后文简称纳什)比冯晚出生20多年,他年轻有为,在博士论文中便提出了的“纳什均衡”理论,可惜天妒英才,纳什的妄想症随着年龄的增长越发,然而他的妻子从未抛弃他,一直陪伴纳什到人生的一刻,方才有了震撼人心的电影《美丽心灵》。

回到分蛋糕的问题,我们请冯和纳什两位出场,来解决分蛋糕问题。

首先,我们要把分蛋糕问题需要转化为两个孩子博弈问题,博弈的规则是:两个孩子分蛋糕,一个切蛋糕,另一个先选蛋糕。

博弈论的目标就是寻找问题的理性解——不考虑情感因素,单从理性角度分析所得的。

我们先把两个孩子的策略和对应的结果做成一个表格。记切蛋糕的孩子为A,选蛋糕的孩子为B,用“A得到的蛋糕大小,B得到的蛋糕大小”表示分蛋糕的结果。

| B选大块 | B选小块

:----:|:-----:|:----:

A切成两块一样大 | 一半,一半 | 一半,一半

A切成两块不一样大 | 小块,大块 | 大块,小块

先请冯来切蛋糕,即冯是A,他自然要运用“极小极大原理”。

“极小”指的是B一定会挑选大块,所以留给自己的肯定是小块,也就是表格中的左边一列;

“极大”指的是A要使自己的蛋糕尽量大;

“极小极大”组合起来的意思是,A已知B会选大块,所以会把较小的一块切得大一些,对A来说,的结果就是表格的左上角“一半、一半”,即两人各分得半块蛋糕,这就是这个问题的理性解。

这就是极小极大原理,是不是很简单?

纳什均衡也不难!

这次换做纳什来切蛋糕了(即纳什是A),他自然要运用“纳什均衡”来寻找理性解。A设自己切成不一样大小的两块,B自然会选大块,也就是表格中左下角一格。

这时,A会分别问B和自己一个问题:你后悔吗?

B想:我得到了大块,我不后悔!

A想:如果我切成一样大的两块,能得到的更多,我后悔了!

于是A改变策略,切成一样大的两块,对应表格的左上角。还是重复刚才的问题,你后悔吗?

B想:既然两块蛋糕一样大,后悔也没用,我不后悔!

A想:既然B已经选了大块的,我能得到半块蛋糕已经是的结果了,我也不后悔!

当两人都不后悔时,纳什均衡就达成了!

寻找纳什均衡点一定要注意:“是否后悔”是对方不变更策略的前提下做出的选择。这很像球迷们看球时候的心情,每当看到空门不进,球迷们的心声总是:不会吧!这球换我也能射进啊!

单从分蛋糕的例子来看,两个理论得到的是一样的。二者的区别在于适用范围,极小极大原理只能用来分析零和博弈——双方利益总和不变的博弈问题,纳什均衡对零和博弈、非零和博弈都适用,这也是纳什均衡厉害的地方。不过,纳什均衡为的是找到“使双方都不后悔的理性解”,这个理性解未必会给博弈中的个体或集体带来利益化。

至此,我们认识了两位——冯·诺依曼和约翰·纳什,学习了两个原理——极小极大和纳什均衡。

接下来,我们就来学习一个熟悉又陌生的博弈问题—— 囚徒困境 。

还有哦: 极简博弈论之二:你我都是囚徒

名词解释纳什均衡

纳什均衡(Nash equilibrium)是博弈论中的一个概念,指的是在一个多人博弈中,所有参与者都选择了自己的策略,而没有人能够通过改变自己的策略来获得更多的收益。简而言之,纳什均衡是指博弈中所有参与者的策略组合,使得没有人会单方面改变自己的策略,因为这样做不会获得更多的利益。

纳什均衡是一种稳定状态,因为在这种状态下,每个人都认为自己的选择是的,并且无法通过单独改变策略来提高收益。在现实生活中,纳什均衡常常被用来分析各种策略性互动,如市场竞争、和博弈等。

纳什均衡最早由美国数学家约翰·纳什在20世纪50年代提出。他通过研究博弈理论中的非合作博弈,发现了在某些条件下,博弈中存在一种状态,使得所有参与者都选择的策略,这种状态被称为纳什均衡。

在纳什均衡中,每个人都是理性的,并且能够预测其他人的行为。因此,他们会选择自己的策略,而不会被其他人的策略所影响。虽然纳什均衡不一定是的结果,但它是一种稳定状态,因为在这种状态下,没有人有动机改变自己的策略。

在博弈论中,纳什均衡是一种重要的分析工具,可以用来研究各种策略性互动的结果。通过分析不同参与者的策略选择,可以预测博弈的结果,并帮助人们做出更好的决策。在实际应用中,纳什均衡被广泛用于分析市场竞争、战略联盟、投标竞争和等领域。

什么是纳什均衡?

通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是的策略;给定我的策略,你的策略也是你的策略。即双方在对方给定的策略下不愿意调整自己的策略。

在纳什均衡中,每一个理性的参与者都不会有单独改变策略的冲动。

处类似“囚徒困境”这样的博弈中,背叛是两种策略之中的支配性策略。因此,这场博弈中可能达到的纳什均衡结果,就是双方参与者都背叛对方。

试想一个简单的博弈,张三和李四这两个员工都想要加薪。如只有一个员工要求加薪,老板会答应:但要是两个人都要求加薪,老板就会生气,并把两个人统统开除。这场博弈有两个纳什均衡,一个是只有张三要求加薪,另一个是只有李四要求加薪。两个员工都不要求加薪并不是纳什均衡,因为当两个人知道对方没有提出要求时,就会后悔自己的选择。两个人都要求加薪也不是纳什均衡,因为两个人事后都会后悔自己被开除。稳定而自私的结果,就是一个纳什均衡。