什么是博弈论?

频道:生活应用 日期: 浏览:43

博弈究竟是什么?从字面上看,它由“博”与“弈”两个词组成。它涉及的是双方或多方的对抗或竞赛,而这种对抗或竞赛总是在既定的规则框架内展开。在游戏中,每一位参与者都必须深思熟虑,运用恰当的策略或计谋,力求在竞争中取得胜利。

博弈论设计甚广,后续发展基本上沿着以下4个方面展开:

对 纳什均衡 的弱化(或一般化)研究

对 纳什均衡 的精炼(或筛选)研究

对 博弈论 的基本假设的深入研究

对 博弈论 的应用研究

实际上,博弈论已经超越了仅仅针对经济问题的探讨,它已扩展至对社会问题的深入研究,同时,在经济学领域之外,诸如政治学、社会学、管理学等多个学科领域,博弈论的应用也日益广泛。

鉴于博弈论在理论体系中的关键地位,我针对《博弈论》这部著作进行了详细的笔记整理,深信博弈论将作为一种关键理论,在阐释冲突、构建合作关系、加强彼此信任以及推动社会经济进步等方面发挥重要作用。

文中讲述了多种博弈模型,贴近生活也耐人寻味。

一、概览 1)博弈类型和结构化思维

科学的起点是分类,只有通过分类才能区分事物之间的不同。

衣物需分门别类,书籍亦需分类整理,乃至身高、收入、智商等各项指标亦能划分归类。分类的存在,使得事物得以井然有序。

博弈的分类有两种:

静态博弈 和 动态博弈

完全信息博弈 和 不完全信息博弈

静态博弈和动态博弈

以上推演到实际生活中:

石头剪刀布、投标活动就是 静态博弈

棋牌游戏、拍卖就是 动态博弈

有个实实在在的例子:

学校在课程结束之际,通常会让学生对教师的教学进行评价,同时教师也需对学生的学业成绩进行评定。若学生先行对课程进行评价,可能会对教师评定成绩产生干扰;反之,若教师先行评定成绩,也可能对学生对课程的评分产生影响。这种情况下,教师与学生在评分过程中相互制约,使得评分的真实性和有效性难以得到保障。由此,我们便采用了保密措施,学生们先行进行评分,然而这些评分对教师而言则是保密的;教师需在学生完成成绩评定后的一段时间内,方得知晓学生对自己的评价。这种做法,本质上是一种静态的博弈过程。

两者区别:

在静态博弈中,参与者需根据对敌方策略或行为的推测来做出选择,例如在“石头剪刀布”这一游戏中,你需设想对手可能会出“石头”,随后你便需决定自己的出拳方式为“布”。

动态博弈 的参与者则是依据对手的实际选择做决策。

完全信息博弈与不完全信息博弈

以上推演到实际生活中:

教育、医疗和金融就是 不完全信息博弈

相较之下,几乎很少存在完全信息博弈,这实则反映了:生活本身便充满了不公。

结构化思维

若某物能够依据两个或更多不同的标准进行归类,那么将这多个标准合并于同一平面之上,便能够形成一种系统化的组合模式。

将上面说到4种博弈类型进行组合,我们可以得到:

懦夫博弈生活应用_纳什均衡精炼研究_博弈论应用研究

2)扩展认知  纳什均衡

均衡是指所有博弈参与者的最优策略组合。

纳什均衡的定义在于:在你的策略既定的情况下,我所采取的策略将是我认为的最优选择(或其中之一);同样,在我的策略确定之后,你选择的策略也将是你认为的最优方案(或其中之一)。在这种双方已确定的策略面前,双方均无进一步调整自身策略的动机。

总之,双方已经陷入了一种冷淡的极端状态,彼此都不愿意偏离各自既定的策略立场。

策略探究

策略的三大属性:

1、策略的完整性

策略务必全面,这要求参与者对每一种可能的情况都进行详尽的思考,确保不遗漏任何一点(需擅长运用分类和穷尽法)。

2、策略的多样性

策略选择众多,这表示你实际上拥有众多策略可供挑选,比如A、B计划,亦或是保留后手,确保有所准备以防万一。

3、策略的不可观察性

策略与行动有所区别,行动指的是实际的操作方式,而策略则是对行动的预先设想。仅凭一个人的具体行为去推断其策略,可能会得出错误的结论(你所认为的,未必就是真相)。

共同知识

什么是共同知识呢?

《皇帝的新装》这个故事大家都很熟悉,然而,一个众所周知的事实是皇帝并未身着衣物。这虽是众人皆知的共有知识,却并非共同知识。共同知识不仅意味着每个人都知晓(即共有),还意味着每个人都知道其他人也知道这一点,进而每个人都知道其他人知晓每个人都知晓……

我们通常提到的“共识”实际上指的是“共同知识”,这两个概念需要我们进行明确区分。这不禁让我联想到互联网领域内广为人知的“两将军问题”,TCP为何要执行三次握手而非两次?其目的正是为了确保达成共识。

二、经典模型

纳什均衡精炼研究_博弈论应用研究_懦夫博弈生活应用

1)懦夫博弈

狭路相逢勇者胜 就是一种博弈,双方都在赌对方先退一步。

提及此类竞争,《速度与激情》电影中诸多情节均是对懦夫博弈的生动体现。

在懦夫博弈情境下,存在两位参与者A与B,他们各自掌握着两种不同的策略选项——前进或后退。他们之间可能出现的四种结果分别是:双方均选择前进、双方均选择后退、A选择前进而B选择后退、以及A选择后退而B选择前进。

懦夫博弈中,先行者拥有显著的优势,若一方决定前进,另一方便不得不选择撤退,否则将面临更加严重的损失,这便是常说的“先发制人开yunapp体育官网入口下载手机版,后发则受其害”。

理论上分析,制胜懦夫博弈的关键在于:首先作出前进的选择,紧接着迅速告知对手自己已选前进,并确保对手明了这一选择不可更改。

一句话中,体现了三要素:

因此,在懦夫博弈中,先行动的优势不仅源自于行动上的先行一步,而且也源于信息传递上的领先地位。

赢者独享所有利益会引发激烈的竞争,在这样的竞争中,个体必须不断评估自己获胜的几率,通常情况下,选择不参与这种竞争是一种理智的决策。

2)夫妻博弈

夫妻间的博弈可谓不断,明年过年去谁家也成为了世纪难题。

在探讨这一问题的过程中,我们可以观察到双方之间存在着共同的利益点。在夫妻之间的博弈之中,我们能够识别出两种纯粹的策略纳什均衡:即双方一致选择前往男方家庭过年,或是双方一致选择前往女方家庭过年。

从现实生活中分析,一般有三种情况:

与懦夫博弈一样存在先动优势,家庭地位决定纳什均衡的偏好

轮流去对方家

随机挑选的方案,其效果甚至超越了纳什均衡,双方均遵循着彼此认同的规则。

合作收益的分配机制需预先确定:在各类合作关系中,合作收益的分配问题不可避免。各种分配方式均有其合理性,而合作前若能自愿达成一致,将显著减少合作过程中的成本。

夫妻间的博弈本质上是一种双方都能获得利益的协作游戏,然而在共享合作成果的分配上,各方的所得并不完全相同。通过事前就合作收益的分配达成一致,可以成为预防争执和冲突的重要途径。

3)囚犯困境

囚徒困境,亦被称作“囚徒困境”,它是博弈论领域内最著名的理论模型之一。

电视剧中频繁出现囚犯困境的情节,通常是这样的:两名罪犯被分别审讯。若双方都选择缄默不语,他们只能因犯罪行为被定罪,所面临的刑罚相对较轻。然而,若其中一人选择率先坦白,那么他将被立即释放,而另一位罪犯则需承担更重的刑罚。若两人均选择坦白,他们不仅无法获得释放,反而会遭受更加严厉的惩罚。

此时,囚犯困境显现,两人若均选择抗拒,则皆能获得最佳结果;然而,对个人而言,率先坦白则更为有利,此乃最优策略。

该策略在应用后,其效果总是超越其他策略,而当博弈中的每位参与者均采纳这种策略时,由此形成的平衡状态,即称为占优策略均衡。

在双方沟通不畅的背景下,一旦条件得到放宽,便允许他们共处十分钟后,再行决定是否选择坦白。

此时,博弈的焦点将转向双方是否恪守承诺;当然,最理想的策略依旧是不履行承诺;而最终的结局则取决于某一方是否能在心理上承受不单独背叛对方的代价。

现实生活里,囚犯困境的现象极为普遍。人们普遍认为,这种困境的成因在于个体对个人利益的追逐,因而,在存在利益分歧的场合,往往就会形成囚犯困境。那么,我们该如何摆脱这种困境呢?

积极调整游戏规则,全力探究每位参与者的最佳策略,即便无法实现让利于他人,也力求实现互利共赢。

我们渴望道德的引领。若缺乏道德规范对人类行为的制约,人类社会与动物界将无二致。

借助历史的记忆。把对历史的记忆转为对未来的想象

囚犯困境的根本所在是:个体在追求自身利益的同时,往往导致了他人利益的巨大损失。

囚犯困境所启示的:博弈的最终平衡并非由实际发生的事实所决定,而是完全由博弈自身的规则所主导。

4)万元陷阱

这个博弈带来了一个十分有意思的案例:

存在一款名为《美元拍卖游戏》的活动开yun体育app入口登录,其中,苏必克将一张面值为一美元的纸币作为拍卖物品开元ky888棋牌官方版,公开进行竞拍。竞拍的规则设定为:出价最高者将赢得该物品,而次高报价者亦需按照自己报价的金额支付款项。

这究竟是怎么回事呢?现在我们将10000元人民币进行拍卖,请大家积极参与竞拍,每次加价不得低于100元,直至无人继续提高价格。最终出价最高的人将以自己的出价赢得这10000元,而第二高价的竞拍者也需支付给我其所出价格的金额。

若现场无人参与竞标,你仅需投入100元,便能轻松赢得价值10000元的物品,届时你将实现9900元的纯利润。

当然,这理应是最佳的理想状态。然而,若出现两人竞相抬价的情况,当你报价达到1000元时,对方却出到了1100元,你是否会选择放弃?若你选择放弃,便意味着会损失1000元。此时,唯一的策略就是继续提高报价。在这场冷热化的竞价中,当你已将价格加至9900元时,对方报价已达到10000元。此刻,双方均不愿放弃,于是又开始了新一轮的竞价,直至双方破产。

这就是著名的 万元陷阱 ,这些陷阱通常有三个特征:

一个明显的诱饵

通往诱饵之路是单向的,可进不可出

参与者越是试图摆脱困境,反而越会陷入其中,直至无法自救,最终不得不承受极大的痛苦和损失。

那么如何避免 万元陷阱?

确立你投入的极限及预先的约定

极限一经确立,就要坚持到底,一定不要轻易改变

自己打定主意,尽量不受他人影响,避免出现 从众心理

不断提醒自己继续投入的代价

竞拍时需谨慎:切勿抱有不切实际的幻想,若起始价定为9900元,利润仅100元,通常情况下,鲜少有人会继续抬价,除非意图扰乱市场。然而,若真有人将价格提升至10000元,你若选择跟进,便需展现出决绝的态度,毫不犹豫地从9900元直接加至19900元。如此一来,对方便能明白,若他们再次将价格推至20000元,无论选择继续加价还是放弃,都将面临10000元的损失,而若选择加价至20000元,还有可能面临你继续加价,从而加剧损失的风险。

要想规避万元陷阱,最关键的举措是迅速采取止损措施,切莫陷入其中不能自拔;其次,切勿抱有不切实际的幻想,认为天上会掉下馅饼;利益微薄才能减少他人对你的极度羡慕和觊觎之心;否则,一旦利益丰厚,难免会吸引贪婪之徒前来觊觎。

5)智猪博弈

什么是智猪博弈呢?经典模型如下:

在猪圈中,两头猪并存,一只是体型较胖,另一只是体型较小。猪圈的其中一边设有食槽,而另一边则装备了调控猪食供应的按键。按下该键,食槽中便会增加10个单位的猪食,然而,操作此按键的代价是消耗2个单位的猪食。

若两头猪同时按下按钮,随后一同奔向食物,大猪将能获得7个单位的食物,而小猪则能分得3个单位。扣除所需成本后,大猪净得5个单位,小猪则剩下1个单位。

若大猪触动按钮,而小猪正站在食槽边准备进食,那么大猪将获得6个单位的食物,小猪则能分得4个单位。扣除所需成本后,大猪和小猪各自获得4个单位的净收益。

若小猪触动按键,而大猪正位于食槽边准备进食,结果将是:大猪将获得9个单位的食物,而小猪则只能得到1个单位。扣除相应的成本后,大猪的净收益为9,小猪的净收益则为-1。

三种情形显而易见,对小猪而言,等待构成了最佳选择。若小猪始终坚持等待,那么为了能够获得食物,大猪别无选择,只能选择按下按钮。在这种情形下,所形成的纳什均衡便是(大猪按下,小猪等待)。

然而,这种平衡对体型较大的猪来说并非最佳选择,因为付出多并不一定能获得更多,最终的结果是(大猪:4,小猪:4)。在此博弈情境下,小猪无论如何都不会按下按钮,大猪是否按下按钮仅会影响到小猪的得失,而不会对小猪的策略或行为决策产生影响。

因此,此类模型亦被称作搭便车博弈,其中一方承担了相应的成本,而双方共同享有取得的收益。借助这一模型,我们可以获得以下几点启示:

个体理性与集体理性的关系,是存在对立还是和谐,这主要取决于制度设计的本质。

收入分配的不均衡现象将加剧个体理性和集体理性之间的矛盾。换句话说,通过让一部分人率先富裕起来,可以促进尚未富裕的人群的福祉。

富裕阶层乐于行善之举,往往得益于贫困阶层的认可。若要促使那头大猪按下按钮,小猪们可以适当减少自己的食量,以此让大猪感受到利益的均衡,不至于产生太大的不公感。

能力越大,责任越大

在猜谜博弈中有两个非常重要的概念:纯策略 和 混合策略

纯策略: 参与者在每一个给定信息情况下只选择一种特定的行动

在已知信息的前提下,参与者会依据一定的概率分布,随机挑选各自的行动方案。

“若他人未对我构成挑衅,我保持克制,犯人的可能性仅为20%;而一旦他人对我有所冒犯,我反击的几率则高达90%。”这体现了一种策略的融合。

6)猎鹿博弈

又是一个有趣的博弈模型

两个人出去打猎,猎物为鹿和兔。

情况1:如果两个人独自去打兔子,一天下来可以打到2只兔子

若意图猎捕鹿群,务必得有两位同行,彼此不可或缺。(鹿的身价等同八只兔,个人贡献可算作四兔。)倘若狩猎者独身前往,而同伴未能同行,那么这位猎人将一无所获。

研究发现,在此模型中,存在两种纳什均衡状态,即要么集体狩猎鹿,要么集体狩猎兔子。

然而,若参与猎鹿,便需承担有人未参与猎鹿的风险。在这种情形下,提前进行沟通就显得尤为重要。

若沟通所需的费用低于最终收益的代价,便需尽早进行交流,共同协作以实现利益的最大化。沟通与协调的费用越少,个体间构建合作关系的难度便越小。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。