不罗列概念,直接举例:
囚徒困境
“囚徒的困境”是成名于年塔克(Tucker)演进的经典博弈问题。该问题非常简单,却能很好地反映博弈问题的根本特征,也是有效解释众多经济现象的基本模型。该问题提出后引发了大量的相关研究,对博弈论的发展起了不小的推动作用。下面是作者改编的版本。
警察抓住两个合伙犯罪的罪犯,但缺乏足够证据指证他们的罪行。如果其中至少一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将两名罪犯分别关押以防止串供或结成攻守同盟,并给他们同样的选择机会:
1.如果两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;
2.如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放,另一人则将重判8年徒刑;
3.如果两人同时坦白认罪,则他们将被各判5年监禁。
决策
本博弈的博弈方是两个罪犯,我们分别称“囚徒1”、“囚徒2”,但只制定规则、自身不参与决策活动的警察则不是博弈方;本博弈两个博弈方都有“不坦白”和“坦白”两种可选择策略;因为两个囚徒被隔离开,其中任何一人选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以认为他们是同时决策的。
如果分别用-1、-5和-8表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则可以用图1.2所示的得益矩阵将这个博弈表示出来。在图1.2中,矩阵的每个元素都是两个数字组成的数组,表示所处行列对应的两博弈方策略的组合下的双方得益。其中,第一个数字为选择行策略的囚徒1的得益,第二个数字为选择列策略的囚徒2的得益。根据个体理性行为准则,两个博弈方的目标都是实现自身的最大利益。他们该怎样选择策略呢?首先可以肯定的是,在这个博弈中,两博弈方各自的利益不仅取决于他们自己选择的策略,也取决于对方的策略选择。每个博弈方选择自己的策略时,即使无法知道另方的实际选择,也必须考虑另一方有两种可能的选择,而且另一方的选择对自己的利益影响很大。例如对囚徒1来说,假设囚徒2选择的是“不坦白”,自己选择“不坦白”得益-1,“坦白”得益0,他应该选择“坦白"(根据个体理性原则,囚徒1不会关心对方会被重判8年的问题);假设囚徒2选择的是“坦白”,则囚徒1“不坦白”得益-8,“坦白”得益-5,还是应该选择“坦白”。因此,本博弈中无论囚徒2采用何种策略,只考虑自身利益的囚徒1的唯一.选择是“坦白”。“坦白”是囚徒1的一个“上策"(dominantstrategy)。因为囚徒2的情况与囚徒1完全相同,因此囚徒2的策略选择应该与囚徒1完全相同,唯一选择也是“坦白”,“坦白”也是囚徒2的“上策”。所以,该博弈的最终结果必然是两博弈方都选择“坦白”,同获得益-5,即都被判5年徒刑。值得注意的是,在这个博弈中,无论是对两个囚徒总体来讲,还是对他们各自来讲,最佳的结果都不是同时“坦白”各得-5,因为都“不坦白”各得一1显然比都“坦白”各得一5好得多。但是,由于两个囚徒不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,因此只能实现对他们都不理想的结果。这也是该博弈被称为“囚徒的困境”的原因。当然,囚徒的困境对社会利益来说是理想的,因为罪犯都受到了应有的惩罚。但从博弈中两个决策者的立场上说则很不理想,因为既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益。囚徒的困境博弈的重要意义,在于类似的情况在社会经济中有很大的普遍性,在市场竞争的各个领域,在资源利用和环境保护,以及*治、*事和法律等各种领域的问题中,都存在类似囚徒的困境现象。下期要讲的”双寡头价格战“就是一个典型例子。本章就”囚徒困境“这个经典博弈问题做出了一个简单介绍,此后我们将为读者朋友们介绍更加丰富多彩的问题、模型和分析方法。参考文献:[1]张维迎.从九四年诺贝尔经济学奖看主流经济学的新发展(1-7).原载《经济学信息报》,转载于复印报刊资料《理论经济学》,,6:-.[2]郑也夫.走出囚徒困境.光明日报出版社,.[3]AxelrodR.Launching“theevolutionofcooperation”[J].JournalofTheoreticalBiology,,:21-24.[4]罗伯特·阿克塞尔罗德.合作的复杂性--基于参与者竞争与合作的模型[M].梁捷,高笑梅,译.上海:上海世纪出版集团,.[5]罗伯特·阿克塞尔罗德.合作的进化[M].吴坚忠,译.上海:上海世纪出版集团,.[6]谢识予。经济博弈论(第四版)复旦大学出版社,图片来源于网络,侵删。预览时标签不可点收录于话题#个上一篇下一篇