07 对博弈论的批判2:“囚徒困境”的内容

07 对博弈论的批判2:“囚徒困境”的内容

00:00
14:23



您好,欢迎收听“李俊慧的经济学课”。上次课粗略地说了一下囚徒困境,这次课就好好分析一下。


1)囚徒困境的内容


囚徒困境作为一个最经典的入门级博弈,很典型地讲了一个貌似有理、其实只是有趣的故事。这个故事讲的是两个贼,一起去作奸犯科,被警察抓捕归案。虽然给抓了,但证据不足,光靠物证没法把他们定罪,必须得到他们的招拱。看过电视剧《人民的名义》的朋友就该知道,审问犯人有个高精尖的技术叫零口供定罪,一般挺难做到的,还是需要口供。于是警察把这两个贼分开监禁、分别审问。囚徒困境这个故事就是站在这两个犯人的角度来看,他们要怎么选择才是最优的。虽然博弈论声称要重写经济学,但是它的一些最基本的概念(像自私理性、最优均衡),还是摆脱不了传统经济学。


入门级的博弈论需要用到一个叫“收益矩阵”的表格,大家可以看我的《经济学讲义》第十六讲的最后一节,也可以拿一支笔,听着下面的描述在纸上写下来。两个囚徒是博弈的参与者,不妨把其中一人称为A,放在矩阵的左边;另一人称为B,放在矩阵的上方。他们分别有两种选择,在这个故事里是招供与不招供,两两结合就总共有四种组合,构成了收益矩阵的四个格子:左上方的格子是两人都不招,左下方的格子是A招B不招,右上方的格子是A不招B招,右下方的格子是两人都招。每个格子里都有两个数字,第一个数字是A选择该格子时的收益,第二个数字则是B的收益。如果两人都不招,也就是左上方的格子,由于证据不足,只能判轻罪,假设是坐牢一个月,所以两人的收益都是-1。如果两人都招,也就是右下方的格子,证据充分,能判重罪,假设是坐牢两年,所以两个人的收益都是-24。如果一个招另一个不招,那么还是证据充分,能判重罪,但根据“坦白从宽,抗拒从严”的原则,主动招供的给予免罪的奖励,不用坐牢,收益是0;而不肯招供的则罪加一等,加重惩罚,要坐牢三年,收益是-36。所以左下角的格子是A招B不招,A的收益是0,B的收益是-36;反之,右上角的格子是A不招B招,A的收益是-36,B的收益是0。



先站在A的角度来看,他应该选招还是不招呢?因为B也有招与不招的两个选择,所以要把这两种可能性都设想一遍。先设想B选择招,他这样的选择就限定了A只能在右边的两个格子中选择。右上角的格子是A不招B招,A的收益是-36;右下角的格子是A招B也招,A的收益是-24,自私的本性决定了A会选择招,因为-24的收益大于-36。再设想B选择不招,他这样的选择就限定了A只能在左边的两个格子中选择。左上角的格子是A不招B也不招,A的收益是-1;左下角的格子是A招B不招,A的收益是0,自私的本性决定了A还是选择招,因为0的收益大于-1。也就是说,无论B选择招还是不招,A的最优选择都是招。这种情况在博弈论里叫做“优势策略”。博弈论又有人翻译成策略论,因为分析的是博弈的参与者要怎么选择策略。


再换到B的角度来看,既然A已经选择了招,这就限定了B只能在下面的两个格子中选择。左下角的格子是A招B不招,B的收益是-36;右下角的格子是A招B也招,B的收益是-24,自私的本性决定了B也选择招,因为-24的收益大于-36。也就是说,两人都会选择招供,这就是博弈均衡。


您可以看到,在决策过程中,这两个囚犯都严格遵守自私的假设。但是最后分析出来的博弈均衡,也就是右下方的格子里的收益,对他们双方整体,注意是整体,不是单一个人来说,是四个格子中最糟糕的。怎么看整体收益呢?那就是把两个人的收益加总起来。左上方格子是两人都不招,收益都是-1,整体的总收益就是-2;左下方的格子是A招B不招,A的收益是0,B的收益是-36,总收益就是-36;右上方的格子是A不招B招,A的收益是-36,B的收益是0,总收益还是-36;右下方的格子是两人都招,收益都是-24,总收益就是-48。所以这四个格子中的总收益,最高的是左上方的格子,也就是两人都不招;最低的是右下方的格子,也就是两人都招。如果要追求整体利益最大化,左上方的两人都不招的格子才是最优的,右下方的两人都招的格子不仅不是最优,甚至比另外两个格子的一人招一人不招的情况都更差,是最劣选择。


这就是为什么这个博弈叫“囚徒困境”。为什么是困境?因为所有人都遵守着自私的假设追求个人利益最大化,最后得出的均衡却是集体利益最小化。自私的另一种说法是理性,囚徒困境似乎证明了个人理性合起来却导出了集体非理性!听过第一季课程就该知道,很多经济学家一说起非理性就会高潮,这个囚徒困境推导出来的集体非理性尤其高潮得厉害,因为另一个跟博弈论同样地大红大紫的“行为经济学”也是在非理性上大做文章,但他们是直接修改自私或理性的基本假设,稍微懂点科学方法论的人都能看出这纯属胡闹。这里的囚徒困境可就没有犯那么低级的错误了,却在严格遵守自私假设的前提下,竟然貌似非常合乎逻辑地推导出集体非理性的结果,这还能不高潮迭起吗?


2)用博弈论分析卡特尔失败的原因


再说怎么用博弈论来分析卡特尔失败的成因。

这里我们把两个囚徒改成两个生产者,那就是双头垄断。两个选择就变成是遵守卡特尔的协议减产,还是不遵守卡特尔的协议不减产。如果两人都遵守协议,都减产,产量下降价格上升,两人都赚了,这是对整体来说最好的结果。但如果两人都不遵守协议,都不减产,产量增加价格下降,那就两人都亏了,这是对整体来说最差的结果。还有两种情况就是其中一人遵守协议减产,另一人不遵守协议不减产,于是不遵守的人占了遵守的人的便宜。传统经济学的分析是说因为欺骗导致大家都选择不遵守协议,囚徒困境的分析是把大家都不遵守的情况放在右下方的格子里,虽然个人都按照自私假设选择了对自己最有利的,最后却落到这个整体最差的博弈均衡之中。


上次课说博弈论没有解释力,支持博弈论的人肯定是不同意的。就以囚徒困境为例,这个博弈如此经典,一方面是故事有趣,另一方面也是因为据说它能解释很多现象。除了貌似解释了卡特尔失败的原因之外,还解释了可口可乐和百事可乐竞相投入巨额经费做广告的现象:这两家饮料巨头如果都不做广告,他们的知名度是一样的,就都平分市场。但他们都不敢这么做,非要花巨资做广告,因为他们害怕如果自己不做广告,对手却做了广告,那么不做广告的就寂寂无名,做了广告的就大名鼎鼎,结果是市场被做广告的那一家全占光了,不做广告的就完蛋了。于是大家不管三七二十一都要做广告,结果两家还是同样的知名度,还是平分市场。总之,无论是做广告还是不做广告,只要两家做同样的事情,要不一起做广告,要么就一起不做广告,结果是一样的,都是平分市场。但大家都不做广告就能节省了巨额的广告费,本来是最好的结果。但大家更怕出现自己不做而对手做、光是对自己不利的一边倒的情况,于是都争相做广告,一起落入右下角那个集体非理性的博弈均衡之中。


以上都是商业领域的现象,囚徒困境貌似还厉害到能跨界解释政治领域的现象,那就是美苏争霸。当年冷战的时候这两个超级大国都拼命搞军备竞赛,最有代表性的就是制造了很多原子弹。如果美苏两国都不搞原子弹,这个世界是和平的,因为双方都没有足够的军事力量毁灭对方。但他们都怕如果我不搞原子弹,对方却搞了,那我岂不是很危险?他能凭着原子弹来威胁我,我只好听命于他,这个世界不就被他称霸了吗?那可不行,必须搞原子弹!于是美苏两国都搞了原子弹,但都搞了之后还是不敢打仗,因为爆发核战那是会同归于尽的,结果世界还是和平的。这看起来又是囚徒困境,跟刚才的可口可乐和百事可乐做广告的例子很相似,只要美苏两国做的是同样的事情,要不就是都不搞原子弹,要不就是都搞原子弹,结果是一样的,世界和平。既然如此,为什么要搞原子弹呢?花了那么多钱搞军备竞赛,制造了一大堆从来不用的原子弹,这不是很浪费吗?都不搞原子弹多好啊,这本来才是最好的结果。但双方都怕出现自己不做而对手做、光是对自己不利的一边倒的情况,于是都争相搞原子弹,又是一起落入右下角那个集体非理性的博弈均衡之中。


把囚徒困境的故事一般化了之后,左上角那个对整体最有利的格子称为“合作解”,就是两个囚徒合作一起不招供,两个寡头合作(也就是勾结)一起减产提价,可口可乐和百事可乐合作一起不做广告,美苏两国合作一起不搞原子弹。右下角那个对整体最糟糕的格子称为“不合作解”。明明合作解对双方都有利,但双方只顾打自己的小算盘,能成为均衡的就只是不合作解。


以上内容来自专辑
用户评论
  • 惠悟

    👌曾老师

  • 1369816qdma

    YH20210121-2

  • 1369816qdma

    20200904

  • 行者斗战胜佛

    ⊙ω⊙⊙ω⊙⊙ω⊙

  • 1397646livg

    好,嗯 see