你好,我是Ben,欢迎继续学习《激励设计:从加密经济学到token经济》第三节《博弈论基础》。这节课,我们会了解博弈论的基础概念,并且用一个经典的博弈论例子来帮助大家理解博弈论。
博弈论是什么呢?
博弈论,英文叫Game Theory,其实就是一个研究如何做决策的学科。具体来说,博弈论研究的是“决策主体的行为在直接相互作用时,如何进行决策,以及这种决策如何达到均衡“的问题。听起来有点绕?其实,就是说,人在决定采取哪种行动时,不但要考虑自身的利益和目的,也要考虑到自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。
举个例子。打麻将就是一种博弈,我出牌时,不仅要考虑出了这张牌后自己的牌有没有变好,还要考虑其他人的行为,比如别人会不会碰、吃、胡牌等,因为别人的行为也会影响到我的输赢。所以为了赢最多的钱,我应该综合考虑,再选择最佳的出牌方案。
那博弈论为什么重要呢?
因为它有一些预测的价值,考虑到不同人的自身利益和市场激励,博弈论可以起到一些市场预测的作用。如果我们能够识别出设计得不好的市场激励,那么我们就能预测表现不佳的市场。
那怎么可以识别出不好的激励呢?我们来聊一个经典的博弈论例子——囚徒困境(Prisoner's dilemma)。
“囚徒困境”说的是两个囚犯的故事,我们可以叫他们囚犯A和囚犯B。这两个囚犯一起做坏事,结果被警察发现抓了起来,分别关在两个独立的、不能互通信息的牢房里审问。在这种情形下,两个囚犯都可以做出自己的选择,要么供出自己的同伙,要么保持沉默。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?我在文稿里面给大家准备了一张图,大家可以结合表格来听下面的分析。
从表面上看,两个囚犯应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果,那就是自由。但他们不得不考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会供出他,然后带着一笔丰厚的奖金出狱,留下他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙B也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨到只会保持沉默,那么他就会是那个获得奖金出狱的幸运者。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不用再被罚款。所以结果就是,这两个囚犯得到了最糟糕的报应——坐牢。
因为两个囚犯互相背叛,所以警察知道了囚犯A犯了什么罪,也知道囚犯B犯了什么罪,结果是,两个囚犯都被判了刑,这就是博弈论的一个典型案例。
这个里面还有一个概念是叫纳什均衡,那这个是什么意思呢?
还是拿上面的例子来说,囚犯A和囚犯B两个人,分别从自身利益出发,选择了最符合自己利益的选择,那这个时候达成的结果就是一个纳什均衡。但是纳什均衡并不总是等于最优解。比如,在囚徒困境这个例子里,纳什均衡是双方都出卖对方,因为每个人都追求自身利益最大化,但是这导致了双方都得到了最糟糕的结果,也就是被判刑最长时间。
电影《美丽心灵》中,扮演约翰·纳什的Russel Crowe说“亚当斯密错了”。因为亚当斯密认为,当个人追求自身的利益时,整个社会会变得更好。但是在囚徒困境的例子中,我们能看到,如果每个囚徒采取自身利益最大化的策略,就能达到纳什均衡点,但在这个点上,两个囚徒的效用并没有采用合作策略的时候高,他们的结果没有变得更好。
从这个案例中,如果从最终囚徒的收益来看,我们可以看出来,这个场景的激励设计不好。因为,在这个设计中,囚徒有背叛对方的动机,因为不管对方采取什么行动,背叛的收益都更高。如果说有一个更好的,可以让对方互相合作的激励,就不会造成双方都坐牢的结果。好的激励设计是应该能够保证不同的玩家合作的利益要比背叛的利益高。所以呢,如果我们是在这样的例子里面,我们作为市场设计者,我们的目标应该是把这个规则再重新修改一下,从而做到、提高合作的激励,降低背叛的激励。所以这个例子的用处,是为了让你知道、不同的设计市场是什么样子,怎样去优化一个市场。
在这里,我们可以一起思考一下这个问题:为了帮助两个囚徒合作来达到更高的效用,你会怎么改进囚徒审问的机制,使得囚徒有更强的动力去合作呢?
接下来,我们看一下比特币中的博弈论是怎么设计的?
这个规则在比特币挖矿协议中写的很清楚。如果你要是一个矿工,你要挖最长链,就是说应该在工作量最多的那个链上去挖矿。如果你挖矿成功,会奖励50BTC和相应的一些手续费。但是呢,因为比特币是一个去中心化的网络,它不会强制你在哪边挖矿,所以说对于一个矿工来说,我可以不守规则,我可以在其它的小链去挖矿,这就会造成分叉,甚至可以发动攻击去篡改最长链。总之,我有很多不同的选择,那为什么矿工还会选择、在最长链上挖矿呢?因为我们都知道不守规则的结果是什么。
首先如果我不在最长链上去挖矿,我的计算不会被验证,我不会得到50个BTC的奖励;同时我浪费了电费和算力,因此我会有负收益。
而如果我要发起攻击,需要51%的算力才能篡改现在的最长链,这个需要大量的矿机,电力及矿场建设成本,即使攻击成功,社区也可能通过硬分叉在新链上不承认双花的交易,旧链随着社区共识的转移会逐渐被弱化,价值降低。所以,比特币挖矿的机制设计,一般不会让我去做攻击的选择。
所以说,比特币的激励是一个很好的激励。它可以让互相不认识,互相不信任的矿工选择对于整个网络最佳的一个决策。如果所有的人都不守规则,那就很乱,比如说我不守规则,他也不守规则,那我们大家都是负的收益,因为我们都在浪费。然后对于一些用户而言,比如说我发一个交易到比特币的链上,那这个确认会很慢,因为所有的矿机不是在同一个链上面去挖矿,这样整体的区块确认时间什么都会很慢,所以说对于大家都不利。所以在这样的一个规则下,矿工都会选择在最长链上挖矿。
好,以上就是我们这节课的全部内容。我们来总结一下。
在这一节我们讲了博弈论的定义以及它的几个关键概念,还有我们讲了囚徒困境这个例子,也从这个案例中引出纳什均衡的概念,以及什么是一个好的激励设计,我们应该怎么设计一个好的激励。以及比特币中的博弈是怎么设计的。
最后,给大家留一个思考题,通过这节课的学习,可以试着用Payoff matrix收益表格,这个工具来分析下、以太坊或者其他区块链项目里面的激励设计,你认为这种设计, 能达到好的均衡吗?
区块链是最新的经济机制!
著名经济学家、诺贝尔奖得主萨缪尔森曾说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”近20年来,共有16位经济学家因在博弈论及相关领域的...
要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。博弈无处不在,从战场到商场,从政治到管理。从恋爱到婚姻,从生活到工作,几乎每一个人类行为都离不开博...
人生是一场永不停息的博弈过程,人永远是博弈的局中人。
古语有云:“世事如棋”。生活中的每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精灵慎重的棋手们相互揣摩,相互牵制,人人争赢,下出诸多精彩纷呈,变...
新到的一本书,报着试试的态度又开始录啦,读的可能不好,内容可能深奥,也可能有语气问题。人生是一场,永不停息的博弈过程,人永远是博弈的局中人……
人生是一场永不停息的博弈过程,人生永远是博弈的局中人
精通博弈论的人,一般也不大愿意让别人知道自己精通博弈论。因为那样带来的麻烦,从长期看,可能会远多于赢得这种名声的好处。整个二十四史,不都在反复证明一个道理——聪...
以太坊因为有智能合约,引入了新的角色“项目方”,原有的博弈结构被打破。