本期课程原文
今天我们继续来给大家介绍定向推理的第二部分内容,就是如何剔除下策。
我们上一讲给大家介绍了定向推理实际上是包含两部分内容,定向推理包含两个部分。
第一部分是说如果局中人有上策的话,他一定会使用上策,需要我们给定对手的上策来考虑对策。另外一种情况,如果说局中人没有上策,那么我们就要看一看他有没有下策。
如果说他有下策的话,我们要剔除他的下策,再来考虑对策。
什么是下策?其实上一次给大家提到过了,所谓下策就是指局中人某一个策略,不管对手使用什么策略,他使用这个策略所带来的报酬总是比其他的策略小。
这个概念在教科书上被称为是叫弱劣策略,或者是叫劣策略,或者是叫被占优策略等等。
那么在现实生活当中,下策表现在什么地方。我们可以回顾一个大家都非常熟悉的历史故事,来看一下。历史故事就是我们大家都知道的田忌赛马。田忌他是齐国的将军,齐王找他来赛马。齐王有三匹马,分别是上马中马下马,田忌的同样也有三匹马也是上马中马下马,但是田忌的马相应的都不如齐王的马要好。
因此比赛的时候,齐王出上马,田忌也跟着出上马,齐王出中马,田忌也出中马,齐王出下马,田忌也出下马,结果是上对上,中对中,下对下。
田忌三战皆败,田忌输给齐王1000两黄金,非常懊恼,回到家里就给他的军师孙膑讲,说你看大王太不像话了,明明知道我的马比他的马差,不如他的马好,非要找我比,拿我寻开心,你看这1000两黄金又没了。
我们知道孙膑听完之后说给田忌出个主意,说你要是心疼你这1000两黄金的话,我有一个办法,让你回去之后用这三匹马就可以把金子给赢回来。
田忌不相信,说不可能,我的马比田齐王的马都要差,怎么可能赢他呢?那我们都知道,田忌给孙膑出一个主意,说齐王出马的顺序,是上中下。
那么你要调整一下你出马的顺序,你可以把你出马的顺序改为是下上中,先出下马,拼掉对方最好的上马,然后再用自己的中马赢对方的下马,然后用自己的上马赢对方的中马,再用自己的中马去赢对方的下马,三打两胜你不就赢了,这样一来的话,田忌就听从了孙膑的建议,找齐王去再比。 果然齐王出马的顺序还是上中下,他很轻松地用下上中把金子又赢了回来。
这个就是我们大家都非常熟悉的田忌赛马的故事。这个故事当中你会发现孙膑的高明之处在于什么地方?就在于他料定齐王一定会出上中下这样一个顺序,顺序其实就是齐王的一个赛马的策略。
他料定齐王的策略一定是上中下,但是上中下是不是齐王的上策呢?
按照我们上一讲所讲的上策是,不管对方出什么策略,你出这个策略总是最好的。但是很显然,对于齐王来讲,他上中下出场的顺序并不是他的上策。
只要田忌调整一下出场自己马匹的出场顺序,改成下上中的话,他的上中下就变成了下策,所以他的上中下策略就不再是一个上策了。
所以说我们可以看到,其实孙膑是看出来了,齐王上中下策略其实并不是齐王的一个上策,然后有针对性地选择下上中这个策略,把齐王给打败了。
这个故事当然能够体现出孙膑的高明之处。但是我们大家想一想,如果说你是齐王的话,你的马比田忌的马都要好,结果你出一个上中下,被田忌出一个下上中给赢了。你服气不服气,我想我们很多人肯定不服气。
如果说齐王不服气,要求再比的话,大家想一想,假如说你是齐王,在这种情况下你会怎么出马?
其实你会发现在博弈当中,齐王有一个策略,保证他能够立于不败之地。这个策略就是要求田忌先出马,田忌你先出,如果说田忌先出一匹下马,齐王也出下马,田忌再出上马,齐王也出上马,田忌再出中马,齐王也出中马。
你田忌如果说要是出下上中的话,齐王也跟着下上中,齐王还能赢。
如果说齐王要求再比的话,我们可以看到,那田忌还得输。这说明什么?这说明我们大家都非常熟悉的田忌赛马,这里边的推理逻辑是有一些问题的。
这个问题就是说他把这样一个定向推理的原则给定对手,使用上策来找自己的对策,用到田忌赛马这个事情上实际上其实是不太成立。
原因就在于在田忌赛马这个故事当中,其实齐王的上策,一开始的上策并不是很明显的,并不是确定性的。
所以说当一个博弈当中,如果说对方的上策并不是很确定的话,如果我们想用定向推理的方式的话,就要考虑什么是对方的下策,我们需要排除掉对方的下策之后,再来考虑对方的策略选择,如何排除对方的下策,我们这里给大家举另外一个例子。
这个例子我们把它称为是叫大小猪博弈。
大小猪博弈是指在一个长方形的猪圈当中,生活着两头猪,一头大猪,一头小猪。在猪圈的这一头是装有石槽,在猪圈的另外一头是装有按钮,两头猪要想吃东西的话,得先跑到装有按钮的那头去按这个按钮,但是按这个按钮是要付出代价的。
一头猪跑过去按的话,不管是大猪去按,还是小猪去按,都要付出两单位食品的代价。如果说两头猪一块跑过去按的话,每头猪需要各付出一单位食品的代价,不去按不用付出代价。
但是这头也没有东西吃。如果说有猪去按,不管是大猪去按的,还是小猪去按的,还是两头猪一块去按的,只要有猪按了,这头的石槽就会出现八份食物。
那么这八份食物在两头猪之间是如何分配的?就看两头猪是如何去按的了。
如果说大猪去爱,小猪不去按,小猪在这一头的石头旁边守着,大猪跑过去,按完跑回来之后发现小猪已经吃了三份了,他能吃掉剩下的五份,但要补偿他按按钮所付出的两单位的代价。因此它的净收益其实也是三。
所以这是小猪不按,大猪去按的结果。如果说大猪去按,小猪也去按,两头猪一块去按的话,按完之后跑过来吃,大猪能吃六份,小猪能吃两份,但是需要各自刨掉一单位的成本,大猪的净收益还剩下五,小猪的净收益就还剩下一,这是两头猪都去按的结果。
如果要是说小猪去按,大猪不去按,那么大猪在石槽守着,小猪跑过去按,按回来之后就发现大猪已经吃了七份了,它只能吃掉一份,但是它按按钮的代价是两份,所以说刨掉这个代价之后,它的净收益就变成负一了。
当然如果说小猪看到大猪不按,它也不按,两猪都不去按的话,没有东西吃,净收益就是零,因为它们也没有付出代价。
所以这是这两头猪在猪圈里进行博弈的四种结果,我们给大家梳理一下,哪四种结果呢?
就是第一种结果,两头猪都不去按,大家的净收益也就都是零。
第二种结果是两头猪都去按。那么结果是大猪的净收益是五,小猪的净收益是一,这是两头猪都按的结果。
还有一种情况是大猪去按,小猪不按,两头猪的净收益就都是三。
还有就是说小猪去按,大猪不按,结果是大猪的净收益是七,小猪的净收益是负一。
这是四种不同的这种结果。大家想一想,如果要让你来做决策,并且让你在博弈当中去扮演猪来做决策,决定自己是按还是不按。
你会发现按和不按对你来讲。首先你找不到自己的上策。如果说小猪不按的话,你要是不按的话是零,如果你要按的话就是三。所以说给定小猪不按,你去按是最好的。反过来,如果让小猪去按的话,你不按是七,你按的话是五,七比五好。
所以说对于大猪来讲的话,给定小猪按,你的最佳策略是不按。所以说对于大猪来讲,它没有一个上策,不管你小猪按还是不按,我总是按或者总是不按,它并没有这样一个策略,所以大猪没有上策,但是他也没有下策。
所以说这种情况下说我大猪也没有上策,也没有下策该怎么做决策。
其实他要看一看小猪有没有下策。我们来看看小猪的策略,要么是按,要么是不按。如果它是选择按的话,大猪也按,那么它的收益是一,大猪不按,它的收益是负一。
所以这种情况下对于他来讲的话,按的结果要么是一,要么是负一。但是如果它是选择不按,不按的时候,大猪选择按。它不按它是三,如果大猪不按的话,它也不按它是零。
我们对比一下,对于小猪来讲,它选择按,结果要么是一,要么是负一,选择不按的结果,要么是三,要么是零。三比一好,零比负一好。
所以对于小猪来讲,那么选择不按就是它的上策,选择按就是它的下策。我们前面讲过,只要小猪是理性的,只要它会算账,那很显然,不按总是要比按要好,就是不按是它的上策,按是它的下策,它一定会选择不按。
给定小猪一定选择不按,大猪按是三,不按是零,三比零好,所以博弈的结局应该是大猪按,小猪不按。
这样一个博弈的结局大家知道首先是要告诉我们,就是说如果你是参与博弈的一方,你找不到自己的上策或下策的时候。
你要看看对方有没有上策或是下策,如果说对方有上策的话,他一定会使用上策,没有上策看他有没有下策,偶尔他有下策的话,他一定不会使用下策。
这样一来的话,当我们一旦考虑清楚了对方的确定性的选择,我们就可以进行这样一种定向推理。
其实我们大家也都知道,像福尔摩斯断案的时候,他也讲到,当你排除了种种不可能以后,剩下的唯一的一种可能,不管听上去多么不可思议,他一定是必然的。
其实这也是当我们在博弈当中遇到对手有下策的时候,你把对手各种不同的下策去掉之后,剩下来的唯一的策略一定是他的最佳选择。
所以这个就是我们给大家所讲的,在推理过程当中所使用的这样一个定向推理或者是叫确定性原则。
当然大小猪博弈其实它还有一些其他方面的含义,这些含义我想我们下节课结合着现实再来给大家做一些分析和介绍。这次课先介绍到这里,好,谢谢大家。
当自己没有上册也没有下册的时候,分析对手是否有上册,如果有一定会用,那我们就做基于对手上册(不管对手采取什么策略都是最好的策略)的策略,如果对手没有上册,那我们看他是否有下册(不管对手采取什么策略都是最垃圾的策略),如果有,那他一定不会用
^1……/:义Ⅶ二∵
非常好
王教授您好,我想问下博弈论和哲学的关系,谢谢您!
终于明白国企和民企的博弈了