今天介绍一个计算机科学相关的课程——博弈论。
我们来举两个贴近生活的例子。
撩女人困境
假设:
你和你宿舍另外一个男生,同时看上了班上一个妹子。
你俩拼命追求,但因为那妹子太受欢迎,结果水涨船高,人家整天摆足架子,因此你俩都追得很累。
因此,一天晚上,你俩在宿舍开了个会,室友提出一个解决方案:
“你看,我俩一起追,她太傲娇。
不如这样,我们现在约定,本学期都不追,这样她就会感觉自己似乎突然不受欢迎了,就会丧失优越感,我们再追就简单多了,你觉得如何?”(假设就这俩哥们追)
如果你学过博弈论,脑子里一定会浮现出这句话:
你个糟老头子坏得很,我信你个鬼!
你这方案只是帕累托最优,不是纳什均衡,不稳定。
在我们介绍“帕累托最优”和“纳什均衡”这两个概念前,我们先理清思路。
目前一共有四种策略:
a. 都追。
b. 都不追。
c. 他追你不追。
d. 你追他不追。
我们可以列举出这四种策略下,你们各自的收益或损失:
帕累托最优,是多个人参与某个资源分配的一种理想状态,这个状态就是:
不可能在不伤害任何一个人利益的同时,使得至少一个人的境遇变得更好。
需要指出的是,帕累托最优只是各种理想态标准中的“最低标准”。也就是说,一种状态如果尚未达到帕累托最优,那么它一定是不理想的,因为还存在改进的余地。
上图中含有三个帕累托最优:
b. 都不追。
c. 他追你不追。
d. 你追他不追。
我们用红色区域标出来了。
为什么它们是帕累托最优呢?
以右下角的策略b为例。
在这个策略中,两人的得分都是3分。而我们发现,不存在任何一个其他策略,可以在不降低任何一个人打分的情况下,增加另一个人的得分。
策略c和d也是一样,因此,他们都是帕累托最优。
而唯一的一个非帕累托最优,即策略a,是一个双输的局面。
可是问题在于,这个看起来最不好的策略a,这个连帕累托最优都不是的策略,却是现实中大家都会采用的策略。
这个策略就被大家称为纳什均衡。
纳什均衡的前提,是参与博弈的每个人,都站在自己的角度来看问题,都要最大化自己的收益。
我们按照这个假设再来思考这个问题:
虽然这个家伙今天跟我说了这么一个规则,但人心隔肚皮,我可不能完全信任他。我得考虑在任何情况下如何最大化自己的收益。
因此,你很容易进入这样的思路:
• 如果他不追,那么我应该追。因为我追的话,很容易追上(5分),而如果我不追,我只能得3分。
• 如果他追,那我也应该追,因为这时,我追还有点希望(可能得1分),而不追就彻底出局(0分)。
所以,无论你室友采取哪个策略,你都应该毫不犹豫去追。
这种“不管对手怎么做,某个策略都是最好的”策略,就是压倒性策略。
当博弈中出现了压倒性策略,一个理性的决策者都应该毫不犹豫地选择它。
当然,如果你的室友也不笨,他也会选择去追。
这样,你们两个博弈的结果,就到了纳什均衡点上:
你们都去追,你们都只能得1分,落到一个连帕累托最优都不是的结局。
两个聪明的直男博弈,可能落得一个双输的局面。
学生补课
类似的例子还有小朋友的补课问题。
现在别人都补课,都学奥数,你敢不学么?
这种无奈“被参加”各种课外辅导班的现象,也是一个博弈过程。我们也可以按照上面的方法建立一个模型,具体请参考专栏“刘雪峰·信息思维课(第一季)”第81讲,此处从略。
解决方法
在这两个例子中,为什么博弈的结果连帕累托最优都不是呢?
因为在博弈中,帕累托最优是个不稳定的局面。
就算一开始博弈双方商量好了,但将来也会有一方出于自身利益的考虑,偷偷改变策略。虽然这个策略会伤害对手利益,但这么做对自己很有利。
这就是人性。
而纳什均衡,是每个人出于自身利益考虑的结果,它是稳定的。
这就好比下图中的小球。
虽然处于高点的小球可以维持平衡,但它是不稳定的,稍微受到扰动,位置就会迅速发生变化。而处于低点的小球位置是稳定的,这就是纳什均衡点。对于中小学补课的现象,有几个方法可以打破这个坏的纳什均衡。
第一种方法,就是大家商量好,都不补课。
当然实际中这个很难操作,不可能实现。
所以,作为这个方法的替代品,就是国家从行政上禁止中小学生补课,这就是为什么国家三令五申禁止补课的原因。
这种情况下,相当于博弈双方被强制达成一致意见,因此可以打破原有的坏的纳什均衡点。
但是,行政命令下达之后,也会出现“上有政策,下有对策”的情况,各种课外辅导班改头换面,仍会有相当市场。
行政命令从来不是打破纳什均衡的有效手段,因为这是和人性作斗争。
那么,更好的方法,就是除了高考这一条路外,让每个孩子都有更多接受好的教育的机会和途径。
例如,开设好的民办、私立大学,开设高等技师培训,让之前唯一的高考,变成一个百花齐放的战场。
这样,就完全打破了博弈规则:不补课的那一方,就不会处于完全劣势,这个坏的纳什均衡自
然就被打破了。
现在,这条路也在初显端倪。
感谢互联网时代。
互联网创造了无数机会,不仅让办大学、办教育机构的门槛变低,而且让孩子们的学习途径也变多了,就业市场也变得更多样化。
换句话说,游戏规则正在慢慢改变。