33. 如何设计奖惩制度--博弈论的困境

33. 如何设计奖惩制度--博弈论的困境

00:00
10:06

大家好,我是大老李。这期继续讲有关博弈论的话题。上期结尾留下了一个思考题,我把题目简单再回顾下:


问题是这样,有个母亲,她有一对双胞胎儿子。儿子很调皮,她为了管理好她的儿子,想出了这么一个政策,她每天会准备20块钱,傍晚单独问她两个儿子,问他们有关另一个小孩在学校的表现。如果两人都说另一个表现的很好,那么他们会各得10块钱。如果其中一个报告了另一个的不好表现,则报告的可以得到15块钱,不报告的一分没有。如果两人都报告了对方的不好表现,那两人都只能得到5块钱。接下来有四个问题,让我们来一一解读。


本周题目:特殊价格的礼物

gifts

张三给家人采购了若干圣诞礼物。他买完之后看了下账单,发现一个有趣的现象:所有的礼物的价格都是完全平方数(某自然数的平方),且将所有礼物的价格写下来之后,数字1到9恰好各出现1次。

请问,张三的账单总额最小可能是多少?他买了几件礼物?


上期答案:

上周题目是:

你在玩一个非常规的飞镖游戏,飞镖版是一个半径1英尺的靶子。你的飞镖本领不够好,你的飞镖只能随机且均匀的落在靶子上的任何位置(即落点均匀分布在靶子上),但不会脱靶。

飞镖游戏的规则是这样的,你连续投掷飞镖,直到你的第n个飞镖落点与之前的飞镖落点距离小于1英尺。这样你就出局了,你的得分是n-1。问题是(从易到难):

可能的最高得分是多少?

得分超过1分的概率是多少?(也就是第二个飞镖距离第一个飞镖大于1英尺的概率)

你的得分期望值是多少?

 

第一个问题的答案是7分,形状就是下面这样:

 

maxscore.png

第二个问题,超过1分的概率大约是0.41,精确来讲是\frac{3\sqrt{3}}{4\pi}。计算方法如下:

首先考虑如下的图:

above1

蓝色的圆表示靶子,绿色的点表示你的第一个飞镖的落点。绿色的圆就表示“坏”的第二镖的落点范围。如果第二镖落在绿色圆内,则表示你的飞镖离第一镖距离小于1英尺,或者完全脱靶(虽然你的技术好到不会让你脱靶)。

因此,你要获得1分以上的得分,你要计算你的第二镖能避开“坏”的落点的概率,且这个概率值与第一镖的落点位置相关。设你第一镖位置与靶心距离是x,则上图中两圆的重合部分的面积,称为A,有:

A=2\cos^{-1}\left(\frac{x}{2}\right)-x\sqrt{1-\left(\frac{x}{2}\right)^2}

我们记得我们第一镖落在靶面位置上的概率是均匀的,则我们需要将x从0(第一镖命中靶心)到1(第一镖落在靶面边缘)进行积分。则最终的概率是:

1-\frac{1}{\pi}\int_0^1 (2x)(A)dx=\frac{3\sqrt{3}}{4\pi}

该数值大约为41%。

对第三题,使用积分运算也有点过于复杂了。有人使用python代码进行模拟(http://t.cn/RHz66tb),模拟了10万次掷飞镖的情况,得到了平均得分约为1.47。

另外我们知道我们恰好得1分的概率是1-41%=59%。计算显示恰好2分的概率大约是35%,恰好3分大约是6%,恰好4分大约0.1%,得5到7分的概率几乎可以忽略不计。有人制作了了如下柱状图,可以很直观了解:

freqplot.png

恭喜Stones答对了,Magician大部分思路正确!祝圣诞快乐,下周再见!

收听“大老李聊数学”音频                                        关注“大老李聊数学”

 

以上内容来自专辑
用户评论
  • 骑鹿仙人

    我不在乎谁得到多少钱,我只想睡眠好😊。

    1736370xvyv 回复 @骑鹿仙人: 钱💰只是比喻而已😄

  • 可爱萌的小鲜鱼

    我也认为诚实更重要。方法:我认为前两者都不要,换另一个问题比较好,即:你今天在学校做了什么事,你兄弟在学校做了什么事,我认为这是最客观的情况。而且单纯的“好坏”难以给出定义。

  • 然_qb

    如果我是家长,我会制定如下规则: 1、根据学习成绩确定平时零花钱数额。 2、做好事,给与奖励。 3、做错事,举报者奖励,主动承认可以减轻罚款。 4、做错不承认或举报错误,计入诚信分数,按百分比与第一条相乘。

  • 值得信赖_

    我的算法是:假设50盒子,每盒子红蓝两个球,总计100个球,25+25红球,15红球+15蓝球,10+10蓝球,总计65/35红/蓝球,双眼皮是抓两个蓝球概率0.35*0.35。不知道对不对,由于球始终在篮子里,没有增加或减少,那么不管多少代都是这个比例。

    大老李聊数学 回复 @值得信赖_: 结论接近了,但还不够精确。因为抓完的球还要随机放到一个盒子里。第二轮初始状态会有变化。

  • 数学真是太帅了

    期望值是……

  • 在水亿方

    支持大老李!!!!

  • 听友61457665

    较小的完全平方数,包含7的很少,从这里入手可以试出来,总共花了855元。

  • ouyexer

    加油

  • Minecart_彼得兔

    他们还会合作

  • 夏夜月清风

    这种制度最大的问题是,奖励跟报告的内容挂钩而不是和实际表现挂钩,这样不管你怎么样设计问法,两个孩子总是能发现,适当调整报告内容就可以使总受益最大化