王小龙,陕师大数统院讲师 阅读原文 一个好好的数学问题为啥没人正经答题呢? 先说结论:两种策略的赢率是一样的,但是赢率的波动性大小不同。 假设你叫小明,玩一把游戏的获胜概率是 ,输的概率是 ,各局游戏相互独立,有两种游戏策略:输了就睡觉和赢了就睡觉。这就带来几个问题: 什么时候能睡觉? 胜率如何? 如何稳赢? 为了分析这些问题,定义随机变量 和 分别为采取"输了就睡觉"和"赢了就睡觉"策略玩游戏的总局数,那么由独立性条件可以得到概率: 即前 局连赢(输),第 局游戏第一次输(赢)的概率,这个分布称为几何分布。注意这两个分布具有对称性(把 和 对调,问题只是换了一种陈述)。 问题 1:什么时候能睡觉? 计算游戏局数的期望: 类似地,由对称性: 因此 等价于 ,也就是说,如果小明的胜率 ,"输一把睡觉"能够更快地睡上觉。如果小明很菜, ,采用输一把睡觉的平均游戏局数为 也就是基本上玩一局就能睡觉啦。反之,如果小明错误的采用"赢一把睡觉"的策略,那么他平均需要玩 ,因此对于菜鸡来说,赢一把就睡策略的潜台词是我要通宵。 问题 2:胜率如何? 如果采取"输了就睡觉"策略反复玩游戏 天,每天一共玩 局,其中赢 局,输 局,那么总共赢了 局,输了 局,赢率为: 其中我们用到了大数定律,大量样本的平均值趋向于期望 如果采取"赢了就睡觉"策略反复玩游戏 天,每天一共玩 局,赢 局,那么总共赢了 局,赢率为: 因此如果每天采取同样的策略玩游戏,长此以往,两种策略的赢率是一样的,都是 。这类似于如果所有人都采用一直生娃,直到生出男(女)娃停止的生育策略,那么男女比率还是 1:1。 问题 3:如何稳赢? 现在小明有了三种游戏策略:a.只玩一把就睡觉,b.输一把就睡觉,c.赢一把就睡觉,上面我们推导出这三种策略的胜率都是 。但是在现实生活中,这三种策略的实际胜率具有随机性,其波动大小并不一样。这就好比你有三种股票可以选择投资,它们的平均回报率可能都是 5%,但其波动性不同:第一种股票稳赚 5%,第二种股票可能赚 1%-%9,第三种股票可能赚 15%,也可能亏 5%,只是平均而言赚 5%。小明的人生只有一次,因此当他选择投资方式时,应该选择波动性较小或者风险较低的投资方式,甚至为较小的风险、牺牲一定回报率也是值得的。这也是为什么国债虽然利率低,但总是很抢手,因为风险极低。 我们可以用胜率的标准差来衡量其波动性,假设小明是高玩( ),下图种展示了小明采取三种策略的胜率的均值和标准差,可以看到随着游戏天数增加,三种策略的平均胜率很快趋向于 0.9,但"输一把就睡"的 error bar 更窄,说明胜得更稳。 相反,下图表明如果小明是菜鸡( ),采取赢一把就睡的策略,不仅能够爽玩,赢率也更稳定。如果小明的目标是提高胜率,那么采取输一把就睡策略,胜率的波动性更大,更有可能高到 0.15 以上,但也有较大可能低到 0.05 以下,如果小明兼有赌狗属性,也许会不理智地选择这种高风险策略。对于理性人来说,当平均收益(胜率)相同时,总是应该选择低风险的策略。 总结: 两种策略的赢率是一样的,对于高玩( )采取赢了就睡觉策略能更快睡上觉,但赢率波动性较大,反之对于菜鸡( ),采用赢了就睡觉策略更难睡上觉。 阅读原文