先介绍一下"三门问题"
这是一个电视节目,台上有三扇关着的门,其中两扇门后是羊,一扇门后是豪华跑车,你可以选其中任何一扇,如果是车,就归你了,是羊也归你了。于是,你随机选了一扇(假设是1号门)。按规则,主持人打开了其中一扇门(假设是2号门),让你看到这扇门背后是羊,并给你一个机会,你可换一扇门(即从1换成3)。你的选择是“换”还是“不换”呢?
这个问题,其实很复杂.稍后.
下面介绍贝叶斯
这个问题很简单,P(A|B)=P(B|A)*P(A)/P(B)
下面开始贝叶斯计算.
事件A:1号门后面是车,P(A)=1/3
事件B:主持人开了一扇门,门后面是羊
事件A|B,开了一扇门是羊的前提下,1号门后面是车
事件B|A,1号门后面是车的前提下,开了一扇门是羊,由于只有一台车,P(B|A) = 1
于是 P(A|B) = P(B|A)*P(A)/P(B) = 1 * 1/3 / P(B) = 1/3 / P(B)
关键点是P(B)。P(B),主持人开了一扇门是羊的概率。这分为几种情况:
第一种,主持人知道结果,主持人必须开一扇有羊的门,即P(B)=1,于是:
P(A|B) = 1/3
此时,换门是有利的。
莫急,请问,电视台会做出这种限制么?难道,电视台不允许主持人随机应变么?主持人打开有羊的门的动机是什么?假设1号门后边是羊,主持人打开了一扇有羊的门,增加游戏的趣味性。那么,假设1号门后边是车,主持打开了一扇有羊的门,误导参与者换门,是不是更有趣味性?请想一下。
第二种,主持人不知门后是什么,电视台跟主持人玩趣味。他打开一看,羊,然后问你,你要不要换?他打开一看,车,哇,你失去机会了 ,下一位...
他随机开一扇门,门后有羊的概率是2/3,即,P(B)=2/3
因此 P(A|B) = 1/3 / (2/3) = 1/2
这种情况,换不换都一样。
第三种情况,主持人知道后边是什么,他怎么开门取决于节目需要。
这种情况,变成了博弈。P(A|B)是高度不确定的,如果确定,电视节目失去了收视率,一定要让参与者找不到规律,增加偶然性,才能增加趣味性。从常识出发,只能是1/2.
这个问题在投资中很重要,但是,不容易。有些现象反复出现,自以为找到了规律,但是,从常识出发并不构成规律,甚至反常识,那么,我们选择反常识还是选择常识?我们选服从短期的数据挖掘还是选择更加久远的统计规律?
贝叶斯在数据挖掘和人工智能里面用的非常多,但是,并非用了贝叶斯就瞬间高大了。贝叶斯也有可能仅仅做了数据拟合,过度挖掘。