《随机漫步的傻瓜》概率问题的思考

发布于: 修改于:雪球转发:0回复:0喜欢:0

《随机漫步的傻瓜》一书中提到了一个经常让人直觉性掉入陷阱里的例子:

        假设某种疾病在全部人口中患病几率是0.1%,且某种检验方法检测改疾病的误报率是5%。如果某人检测结果呈阳性,则确实患病的几率有多少。

从直觉上看,误报率是5%,也就是有95%的概率,用户是患病的。

但正确结果是1.87%左右。推导逻辑如下

        逻辑上存在4种情况:患病误报,患病非误报,无病误报,无病非误报。

        患病误报:0.1%*5%=0.005%,结果为阴性

        患病非误报:0.1%*95%=0.095%,结果为阳性

        健康误报:99.9%*5%=4.995%,结果为阳性

        健康非误报:99.9%*95%=94.905%,结果为阴性

所以,结果为阳性且患病的概率是 0.095% / (4.995%+0.005%)≈1.87%

那么,问题来了,为什么结果并不是直觉中的95%呢:

        问题出在了直觉中,认为阳性结果中误报的分布,和整体样本中误报的分布相同。

 但实际上拆开看一下就会发现,实际上阳性结果的样本中,存在两个人群:患病非误报、健康误报。两个人群,一个是误报,一个是非误报,并且数量级相差极大。