一道数学题说明:人类有多不擅长概率思维?

发布于: 修改于:雪球转发:199回复:577喜欢:441

文/CxEric

昨天在雪球发了一个概率题,题目如下:

假定存在某种疾病,每1000人中就有1人患上该疾病;该疾病可以被检测出来,检测准确率为99%。如果一个人已被测出是阳性。问:他真的得了该疾病的概率是多少?


题目链接:网页链接

很多朋友给出的答案是99%。

但正确答案是:约9%。

一、解题过程

这个题目有多种理解方式,我提供两种计算思路,不一定是最佳思路。

第一种,是正儿八经地画概率树。

这个图是我随手画的,非常简陋,大家凑合看就好。

如图所示,显示阳性有两种情况:

1、有病——阳性,即【真阳性】

其概率为:0.001x99%=0.099%

2、没病-阳性,即【假阳性】

其概率为:0.999X1%=0.999%

题目给定条件是【已知阳性】,求在此条件下:【真阳性】的概率。

计算过程是:

0.099%÷(0.099%+0.999%)=9.016%

第二种,是一种简便算法。

假定有1000人,其中有1生病,其余999人为健康。

因此:

测出真阳性的人:1人

测出假阳性的人:999X1%=9.99

因此,当已知阳性,求此条件下真阳性的概率是:1/(1+9.99)

如果四舍五入,将9.99视为10,就会算出1/11(约9.091%)

如果不四舍五入,就会算出来:约9.099%

上述两种算法得出的结果都是约为9%,与直觉反应出来的 99%相去甚远。

这里的关键是,能否理解这是一个条件概率,随着【已知阳性】这个条件的出现,概率分布已经出现巨大改变,不能再按照直觉而去推断。

二、这个题目的启发

我昨天发这个贴的时候,其实关注点不是在题目本身,而是想以此说明,人脑其实天生不擅长理解随机性、概率这些东西,更别提以概率的方式来处理【预测】问题。

这个题目只是一个简单的条件概率模型,其难度最多是高中数学水平,但第一次就给出正确答案的人的很少。

昨晚一个有趣的现象是:

一个数学系毕业的朋友,给出的第一个答案是:99%;

一个统计学毕业的朋友,给出的第一个答案是:99%。

——太有趣了,数学很好的人也会被坑。

另一个有趣的现象是:一旦我告诉他们答案不对,很多人第二或第三次就能给出正确答案。

这个例子充分说明了卡尼曼在《思考快与慢》里说的,人脑思考问题有两个系统:

系统1:它的运行是无意识且快速的,完全处于自主控制状态,无法关闭。

系统2:它需要将注意力转移到需要费脑力的活动上来,它的运行通常与行为、选择和专注等主观体验想关联。

人类只有遇到觉得困难的问题、系统1碰壁的时候,才会调动系统2。

所以,昨晚没有答对的朋友大部分是低估了题目的难度,试图直接用系统1来解决问题,但在碰壁后,才认真起来,启用系统2,认真计算了一次。

我完全相信,如果他们不是在手机上看题目,而是拿着纸笔坐在考场,这个题目对他们来说就是湿湿碎而已。

三、概率题目与投资

最后,问题来了。

如果面对这么简单的概率模型,人脑都容易下意识给出一个错的离谱的答案(99% VS 9%),那在现实生活中、在股票投资过程中,人脑对概率的估计,又有多少成把握呢?

我相信,投资者总是过于高估自己的预测能力,其根源是人脑无法很好地理解随机性、概率思维。

一个常见现象是,投资者容易认为:在某时某刻,某股的下跌概率只有30%,但是上涨概率有70%。——这种概率估算有什么依据吗?有什么逻辑和计算吗?没有,就是拍脑袋而已。

另一个常见现象是,投资者和财经媒体,非常热衷于统计历史上“XX事件发生后次日的大盘涨跌的数据”,以此计算出一个【概率】,用来预测第二天大盘的涨跌概率。

比如,历史上某事发生了10次,其中有7次第二天大盘是跌的,于是媒体就会宣称,由于今天发生了该事件,因此明天大盘有70%的概率是跌的。

这是我见过最扯的概率计算,连高中生都不会接受。我建议读者无视这类“概率”分析。

此外,在玩这个游戏过程中有两点启发:

1、如果你低估问题的难度,你会更依赖系统1,这增加了你掉坑的概率;

2、不要太相信自己的概率估计,不要太相信自己对未来的预测(哪怕你已经觉得自己深思熟虑)

四、题目来自塔勒布

这个题目是我昨天在看Nick Sleep 的资料时看到的,但他又是从塔勒布那看到的。

塔勒布在《随机漫步的傻瓜》中,给出了一道一模一样的题目。

“我在行为研究的文献中至少找到偏差十分严重的40个例子。以下是个很有名的测验,也是叫医学界尴尬不已的实例。接下来的问题是给医生做的,引用自本内特写得非常好的一本书,叫做《你赌对了吗?》。

检验某种疾病时有5%的概率产生误报。全部人口有1‰的概率罹患这种疾病。不管是否怀疑罹患这种疾病,随机检测一群人之后,发现有个病患的检测结果呈现阳性,那么这位病患染上这种疾病的概率有多少?”

塔勒布给出的答案如下:

“大部分医生只考虑检测的准确率为95%,而回答95%。正确的答案是病患生病且检测发现有病的条件概率,其结果接近2%。结果有不到1/5的专业人士答对。

我来简化这个答案。假设没有漏报存在。1000个受检的病患中,预料将有一位罹患这种疾病。999位健康的病患中,检测的结果将有约50位染病,因为准确率是95%。正确的答案应该是,随机选取的某人,检测呈现阳性且确实染病的概率如下:

答案为1/51。

不妨想想,这一辈子你曾有多少次被告知染上某种疾病,需要接受某种药物治疗且忍受可怕的副作用,而实际上你真的罹患那种疾病的概率只有2%!”

五、再来一个题目

这个可能有点难。

在一个电视节目上,挑战者来到最后一关,他要从三扇门里选一扇门。其中一扇门背后是奖品,一辆汽车的钥匙;其余两扇门后面是一只羊。

现在,挑战者选了其中一扇门,但还没打开。

此时,主持人从没被选中的两扇门里,打开了一道门开给挑战者看:呐,这是一只羊。

然后,主持赋予挑战者一个选择权:你要不要换一道门?

问:他该不该换?

这个题目很有名,也非常有趣,答案也是反直觉的。

我迟些会在评论里放相关的讨论文章。

希望大家玩的开心




 $福耀玻璃(SH600660)$    $格力电器(SZ000651)$    $上证指数(SH000001)$   

 @今日话题    @雪球达人秀   

精彩讨论

老巴菜2021-08-04 05:24

患病那道题之所以反直觉,是因为题目本身不符合实际。因为实际检测错误率5%不是基于全人口为基数的,而是基于出现某种疾病症状然后去检测假阳性的概率为5%,比如肚子疼去医院。如果全人口肚子疼概率为1%,那么1000人肚子疼的总人数为10人,那么肚子疼假阳性人口为0.5人,真阳性者1人(假设不考虑假阴性问题),那么检测阳性的真阳性概率为1/(1+0.5)约为67%。检测阳性后准确率还是很高的,所以真实诊疗情况下,准确率高低还取决于让你去就医时候某种疾病症状的发生概率。题目也有真实场景对应比如体检或许新冠普筛,但你会发现体检有问题一般都要求你去专科进一步检测,目的就是通过多维度检测来确诊,而不会基于单一检测结果来确诊,多个检测手段即使单个准确率不高,但一叠加准确率就会很高了。这道理就跟肚子疼去就医一个道理,因为肚子疼就是一种最初级的自我检测,所以真实世界里还是不能轻易否定直觉,觉着医院都是垃圾

笑尘缘2021-08-04 07:59

真能写,一个贝叶斯公式,写了这么多,还居然敢说统计学的人回答不出来

东风蜗主2021-08-04 08:02

@东风蜗主:你这篇文章捏造的,数学系和统计学毕业生不可能给出99%的答案。这种问题对于他们类似于1+1等于几,属于常识。另外题目不严谨,99%的检测率只意味着真病检测出有病的概率是99%,但无病误检为有病的概率往往并不是同一个数字,题目没有给出这个条件。

NO53541682021-08-04 11:23

人类从悬崖掉下来摔死的概率是千万分之一,其中有一个人从悬崖下掉下来,他有99%的几率摔死,请问,他摔死的概率是多少? 按楼主的逻辑,套一下公式,然后告诉大家,摔死的概率小于10%。

啥也不说啥也不想2021-08-04 00:45

你第一个题的答案肯定是错了。就是99%
你认真看一下你的问题吧

全部讨论

患病那道题之所以反直觉,是因为题目本身不符合实际。因为实际检测错误率5%不是基于全人口为基数的,而是基于出现某种疾病症状然后去检测假阳性的概率为5%,比如肚子疼去医院。如果全人口肚子疼概率为1%,那么1000人肚子疼的总人数为10人,那么肚子疼假阳性人口为0.5人,真阳性者1人(假设不考虑假阴性问题),那么检测阳性的真阳性概率为1/(1+0.5)约为67%。检测阳性后准确率还是很高的,所以真实诊疗情况下,准确率高低还取决于让你去就医时候某种疾病症状的发生概率。题目也有真实场景对应比如体检或许新冠普筛,但你会发现体检有问题一般都要求你去专科进一步检测,目的就是通过多维度检测来确诊,而不会基于单一检测结果来确诊,多个检测手段即使单个准确率不高,但一叠加准确率就会很高了。这道理就跟肚子疼去就医一个道理,因为肚子疼就是一种最初级的自我检测,所以真实世界里还是不能轻易否定直觉,觉着医院都是垃圾

真能写,一个贝叶斯公式,写了这么多,还居然敢说统计学的人回答不出来

@东风蜗主:你这篇文章捏造的,数学系和统计学毕业生不可能给出99%的答案。这种问题对于他们类似于1+1等于几,属于常识。另外题目不严谨,99%的检测率只意味着真病检测出有病的概率是99%,但无病误检为有病的概率往往并不是同一个数字,题目没有给出这个条件。

人类从悬崖掉下来摔死的概率是千万分之一,其中有一个人从悬崖下掉下来,他有99%的几率摔死,请问,他摔死的概率是多少? 按楼主的逻辑,套一下公式,然后告诉大家,摔死的概率小于10%。

你第一个题的答案肯定是错了。就是99%
你认真看一下你的问题吧

楼主不懂装懂太搞笑~~
对于这个个体来说,他就是99%。
楼主自省一下,好好学习一下,别不懂装懂,书上说的不一定都对,特别是非正规科学教材~

2021-08-04 06:16

一本正经的胡说八道。
你说说准确率99%咋来的?
概率论不用于个体。
而且不用于已经确定的事件。

2021-08-04 00:48

说了半天没说到重点,没有把概率思维引申到投资上。

世界知名投资大师巴菲特和马克斯都坚持价值投资,坚定的重仓低估值公司。原因就是人家已经研究透了,投资低估值公司占到了概率优势。低估值公司即使不涨,大跌的概率很低。高成长公司,增速不及预期大跌,不增长股价腰斩,容错率太低。

2021-08-04 06:17

概率论只能用于大样本统计分析。
不能用于个体概率计算。
概率论应用的前提就是大样本。
对个体无意义。

2021-08-04 08:34

概率论是建立在大样本统计之上的。
个体样本都是不一样的,有差异性。
而概率论恰恰就是这种差异性的结果。
如果反过来把概率论应用于个例。
实际上就是假设个体没有差异性。
这是完全的逻辑错误。