谈概率,快与慢


我们深爱的股市吧,随时间流逝,总体是向上发展的;但是你要是仔细分析,会发现欲仙欲死基本就集中发生在那几个零星四散、难觅踪影的大波动的日子里。有一个关于投资的比喻:投资就如同战争之于一个小卒,绝大多数时间你要忍受百无聊赖,但在中间会穿插一个个短暂但极端的恐惧、激动与狂喜的片段。所以长期投资等于长期无聊,就完成交易动作而言每天其实是无所事事的,反正我是这样。

不过大多数人并不甘心投资的寂寥,他们要寻找刺激,要让每天都活出一百分。我有一故交,该君乃是技术分析派,图表上各种辅助线画得飞扬。有一次我就忍不住问,哥们你这管用吗?他对我说,我也不蒙你,肯定不是每次都管用,但是这跟天气预报一样,搏个概率,次数多了,结果就对我有利。我接着问,那你咋确定这个概率是多少?他回答:主要是走个感觉。

读过人生赢家卡尼曼(Daniel Kahneman)的不朽名著《思考,快与慢》(Thinking, Fast and Slow)的哥们一定记得书中谈到人类有两套思维系统:系统1 和 系统2 。系统1比较直觉化,速度快、反应好、省力经济环保,但对复杂问题常常给出猪队友的表现,错误连篇;系统2比较理性化,速度相对慢,相对耗力,但能处理复杂的计算,且准确率较高。

卡尼曼的这套理论虽然看起来很简洁清爽,但有几十年的大量研究做支持,我还是蛮吃他那一套的。面对复杂问题时系统2都未必能胜任,但是我们有时居然相信系统1(直觉或感觉)反而能够有作为,我表示很怀疑。顺便说一句,如果你还没读过《思考,快与慢》,那建议赶紧弃了本文去找来一阅,这本书被中央情报局(CIA)评为必读中的必读,溢美之词已无可复加。

仅凭直觉很难对复杂系统做出准确的概率判断。比如我有一个朋友,打算举家去法国旅个行,花了不少银子订机票订旅馆万事具备,结果临出发时,前方传来巴黎恐袭的噩耗(2015年11月那次)。他与老婆商量后果断放弃旅行计划,损失了不小的一笔钱。这个决定从感情上我完全理解,但从理性上我实在不能苟合,一个人在一年内死于恐袭的概率大约是2000万分之一 ——比起恐怖分子,一个人更有可能被自己家里的家具给干掉。就算在恐袭风险较高的法国,死于此祸的概率也仅仅是500万分之一。而且恐袭发生后安保一般会加强,其实此时你反而会更安全。

但是无论数字给了你怎样的真相,直觉上你会感到此行凶多吉少,为了“保住”一家老小的卿卿性命,取消旅行居然成了唯一政治正确的选择——不然你那个同样不太理性的老婆要怪你不顾她的生死了。

既然说到生与死这种凄美深沉的话题,那就再来聊一下飞机失事下人的存活概率。我们大多数人直觉一般是:飞机失事那肯定是九死一生。但根据美国国家运输安全委员会(NTSB)的数据,从1983年到2000年美国共有53487人次卷入飞行事故,其中有51207人次生还,生还率高达95.7%;即使在最惨烈的坠机事故里,生还率也有76.6%。

所以当年在英国航空的9号班机上(详见英国航空9号班机事故),当你听到机长对你轻描淡写地说:“亲爱的乘客朋友们,我们遇到了一点小问题,我们所有的四个引擎都不转了”时,你应该保持镇定,你活下去的机会很大。当时大家正飞在一万米以上的高空,引擎全down的飞机开始了凄美的滑翔——但结局“居然”是机上所有乘客全部生还。

有人可能会说你上面这些概率问题,都没有给我充分信息,我当然估不准。但是很多时候即使给了你所有信息,大多数人的直觉仍然还是无能为力。比如一个班里有个五十个学生,其中居然有两个学生是同月同日生,八卦一点的童鞋们可能会起哄说哟天命所归你们在一起吧,搞得这件事好像是个奇迹——但事实上只要随便选23个人,就有大于50%的概率有两个人的生日是同一天;如果增加到30个人,概率能提高到70%;你仅仅需要70个人就可以把概率提高到令人窒息的99.9%。

即使你知道了所有的信息,你的直觉还是几乎无法对概率做准确的判断。咱再来搞几个头脑大保健来说明一下。


1. 三门问题 (Monty Hall Problem)

三门问题为波普文化搞得路人皆知,不过作为“你的直觉面对概率问题有多么得不准”的典型,就算神秘感尽丧,我还是想在这里一表。

问题是这样的:假设你参加某个电视比赛并且问鼎,你现在面对三扇门,而你的奖品就在门后但是你看不到。已知其中一扇门的后面是一辆玛莎拉蒂,另外两扇门的后面各是一只烧鸡,主持人说你只能选一扇门 (主持人知道门后的底细) ——于是你眼睛一闭祈祷苍旻,然后随机选了左边那扇门。此时中间那扇门被主持人打开,你看到后面是只烧鸡;那么问题来了,这个时候主持人问你:你换不换门?



大多数人回答是不换——没有意义啊,剩下两扇门,猜中玛莎拉蒂的可能性对半开,那换不换有什么意义呢?做人要坚持到底,不换。

但是你用数学理性来想一想,应该是要换的。因为一开始你猜对的可能性只有1/3,而你的反面(猜错)的可能性是2/3,从左门换到右门你其实把胜率从1/3 提高到了 2/3。至于一扇门已经被打开里面是一只烧鸡——这是一个不重要的干扰条件,因为无论一开始你猜对还是猜错我都可以打开一扇里面有烧鸡的门。

三门问题答错不可耻,这个问题甚至曾经乱了一些数学家的心。我听说有些哥们怎么想也想不通,于是就写了个代码去跑模拟了,模拟结果告诉他们残酷的现实:你不换的胜率是1/3,你换门的胜率是2/3。

我知道肯定还是有很多人没明白。

那我们换个思路,现在不是三扇门了,而是三千扇门;你选中了一扇,然后知道底细的主持人故意打开了2998扇后面有火鸡的门,此时他问你,换不换丫?

我的数学PhD朋友 Dr.飞哥 对三门问题给了一个非常清爽的解释:

“三门问题,其实只是要算出选择”换“而获胜的概率。

分情况讨论:

1. 第一步已经选中了玛莎拉蒂,此事件概率为1/3,如果换则必输;
2. 第一步选中了烧鸡,此事件概率为2/3,如果换则必赢;

综上,换门策略获胜的概率为2/3。”

我认为这个解释非常有数学的美感。


2. 彭尼的游戏(Penney’s Game)

三门问题仅仅是个热身,然后我们来看看这个投硬币的彭尼游戏。

先铺垫一下,如果我扔一个硬币七次,那么得到 “正正正正正正正” 和得到 “正反正反反反正” 的概率哪个大?

知道赌徒谬误(gambler’s fallacy)的人应该会自信地回答,概率是一样的。耶你答对了。

那这样,我跟你玩一个游戏,我们扔一枚公平无私的硬币,不停扔并且记录是正面朝上还是反面朝上,如果先出现“反反正”这个排列顺序算你赢,但如果出现“正反反”这个顺序算我赢,你觉得游戏公平吗?


大多数人躲过了”赌徒谬误“的理性人可能会认为这是一个公平的游戏;如果你觉得公平那我们就实际玩一下,但我事实上有75%的概率能赢你。

你说那我要“正反反”,好我答应,只不过我要改一下选择,我要选“正正反”,同意吗?

如果同意我们就可以再玩一下,我大概有2/3的概率能赢你。

如果你选“正正反”,我就选“反正正”,我又有75%的胜率;如果你选“反正正”,我就选“反反正”,我又有2/3的胜率;如果你选“反反正”的话……因果报应啊,这不就又回到了游戏的最一开始吗?

就像是一个石头剪刀布的大吃小循环,“反反正”能吃“反正正”,“反正正”能吃“正正反”,:“正正反”能吃“正反反”,“正反反”又能吃“反反正”,你看这是有套路的。只不过根据大多数人的直觉思维,TM这都是啥呀,不都应该是一样的概率吗?

你仔细去计算一下,概率绝对不一样。我们回到最一开始你选“反反正”我选“正反反”的这个局里,事实上一旦硬币投出了一个正面,你就再也赢不了我了。


3. 星期二的男娃问题(Tuesday Boy Problem)

星期二的男娃问题有个热身版本,是这样的:

已知史密斯夫妇有两个娃,其中至少有一个是男娃,那请问这两个都是男娃的可能性?(我们假设生男生女的可能性各为50%)

直觉会告诉大多数人——其中一个已经是男娃,但这个条件和第二个娃是男是女有半毛钱关系,独立事件啊,所以他们会得出都是男娃的可能性为1/2。

但其实我们可以排列组合一下,根据两个娃的出生顺序,就有“男女”、“女男”、“男男”、“女女”四种等概率的组合。其中“至少有一个男娃”的条件排除了“女女”这种可能,所以“男男”的概率应该是1/3。

热身版学过一些排列组合概率论都能做出来,但是后面这个升级版就稍微有点变态了,稍微改一下问题:已知史密斯夫妇有两个娃,其中一个男娃出生在礼拜二,请问这两个娃都是男娃的可能性?

多数人肯定会说,还是1/3啊,出不出生在礼拜二有半毛钱关系?但事实,加了“礼拜二”这个条件,都是男娃的可能性便从 1/3 增加到了 13/27。我卖个关子这里就不铺张出来算了,有兴趣的可以用“穷尽法”试一试。如果你答错了也不必沮丧,这个问题曾经在一个数学家汇聚的研讨会上被人拿出来说,大多数数学家也只不过是对其付之一笑而已——他们也觉得星期二有个毛关系。

还有一个很毁灭三观的结论,你对问题中的那个男孩的描述越是详细(比如现在不仅仅是星期二了,咱加个条件为“生日是2000年1月4日“),你得到的答案就越是接近于1/2。你看人的直觉对于概率的判断有多么不靠谱,哪怕是具有专业素养的数学家。


4.起诉者谬误(Prosecutor’s Fallacy)

生活中我们常有这种感慨,不怕流氓屌大,就怕流氓有文化——不怕你不知,就怕不知不知,更怕知一点皮毛而自以为全知。以直觉化的概率论作为名义,而行的无比罪恶之事屡见不鲜

在英国曾经有个官司。有个叫Sally Clark的律师,她的两个儿子被发现接连死于婴儿猝死症(SIDS)。由于一般而言小孩SIDS而死的概率其实不高,警方就怀疑是谋杀,而Clark 是唯一的嫌疑人。在法庭上,有个学了点统计的儿医泰斗提供专家证言说,一个富裕家庭里小孩SIDS的概率大概是1/8500,所以他认为两个小孩连续SIDS概率就是1/8500的平方,也就是7300万分之一。或许是担心陪审团无法把握这个概率之可怕,他还补充了一句——这事大概全英国一百年只能发生一次。

很显然这泰斗的证言实在太逗,他把两次SIDS当作了独立事件——因为只有独立事件才能将概率相乘。But 一个家庭里发生SIDS完全可能不独立啊——比如可能是某种神秘基因在作祟呢。但是泰斗毕竟是老司机充满了人格感染力,最后陪审团裁决Clark有罪。事后英国皇家统计学会觉得智商受到了莫大的侮辱,于是他们声明泰斗的证言毫无统计学基础。虽然三年后上诉法院推翻了这个裁决,但是饱受牢狱之苦的Clark再也回不去了,最后结局是酗酒而亡。

强行秀智商冒充统计学家的还有媒体。当泰斗得出两次SIDS概率为7300万分之一的结论后,媒体颇为自信地撰文说Clark肯定就是罪犯——因为无罪的概率只有7300万分之一,那有罪的概率就是72,999,999/73,000,000。这是又一次统计学与法理学被一群绝对的外行给脱裤子轮奸了——这逻辑就等于说“你中了彩票,但你一定是作弊;因为中彩票的可能性仅仅是100万分之一,所以你有999,999/1,000,000的概率是在作弊。”这个可耻的逻辑被称为起诉者谬误,这也是人的直觉非常容易犯的一种错误。


结语

上面列举的这几个头脑大保健已经算是非常仁慈了,我们能知道解题所需的几乎所有条件与信息,但你仍然情不自禁地要给出错误的答案。至于那个让我们魂牵梦绕的资本市场,她不得比这些大保健纷繁复杂、光怪陆离甚于千万倍啊;但是面对这样的一头怪兽,我们居然总认为秀出自己的系统1是可以成功破题的,这种不自量力学名叫做过度乐观偏差。

至于我们应该怎么做——《思考,快与慢》中谈到,我们只能妥协。首先要意识到在哪些情况下我们最有可能犯错(也就是各种偏误发作之时),并有意识地尽量避免或者少犯这些错误。如果做不到这一点,那我们也至少应该撷取《路加福音》里朴实的大智慧,让系统1的归系统1,让系统2的归系统2,千万不要彼此乱穿越。



--------------

本文行文仓莽,如有不足之处,还请各位海涵斧正。 

转载我是欢迎的,但请您注明雪球、署名陈达,在此谢过。 



 @今日话题 @方舟88 @放眼观美股@梁剑 @Ricky @徐佳杰Pierre @不明真相的群众 @招财资本 @江涛 @刘志超 @沈潜 @最接地气美股解读 @唐朝 @管我财 @TLS美股研究 @华宝油气 @啊咪老师 @大米财经 @布衣-淡定从容 

 $上证指数(SH000001)$  $沪深300(SH000300)$ $创业板指(SZ399006)$ 

雪球转发:158回复:263喜欢:555

精彩评论

量化钢铁侠2017-07-22 10:04

星期二的男孩问题解法:首先确定基本事件和状态空间,两个孩子分男女以及星期几出生,一共196种状态,这196个状态的概率相等。然后计算概率,其中包含一个男孩星期二出生的,有27种。而这27种当中,出现两个男孩的为13种,所以答案是13/27。 这个问题是典型的贝叶斯条件概率的思想,男孩和星期二这两个信息的出现就是两个条件。但如果指定第一个孩子是星期二出生的男孩,这就成为了一个独立的确定性的信息,两个孩子都是男孩的概率还是二分之一。

world1002017-07-22 11:12

三门问题貌似不对,分析前只想提个问题:楼主是理科男么?

开中门前,3门概率一样,都是1/3,因此中间和右门一起当然占2/3,这是废话,但前提是3个门后情况一无所知。

但是,当中门打开没有大奖时,你还说左门的概率只有1/3?那么只能这样让你再想一下,如果把右门也打开也没有大奖,你还会说左门后的概率是1/3?

所以,这个概率是变化的,随着你掌握的信息而变化,当然掷硬币的游戏没有信息增加影响决策的问题,因为前后都是独立的,但3门的例子中,很显然,你知道得越多,概率就越高。

如果把这个分析放到股市上,也有类似现象。如果你对所有的公司一无所知,那么你就只能用beta衡量风险,可是如果你像老巴一样对某间公司非常了解,你就觉得beta只是翔,因为你的知识让你已然知道应不应该买或者卖,没beta半点事。

不喜不杯2017-07-22 09:04

你个骗子,文科生比理科生概率还牛逼,套路我全错

小火鸟2017-07-23 13:32

量子力学说,一旦实施测量,信息就坍塌,此时的概率已经变了。开门之后不再是各门三分之一了。

全部评论

为了几个点2019-01-05 22:44

烧脑的一篇文章,

为了几个点2019-01-05 22:43

a+b换了b+c

为了几个点2019-01-05 22:35

概率是对未知可能性的计算,知道的不同概率自然不同。打开一个门之后,概率就变了

狮子头先生2018-11-19 07:38

主持人显然不能去掉你选的那个答案...

正儿八经的散户2018-02-22 13:35

三门的问题在于抽奖机会只有一次…如果可以多次重复抽奖,那么才可以套用概率理论…