马尔可夫宿命论(转)

发布于: 雪球转发:3回复:0喜欢:4

万维钢

2019-8-19

《模型思考者》7:马尔可夫宿命论

|转述:怀沙|

我们继续讲斯科特·佩奇的《模型思考者》这本书。我先给你讲两个故事,你看看其中有没有什么规律。

第一个故事叫“捐款”。我们知道美国很多地区的公立学校系统有衰败的趋势,生源、政府投入和师资力量都不太行,学生的考试成绩很差。有些热衷于公益事业的富豪看到这个情况,就想采取行动。

2010年,Facebook的创始人扎克伯格,给新泽西州纽瓦克市的公立学校系统捐款一亿美元。这是一笔巨款,再加上别人匹配的捐款,相当于给这个地方每个学生六千美元。这笔钱可以用来改善教学条件、给教师提高待遇,还可以给学生发奖学金!那这笔钱能起到怎样的作用呢?

结果是过段时间再考察学生的成绩,没有任何提高。扎克伯格的钱,白花了。

第二个故事叫“情绪”。你有一个朋友因为失恋而情绪失控,说自己抑郁了。这已经不是第一次,但是你非常关心他,就专程飞到他身边,陪他度过了几天愉快的时光。你明显地感觉到这几天他确实很开心,他还表态说以后要保持阳光的心态,积极生活。你放心地回去了。

可是过了没多久,你朋友说因为感情受伤太深,实在不能安心上班,辞职了。

两件事的共同点是,想要一次性地采取一个行动去改变某件事,结果徒劳无功。不管你付出了多少努力,事情总会回到老样子,就好像冥冥之中有个无法摆脱的宿命一样。

数学模型能告诉你其中的原理。

1.宿命

这个模型叫“马尔可夫(Markov)过程”,以俄国数学家安德烈·马尔可夫命名。

比如有一位老师,发现课堂上总有学生无法集中注意力,会溜号。所谓马尔可夫过程,就是假设学生在“认真”和“溜号”这两个状态之间的切换概率,是*固定*的 ——

我们设定,今天认真听讲的学生,明天依旧认真的概率是90%,还有10%的可能性会溜号。而今天溜号的学生,明天继续溜号的可能性是70%,剩下30%的可能性会变得认真。

咱们看看这个模型怎么演化。假设总共有100 个学生,第一天认真和溜号的各占一半。

根据概率设定,第二天,50个认真的学生中会有5人变成溜号;而溜号的学生中,会有15人变成认真 —— 所以第二天是有 50-5+15 = 60个人认真,剩下40个人溜号。

继续演算,第三天应该有66个认真的,34个溜号的……以此类推,最后有一天,你会发现有75个认真,25个溜号的。

而到了这一步,模型就进入了一个稳定的状态,数字就不变了。因为下一天会有7.5个学生从认真变成溜号,同时恰好有7.5个学生从溜号变成认真!

而老师对这个稳定态很不满意,为什么只有75个认真的呢?他安排了一场无比精彩的公开课,还请了别的老师来帮他监督学生。这一天,100个学生都是认真的。

但这样的干预对马尔可夫过程是无效的。第二天认真的学生就变成了90个,第三天就变成了84个,……直到某一天,还是75个认真和25个溜号。

你看这个情形是不是很像咱们前面说的那位失恋的朋友。他的情绪有“愉快”和“失控”两种状态。他愉快的时候有 10% 的可能性变成失控,他失控的时候有 30% 的可能性变成愉快 —— 那么不管你的干预能他连续愉快多少天,只要你不再干预了,他终将回归到75%的比例愉快、25%的比例失控的日常状态。

马尔可夫过程有一个固定的宿命。这不是巧合,这是数学定理 [1]。

2.定理

咱们先严格地说说什么叫马尔可夫过程。马尔可夫过程要求满足四个条件 ——

第一,系统中有有限多个状态。比如“认真”和“溜号”,就是两个状态。

第二,状态之间切换的概率是固定的。比如从认真到溜号的概率永远都是 10%,保持不变。

第三,系统要具有遍历性,也就是从任何一个状态出发,都能找到一条路线,切换到任何一个其他的状态。

第四,其中没有循环的情况,不能说几个状态形成闭环,把其他状态排斥在外。

而数学定理说,只要是马尔可夫过程,不管你的初始值如何,也不管你在这个过程中有什么一次性的干预,它终究会演化到一个统计的*平衡态*:其中每个状态所占的比例是不变的。

就好像终究会有 75% 的学生认真,25% 的学生溜号。

马尔可夫过程,都有一个宿命般的结局。

那你说生活中有哪些事儿是马尔可夫过程呢?很多。四个条件中只有第二个条件是关键,也就是状态之间切换的概率是固定的。很多事情就是这样的。

不发达地区的很多人会因为疾病而不得不去借债,还不上债务就变成了贫困户。现在政府要扶贫,说我干脆一次性地给穷人发一笔钱,让他们把债都还了,以后好好过日子,这行不行呢?马尔可夫模型说不行。你并没有改变他下一次得病或者欠债的概率。你改变的现状仅仅是一个初始条件,只要概率不变,他的宿命终究不变。

再比如说美国的穷人经常失业,而在很大程度上失业是自己的原因。他可能因为不按时上班被老板开除了,也可能因为跟老板有点小矛盾一怒之下辞职了。那如果你改变不了他对工作的态度,哪怕你一次性地给所有穷人都安排工作,你也改变不了穷人的命运。

马尔可夫模型,真是“江山易改本性难移”、“授人以鱼不如授人以渔”这些话的数学原理啊。

咱们再说一个真实的例子。世界上所有国家可以分成三类:自由国家、半自由国家、不自由国家。这三种国家状态是可以互相转换的,一个不自由的国家哪天想通了,就可能变成半自由或者自由的国家;一个自由国家万一选一个独裁者上台,也可能变成不自由国家。

历史数据表明,不自由国家在五年之内变成自由国家的可能性大约是5%,变成半自由国家的可能性是15%,继续保持不自由状态的概率是80%……下面这张表格列举了三种状态之间切换的概率 ——

同时我们还知道,从1975年到2010年,这三种国家在全世界所占的比例是下面这样 ——

图中总体来看,自由国家是越来越多,不自由国家是越来越少。一个不懂数学的人看到这张图可能会说,哈!自由是大势所趋,将来所有国家都会变成自由国家!殊不知这就犯了简单外推谬误。

事实上,既然三种国家状态切换的概率是几乎固定的,这就是一个典型的马尔可夫过程,那么最终结果必定是一个三种国家按照一个固定比例分配的稳定状态。数学计算表明到2080年,世界上将会有62.5%的国家是自由的,25%的国家是半自由的,12.5%的国家是不自由的……

只要切换概率不变,世界上始终都会有不自由的国家。

3.用途

马尔可夫模型有很多应用。比如 Google 做搜索引擎,希望按照人们访问的热度给网页排序,但是Google并没有每个用户实际点击哪个网页的数据,它怎么办呢?它使用一个叫做 PageRank 的算法,其中就用到马尔可夫模型。

Google 能知道的是各个网页之间互相链接的情况。我们把网页想象成状态,那这些链接就相当于描写了马尔可夫过程中状态之间切换的概率。那么根据前面说的定理,网页被点击的比例终究是一个平衡态。Google 就可以计算出来,在统计平衡态之下,每个网页获得点击率的比例是多少,按照这个比例排序。

连有些意想不到的事儿,都是马尔可夫过程。

我们知道有一本著名的政治文献叫《联邦党人文集》,是由三位美国政治家,亚历山大·汉密尔顿、约翰·杰伊和詹姆斯·麦迪逊在1787到1788年间共同写作的。文集中有85 篇文章,可是因为三人使用了同一个笔名,人们并不知道到底哪篇文章是谁写的。

后世的历史学家经过多方考证确定了其中大部分文章的作者,但是还有那么几篇,历史学家表示无能为力。于是统计学家就出手了。

统计学家说,一个作者写文章的用词习惯,其实是个马尔可夫过程。

比如英文中有个短语是“for example”,而人们也会经常说“for the……”,对某一个作者来说,for 后面接 the 的概率,是接 example 的4倍。这就是一个用词习惯问题。比如我经常说“但是请注意”,而有的作者可能更喜欢在“但是”后面接一个逗号。

我们可以把每个常用词都想象成马尔可夫过程中的一个状态。因为每个作者的用词组合习惯非常固定化,统计学家就可以给每个人都做一张马尔可夫状态切换概率表。那么把一篇文章中相应词汇的马尔可夫概率表跟这个作者概率表进行对比,就可以知道这篇文章是不是他写的。

使用这个方法,统计学家判断,悬而未决的那几篇文章,最符合詹姆斯·麦迪逊的写作风格。

马尔可夫模型这么有用,说明“本性难移”是个常见现象。

但是请注意,生活中有些事情是“路径依赖”的,意味着后面发生的概率会根据之前发生的事情做出改变。比如原本有两种高清电视标准势均力敌,而你如果能一次性地说服几个重要厂商采纳其中一个标准,那其他的厂商为了兼容性,就会跟着选择这个标准。

而马尔可夫模型说的则是那些概率不随以前的历史发生改变的情况。那你说到底什么情况下用路径依赖,什么情况下用马尔可夫呢?你得灵活判断。

一个酗酒的人,你看着他一周时间不让喝酒,并不足以改变他酗酒的概率;但是如果你有办法让他连续一年不喝酒,也许他就真戒酒了。逢年过节找一帮志愿者去养老院给老人送温暖,不足以影响老人长期的精神状态;可是如果养老院弄个生活方式改革,也许就会有实际效果。

马尔可夫模型解释了历史的怪圈,它给我们的教训是历史很难改变。临时性的措施往往没长久的作用,本性的力量很强大。有些公司换个开明的领导人,可能干几年都挺好,之后又会走到老路上去。想要改变历史,你得改变机制。

注释

[1] 这个定理叫做 Perron-Frobenius 定理。