最优策略是动态的----《自私的基因》读后感(长文)

理查德·道金斯(Richard Dawkins,1941- )写的《自私的基因》(中信出版社2012年9月版,卢允中等译)让我充分认识到博弈策略的动态性。或者说,根本没有所谓的最优策略,竞争双方(或多方)在不断改变策略的过程中进化,谁跟不上形势,谁就被淘汰。

  举个例子。比如一只动物(比如鹿)要到水边喝水,水是不能不喝的,但水里有可以吃掉它的危险动物(比如鳄鱼)。此时这只动物该怎么办?

  一个策略是:尽量忍住不喝,到渴极了的时候再到水边猛喝一通。但这样一次可能喝很长时间的水,给了鳄鱼可乘之机。所以可以考虑另一个策略:不断频繁、快速地奔向水边,喝一口赶紧再跑回来,减少每次喝水的时间。这两种策略到底哪种更好?

  不知道。因为这要看竞争对手(水里的危险动物)采用什么策略了。如果对手反应敏捷,或许一次喝一口是不错的策略,但如果对手反应迟缓,容易发现,那么一次喝足,或许也是不错的策略。而水中的危险动物,也在根据喝水动物的策略调整自己的策略,否则早就被进化淘汰了。所以双方的策略都是不断调整的,要根据对方(甚至第三方、第四方)的情况,不断改变自己的策略。

  实际上,单个个体很难改变策略,改变了也没什么大用,改变策略的是基因。或者说,在不断吃与被吃、胜利与失败的过程中,有某一方面特长的基因的个体生存下来的,它们繁衍出更多的后代,而没有特长的基因的个体,后代越来越少,最后被淘汰。客观地看,物种发生了进化。

  但是,物种进化的一个趋势是恒定不变的,就是(动物的)反应越来越快,速度越来越快,头脑越来越聪明,视觉、听觉越来越发达,身体的适应性越来越强。因为物种是彼此促进的,你反应慢、跑得慢,在复杂的环境下不能很好地权衡,做出正确的抉择,就会被吃掉,或者吃不到别的物种,于是就被淘汰。我见过很多聪明动物的例子,它们的反应让我震惊。当然这已经超出本书之外了,不再展开。

  人,当然是拥有无与伦比的大脑,所以才在各种生物中脱颖而出。

  各种策略的优胜劣汰、动态平衡、彼此相生相克,有一个很有趣的例子:假如某个物种中的动物,只具有两种性格之一:鹰派和鸽派。请注意它们表面上都一样,但性格或者是鹰派,或者是鸽派。一旦同一物种相遇发生战斗(比如争夺食物或配偶),鹰派一定要战斗到底,不是打死或打败对方,就是被对方打死。鹰派是从来不会退却的。而鸽派从来不打,所以当鸽派遇到鹰派,如果发生冲突,鸽派会立即退却,让鹰派获得胜利,以保全自己的生命。

  很显然,鸽派之间是不会有冲突的,鸽派碰到鹰派也不会有冲突,因为鸽派会立刻选择逃避。而鹰派碰到鹰派,发生冲突后只能战斗,知道其中一个死掉,才能解决问题。

  那么:种群中的鹰派占多数,还是鸽派占多数呢?

  进化策略显示,两者之间会维持一个稳定的平衡。

  比如,假设初始种群都是鸽派,此时变异出一只鹰派(在漫长的进化过程中,这几乎是必然的),鹰派成了街头霸王,可以随意欺负鸽派,占有异性。假设鹰派和鸽派结合,后代一半是鹰派,一派是鸽派。可以想象它会占有更多配偶,产生更多后代,由此导致鹰派越来越多。但是,当鹰派多到一定程度,就不会继续增加了,因为它们以后相遇的概率会不断提高,破釜沉舟的战斗必然导致鹰派之间相互消耗力量。而鸽派,当减少到一定比例,就又会重新开始扩大,因为鸽派不参加战斗,存活的时间长,理论上也可以产生更多后代。

  相反,假设群体中一开始全是鹰派,突然变异出一只鸽派,结果也一样。所以,从长期看,群体中的鹰派和鸽派,必然围绕一个比例波动。

  看到这里,假如你在这个群体中生存,你会采取什么策略呢?

  很显然,如果鹰派过多,你应该做鸽派;反之,做鹰派。总之,不要和大多数人站在一起。

  写到这里,不知道你是不是想到股市投资了?呵呵,当大多数人买一只股的时候,你要卖;反之则买,往往是最优策略。

  当然,物种在进化过程中,还可以产生出更狡猾的策略。比如一只鸽派假装鹰派,当它碰到对手时先吓唬对方,如果对方是鸽派,就会退却,这样它就得逞了;如果对方是鹰派,愤而应战,那它立刻夹着尾巴逃跑,也不会受伤。所以在鹰派、鸽派中,派生中假装鹰派的鸽派,一开始也是很有利的。但问题是,当这种个体越来越多,假装鹰派的鸽派相互遇到并发生冲突时,又会是什么情况呢?显然它们会相互威胁,但并不会真正投入战斗。它们的这种策略,让真正的鹰派或鸽派看到,又会派生出什么策略呢?

  所以,没有固定不变的最优策略!这是我看这本书的最大感受。

  还有一个生存策略来源于囚徒困境。囚徒困境可能现在很多人都知道了,也是博弈论的基本知识,说的是两个人,他们如果彼此合作,都可以得到不错的利益(比如每人100分),但如果其中一个人选择合作,而另一个人背叛,则背叛的一方可以得到相当优厚的利益(比如250分),而合作的一方成了傻瓜,利益为负(比如负50分)。但如果两个人互相背叛,则是双输,比如都是负10分。那么请问:如果你是其中一人,是选择合作还是选择背叛?

  这是博弈论的基础内容,很多人都知道:如果博弈是一次性的,应该选择背叛;如果博弈是重复博弈,应该选择合作。

  嗯,合作总体是不错的,但背叛的诱惑太大了。如果基于囚徒困境设计出更加复杂的博弈策略,到底谁会取胜呢?比如有这么几个代表性策略:

  1、“傻瓜”策略:永远合作,永远与人为善。

  2、绝对恶意策略:永远选择背叛。

  3、“一报还一报”策略:(书上翻译成“针锋相对”)首先选择合作,下一次采用对方上一次的策略。也就是说,如果上一次对方背叛了我,下一次我也背叛;上一次对方和我合作,下一次我也合作。所以,这种策略的出发点是善意的,但对于恶意的背叛,选择一报还一报。

  4、“二报还一报”策略:遭到两次背叛,才选择一次背叛。所以它是比“一报还一报”还要善意的策略。更善意的甚至有“三报还一报”等策略。很显然,这个策略的目的是:“我要用我的真诚感动你,但如果你背叛我多次,我也会背叛一次,让你知道我也是有血性的。”

  5、偶尔背叛策略:首先选择合作,如果遇到了善意的策略(比如“n报还一报”),该策略也会一直合作,但会偶尔选择背叛,比如十次合作中突然来一次背叛,从而获得巨大利益。在现实生活中,这种人最可怕,因为他平时看起来很忠厚老实,但关键时刻会欺骗,因为对他来说,这一次博弈是最后博弈,骗完就走人。但和他相处的朋友并不知道,于是就上了当。

  6、“欺负老实人”策略:初次选择合作或背叛并不重要,重要的是在不断博弈中看看对方是什么策略。如果对方是“老实人”,比如“傻瓜”策略或“n报还一报”策略,我就选择背叛;如果对方不好欺负,比如“一报还一报”,我就老老实实选择合作;如果对方是绝对恶意策略,我也绝对恶意。

  7、“永不宽恕”策略:第一次选择合作,但如果你骗我一次,我以后永远背叛,永不宽恕。

  8、“加倍报复”策略:你骗我一次,我一定要骗你两次,否则永远没完。

  当然,我们还可以设计出更多策略,但具有代表性的就以上几种。很显然,它们反映出我们的人性。

  它们博弈的结果,很多人都知道了:是“一报还一报”取胜,科学家们做过多次实验,都是如此。

  事后想想,似乎很正常:因为“一报还一报”是善意的,对恶意也报以相等的惩罚。而且“一报还一报”并不记仇:如果你以后选择合作,我还会和你继续合作。这大概相当于“没有永远的朋友,也没有永远的敌人,只有永远的利益”?呵呵。相比之下,“傻瓜”策略、“n报还一报”过于善良了,而“永不宽恕”和“加倍报复”策略则过于记仇了,所以在多次博弈中得分并不高。当然,多种恶意策略的得分是最低的。甚至,“永不宽恕”和“加倍报复”策略,在相当程度上也是恶意的,因为你不允许别人改过,或者惩罚措施过于激烈,导致冲突升级。

  但是别忙:难道“一报还一报”真的能永远取胜吗?

  并非如此。假如整个生态环境中全是善意策略,大家彼此合作,此时根本不能体现出“一报还一报”的优势,它会和其他善意策略获得一样的分数。假如,假如----此时混进了一个恶意策略,这个恶意策略的分数会远高于所有善意策略,因为它一直(或主要)靠欺骗,剥夺别人的利益。所以在善意群体中如果出现恶意策略(这几乎是必然的,就像一群好人中总会混进坏人,或者他们的后代中必然有坏人一样),恶意策略会繁殖得很快,相当于一小撮罪犯在一群忠厚老实者中获得巨大利益。

  所以,当恶意策略不断增加时,极为善意的策略,比如“傻瓜”策略、“n报还一报”策略都会被逐渐消灭(相当于忠厚老实人坏人干掉)。此时,当事物发展到这一阶段时,才能充分体现出“一报还一报”策略的优势。也就是说,当恶意策略增加到一定程度时,“一报还一报”策略就会逐渐雄起,在群体中占据优势,

  假如 ---- 群体中的善意策略极少,几乎都是极端恶意或接近极端恶意的策略,所以“一报还一报”和其他善意策略的数量极少,并且散布在恶意策略中,那么“一报还一报”的得分也不高。它必须突破一个“临界点”,才会取得优势地位。

  看到这里,我感慨万千。这相当于什么呢?相当于:人类社会如果已经发展到人与人之间都是敌人的程度了,那你或者做个坏人,或者隐藏起来,找到极少数和你一样的好人,彼此合作,才能生存下去。在几千年文明史中,确实有极少数时期,社会就是这个样子。

  但幸运的是,这种情况毕竟是极少数,在绝大多数情况下,善必将战胜恶,所以秉承“一报还一报”策略,与人为善,惩罚恶,但又不记仇,应该是最好的策略。

  写得有点多了,呵呵。

  总的感觉是:《自私的基因》让我充分认识到博弈的动态性,在很多情况下(不是多次博弈)并没有最好的策略,要根据对方的情况进行调整。我记得《孙子兵法》中说过:“能因敌变化而取胜者,谓之神”。我在《自私的基因》中,总算为它找到理论依据了,呵呵。我们玩股票,如果环境变了,情况变了,当然要调整自己的策略。这没什么丢人的。我们要避免的是无谓的乱变,以及毫无意义的坚持。这一切都要加强分析能力。

  所以看了这本书,让我对股市博弈有了更深入的思考。比如:

  1、价值投资者(我指的是关注市盈率、市净率很低、也有成长性的股票的人)的策略,在熊转牛初期往往不好,因为此时是前期超跌股大涨,而白马股因为是白马,跌得不够深,反弹自然也不会多。

  2、天天追涨停和热点的短线投资者(或投机者),玩得好确实挣钱,但如果没有极高的敏锐性,最好还是不要玩。总之,这是一种难以做大的策略。

  3、股市和生物界还是不一样。生物界一般讲究合群(因为群居动物占优势),但在群体中选择生存策略,往往要和别人不一样。要根据大多数人的选择,不断调整自己的决策,所以这是个永无休止的动态过程。炒股最好别合群。所以一种炒股策略如果用的人多了,比如都是价值投资,都买银行股,那么银行股可能就很难涨起来。

  4、所以,股市投资者最好学会多种策略,当然可以以一种策略为主。长期来看,只要是稳定的策略,一种策略也行(如价值投资)。什么是“稳定”策略?以不变应万变,在绝大多数环境中表现都不错的策略。

  5、最好的策略,似乎是分析板块潜力,中线持股。吃完这块吃那块,几个月或顶多一两年就换。当然这个要求比价值投资要高,因为除了要分析个股,还要不断评估板块潜力,评估整体大势,所以也更难做到。所以,价值投资确实是一种很好的、稳定的策略。

  《自私的基因》总体是一本相当优秀的书,让我对基因支配,有了比过去深得多的理解。其实过去我也看过类似的书和文章,但这本书的内容还是极为深入,让我获益很大。

  但看完全书,我还是不能同意“基因是完全自私的”观点。作者说,生命个体(比如人)有时候会表现出合作、帮助他人的行为,貌似无私,其实最终目的还是为了满足个人利益(物质或精神上的)。所以无私是为了自私。既然是为了自私,本质上就是自私。

  对此我想了很久,还是不能同意。因为我认为,既然生物逐步进化成了社会化动物(比如人、猴子、猩猩、狮子、狼、鬣狗、斑马、角马、羚羊、大象、河马、野牛、野猪、豚鼠、老鼠、蚂蚁、蜜蜂、蝙蝠、各种群居的鸟和鱼……),并且社会化动物逐渐占据优势(我不否认老虎、豹子目前在竞争中丝毫不落下风,但总体是社会化动物占优),这肯定说明合作已经占据了越来越重要的位置。那么,有利于合作的基因,似乎也应该占据更多位置才对。在生活中,一个极端自私的人肯定不受欢迎,他/她的基因估计也很难流传下去。

  当然,我的争辩是肤浅的,因为作者道金斯用了大量篇幅来论证他的观点,作者认为:合作和群居也是为了让基因流传下去,因为群体的力量大,所以基因本质上还是自私的。但还是不能说服我,因为现在很多群居物种,离开群体的单个个体,实际上是很难生存的,甚至无法生存。此时为了生存,群居是必不可少的,是彼此需要的。如果回到分散状态,各个单个个体都会被更强大的物种消灭掉。所以,群居既然促进了物种的繁衍和进化,最终变成不可缺少的生活方式,难道就不会让基因变得稍微无私一点?

  从更高的层次来看,道金斯坚持一元论,不够中庸,总让我不是太信服。但我必须承认,他的论证很有力,这本书也是一本绝对不可多得的好书。
雪球转发:94回复:58喜欢:193

全部评论