【泉果视点】全球第一个和AI竞争的脑力工作者,现在怎么样了?| 泉果探照灯

发布于: 修改于: 雪球转发:0回复:0喜欢:0

他是第一个在公众面前与人工智能正式对阵博弈的脑力工作者。

你还记得他吗?

尽管将近30年过去了,但很多人对这个画面依然印象深刻:1997年5月11日,国际象棋大师加里·卡斯帕罗夫在跟IBM的深蓝(Deep Blue)计算机对决时,输掉了最后半局,他绝望地捂住了自己的眼睛。

媒体对这场对战的评价是——“人脑最后的战役”(The Brain’s Last Stand)。

对弈体现了人类博弈的精髓,因此在很长一段时间内,一直被当做AI智能测试的里程碑。世界上第一个国际象棋的程序,就是由图灵编写的。

因为这段独特的经历,卡斯帕罗夫从来没有停止过对于人工智能的关注与思考,而且很多时候,是站在“博弈者”的立场上考虑的。

图1. 卡斯帕罗夫对弈深蓝

如今,AIGC以席卷之势闯入我们的视野,并以日新月异的速度改变着人类的生活;在这个时刻,如果听一听卡斯帕罗夫后来的思考,可能会特别有参考意义。

卡斯帕罗夫的观点,主要可以归纳为两方面:

【1】人类的自满 vs AI的稳定:

象棋并不是一个单纯考验智商的游戏。如果人类失败了,大概率不是因为AI太聪明,而是因为AI远比我们更稳定、更一致;如果我们失败了,那是因为我们的自满限制了真正的发挥。

【2】AI的局限性创造了双方合作的可能:

就像“莫拉维克悖论”说的:人类所谓的高阶智慧能力,可能对于AI来说很简单,用很少的计算能力就能实现;但人类很多无意识的技能和直觉,对AI来说却难如登天。而这一点,则构筑起人类和AI高效合作的可能。卡斯帕罗夫举例说,比如自己下棋的时候也会看AI分析。但有时,总会觉得AI的分析不对,那他也会坚持自己的看法,这种“直觉”很难说清,但却被证明是对的。

值得一提的是,在1997年5月以2.5:3.5的比分,以半局之差输掉了和深蓝的对弈之后。经过一段时间的复盘与思考,卡斯帕罗夫曾经提出与深蓝再次比赛的邀请,但是,IBM拒绝了这个提议,并宣布深蓝退役。

*深蓝计算机是由IBM开发的象棋电脑。这是第一台计算机象棋系统,深蓝计算机重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步。

*深蓝计算机1996年2月进行了对世界冠军的第一场比赛,卡斯帕罗夫击败了深蓝,得分为4:2。深蓝当时开始升级,并于1997年5月再次对抗卡斯帕罗夫以3.5:2.5赢得了比赛,成为历史上第一个在标准国际象棋比赛中打败卫冕世界冠军的计算机系统。后来,卡斯帕罗夫曾提出再次进行比赛。IBM拒绝并宣布深蓝退役。

在人工智能已经成为我们生活中不可或缺的元素的情况下,人类该如何在投资中发挥自己“人”的优势?

任职于摩根士丹利的著名作家莫布森曾在自己的专栏中,从象棋对弈中提炼有用的投资心法;无独有偶,Oaktree Capital 的霍华德·马克斯也提到了象棋,并讲述了投资人能从对弈模式中学到的投资之道。

本期【泉果探照灯】综合莫布森、霍华德、卡斯帕罗夫以及另一位象棋大师莫里斯的核心观点。从国际象棋入手,讲述人工智能与人类投资的博弈与合作之道。

前提:先看看股票投资和国际象棋的类比

我们先来看一下这个图表,这是迈克尔·莫布森(Michael Mauboussin)根据运气和实力的不同配比,把博弈做了一个分类。

最左侧是轮盘赌,它几乎是100%依靠运气,没有什么专业技巧;而最右侧是国际象棋,莫布森认为赢棋完全靠实力,运气一点用也没有。

股票投资在居中偏左的位置。

看了这个图表,我们就理解了在莫布森的思维体系中,二级市场投资大概站在一个什么样的位置,这也是理解我们后面几个观点的前提。

图2. 运气和实力的配比图

莫布森用这个图表解释,为什么他要以国际象棋为例,来解释投资。

我们都知道,二级市场的投资是一种典型的博弈。

而国际象棋规则既定而且信息透明,每一步棋都走在明面上,因此胜负就完全取决于棋手的核心实力。

这就给我们提供了一个可以剔除运气因素,单纯研究如何提升博弈水平的样本。

与投资博弈类似,国际象棋的博弈核心是:“如何预判对手的预判”。

统计数据表明,一般普通棋手会预判自己和对手5至6步的行动,而顶尖棋手能算到10步。

但除了预算的步数之外,普通棋手和顶尖棋手最大的差距,其实是思维模式的差异。

爱尔兰都柏林三一大学的米歇尔·考利团队曾做过一个实验,来观察这种差异。

他们招募了20多名不同水平的国际象棋棋手,每个人被分配了6个下到一半的棋局,并要求他们预测之后双方的对决。

在这些初始棋局中,黑白双方势均力敌且胜负机会对等。之后他们使用国际象棋软件生成后面的模拟棋局,来评估棋手们的预判质量。

最终结果显示,水平一般的棋手倾向于做有利于自己的预测,也就是只看到了自己获胜的机会,他们往往在潜意识里假设自己能一帆风顺地引诱对方落入自己陷阱;而且,他们往往会有意无意的忽略一种可能——如果对手识破了自己的陷阱,并开始反击,自己该怎么办?

而顶尖棋手则对自己的预判会更苛刻,他们往往把对手想得非常强大,也因此更加准确地预判出对手如何有效地见招拆招,因此,他们在策略的选择上不会想当然,而是会反复否定自己,从而挑选出那些最不容易被击破的棋路。

最终,研究团队得出了一个结论,“积极证伪”是在顶级博弈中胜出的核心思维模式。

那些博弈高手,在制定策略时会积极地挑战自己的预判,想办法证明它是错的,只有实在无法证伪时,才暂时接受这一策略。

在博弈中战胜人工智能——“精心策划的绝望”

霍华德·马克斯引用了现代国际象棋大师莫里斯·阿什利(Maurice Ashley)的观点,来说明很多与投资共通的启发。

先介绍一下莫里斯,他是美国的首位非裔象棋特级大师(GrandMaster)。他非常特别的一点是,非常善于“化腐朽为神奇”。他不但自己登顶了国际象棋的金字塔尖,还能帮助别人。

因为自己从底层的奋斗经历,他对美国穷困的非裔阶层非常关注。正是因为这种情怀,他曾经接手过纽约哈林区一个“穷孩子棋队”的教练工作。这个棋队的成员,几乎全都是来自穷人家庭的问题少年,但莫里斯却最终带着这群孩子,成长为全国冠军。

所以,莫里斯对于国际象棋的理解,特别深刻。

*特级大师(Grandmaster)是世界国际象棋组织FIDE授予国际象棋选手的头衔。除了世界冠军,这是国际象棋选手可获得的最高头衔,一旦获得,终身持有。

图3. 国际棋联特级大师莫里斯·阿什利

莫里斯和卡斯帕罗夫有一个共识:人工智能比人类在博弈中占优势的一点,就是人工智能没有情绪,所以发挥特别平稳。

但人类可以克服这个问题。

莫里斯总结出一个人类在博弈中最容易犯错误的时刻——在占据阶段性优势时的“得意忘形时刻”。

莫里斯提醒说,在博弈中,最应该警惕的时刻,就是占据优势的时刻,因为这时候你最容易松懈,也最容易被击败。

根据“最小阻力原则”,在大多数情况下,人和动物通常会选择阻力最小的路径。这是因为从远古时代开始,我们的身体天然需要节省能量,一旦摆脱了“生死攸关”的状态,大脑就会想关闭身体的“应急系统”。

好比一个原始人,如果马上要被狮子追上了,那就必须撒丫子快跑,但如果没什么大事,那慢慢溜达就行,这也是远古大脑的做事方式。

所以,即使是顶尖高手,即使在比赛最激烈的时刻,当他们感到胜券在握时,都难免会有“放松一下”的倾向。因为来自远古大脑的声音告诉我们:“没事了,没有生命危险了。”

但此时,人们往往忽略了,在你的对手脑海中,正经历着一个截然相反的境况:他们听到的是死神不断逼近的脚步,感受到的是在每条血管中沸腾的求生本能,大脑告诉他们,你要“殊死一战”。

这往往是博弈中最危险的时刻:“放松一下”的你,要怎样去击败“背水一战”的他?

“重要的是要认识到,防守者没有什么可失去的。你的对手会竭尽全力去延长比赛时间,利用你的疲劳或掉以轻心的机会,不断地引诱你犯错。”

因此,顶尖的博弈者,在意识到自己身处顺境的时候,往往会给自己来一个“精心策划的绝望(Orchestrated Desperation)”。

这个灵感,来源于NBA金州勇士队(Golden State Warriors)教练史蒂夫·科尔(Steve Kerr)创造的一个策略。

科尔非常善于察觉球员们在阶段性胜利时那种自满的状态,并会想办法校准。

图4. 金州勇士教练史蒂夫·科尔

科尔还发现,比赛致胜的关键其实不在最终局第四小节,而在第三小节。

在篮球的四节比赛中,如果上半场赢得了比较大的领先优势,往往队员在第三节就容易放松导致失误。

因此,科尔总会在上半场阶段性领先时刻,在第三小节给团队设置额外的挑战目标,比如:把领先的分数翻倍。

新的目标,让金州勇士在第三节发起更猛烈的进攻。虽然比赛还剩下一半的时间,但给人感觉就好像是大决战一样惊心动魄。

这种看似没必要的“精心策划的绝望”,帮助他们在八年内赢得了四次NBA总冠军。

当然,抛开剂量谈药效都是耍流氓。

莫里斯提醒说:“过度紧张也是效率的杀手。最好的状态是对于当下的高度专注,就像那句禅宗的谚语:走路时,走路。吃饭时,吃饭。”

所以说,“精心策划的绝望”到底是要有多绝望,这种分寸的把控,才是人类博弈高手的核心竞争力的体现。而且,这种绝望感和分寸感,人工智能是绝对没有的。

AlphaZero的启示:灵活性是人类在博弈中,最难培养的品质。

有人问莫里斯,大众对国际象棋最大的误解是什么?

莫里斯说:“最大的误解是,大家觉得背棋谱是最重要的。”

背棋谱,也就是要学习套路。

学习现有模式很重要,但真正能让人成为高手的不是这些模式,而是想法。

很多人试图通过记住国际象棋的开局模式套路,但要警惕这种模式形成的依赖惯性。

因为,到了最顶级的博弈时,这种“记忆拐杖”,有时会干扰人的独立思考模式。更有效的方式是,从一开始就从终局出发,目标清晰地倒推策略。

在1997年深蓝击败卡斯帕罗夫之后,2017年,谷歌资助的DeepMind推出了第一代深度学习系统AlphaZero。AlphaZero下国际象棋的学习方法又有所不同,它不看棋谱,通过自己左右互搏来“自学成才”。正是没有规则的束缚,所以在某次和人类天才的对弈中,它走出了一步放弃“皇后”这种匪夷所思的新招,最终赢得了比赛。

图5. AlphaZero登上《科学》杂志封面

这给人类观察者提供了一个视角:人工智能有时能给出超出现有理解范围的解决方案,而这将成为致胜的关键。

这件事给了莫里斯很大启发,他意识到,人类学习的很多“套路”,其实是有局限性的。

莫里斯因此调整了自己的教学策略。

通常在象棋的第一课,教练们会在棋盘两侧排列好所有的棋子,然后演示标准的开局走法:“国王”的兵向前移动两步,接着“骑士”(类似于中国象棋中的“马”)向上移动一步和斜对角移动一步。

图6. 国际象棋棋子初始位置

但莫里斯采取了相反的方式——从终局开始讲。他只摆了几颗棋子,告诉学生这是几种可能的胜利结局,并告诉大家一些基本原理,比如如何攻击对方的“国王”,才能赢得比赛。

一旦学生们知道,如何将“国王”逼入绝境,他们就会开始好奇,并自己往前倒推,如何调配其他的棋子,走到这步。

在这种培训模式下成长起来的孩子,少了很多禁锢,策略更加灵活丰富。

莫里斯总结说:

“灵活性是人类在博弈中,最难培养的品质之一。”

说句题外话,开发出AlphaZero的DeepMind的创始人戴密斯·哈萨比斯(Demis Hassabis)13岁就成了国际象棋大师,他在采访中说:“对我而言,国际象棋是一切的起点。国际象棋是关于优化决策的游戏,它让我开始思考关于思考的过程:人脑是怎么得出这些想法的?什么是真正的智能?”

莫里斯认为:“最关键的智慧绝不是靠背诵。最终我们学习规则是为了打破规则,但很多人把它弄颠倒了。在实践中你会发现,有时候一个‘真理’会和另一个‘真理’相冲突,这容易让人无所适从,这个时候,你就会发现见解比事实更有意义。”

这类似于爱因斯坦所说的:“想象力比知识更重要。”

投资的制胜之道:向AI学习如何高明的“弃子”

“如果不放弃有价值的东西,许多局面就无法获胜。”

电影《女王的棋局》(The Queen's Gambit)还有一个中文译名叫做《后翼弃兵》。“后翼弃兵”就是一种“弃子”战术,指在开局的前几个回合,故意牺牲士兵,来换取出棋速度,是一种含蓄迂回、运筹帷幄,又深藏不露的高明打法。

图7. 《女王的棋局》电影海报

但能否高明地做到“弃子”,除了技术因素,还有心理因素。有意思的是,人们发现AI在“弃子”方面很有优势,不像人类棋手那么有心理负担。比如,AlphaZero尤其敢于弃子,棋风咄咄逼人;在人类的视角来看,这绝对是一位对局面结构和长远战略有深刻领悟的对弈高手。

人类在本能上,非常厌恶失去,如果没有长远战略的考虑,人们很难做出牺牲。

“弃子”分为两种。一种是“虚假的弃子”,也就是那些很明显的,对弈双方都可以清楚计算具体收益的弃子;还有一些被认为是“真正的弃子”,是指放弃的这个棋子,所带来的收益并不是立竿见影的。它可能是控制了更多的空间、或是在对手的阵地上制造了一个可攻击的弱点,或者在关键的进攻区域拥有了更多的棋子和机会。随着棋局延续,这一步弃子的效果会慢慢展开,最终,更懂得取舍之道的人,才能笑到最后。

“真正的弃子”正是因为这种不确定的模糊性,才能成为具有战略意义的投资。

霍华德·马克斯认为,人类在投资中,尤其是和AI在投资的博弈中,需要深刻的思考并理解“弃子策略”——

这是投资中实施“真正的弃子”策略的艺术性所在,也是难度所在。

………………………………………………………………………………………………

再回到开头的话题,我们提到,27年前,那个代表人类对抗第一代人工智能“深蓝”的象棋大师加里·卡斯帕罗夫,他如今过得怎么样?

卡斯帕罗夫在被深蓝击败后,仍然保持着世界冠军的头衔直至2000年。

但从1997年开始,他以对抗深蓝为契机,开始深度地观察和思考人工智能对人类社会的影响。

2005年退役后,他曾作为教练,帮助马哥努斯·卡尔森获得国际象棋世界第一。

与此同时,他根据自己的经历与思考,出版了《深度思考:机器智能的终结和人类创造力开始的地方》这本书。

他还曾受邀,在Google Talk中,分享对AI的思考。

关注【泉果视点】,我们在近期,会为您讲述卡斯帕罗夫的这本书,从他的视角看一看人工智能对他人生的全面影响。

#重回上坡路?腾讯股价站上400港元#

参考资料:

Move by Move: Life Lessons On and Off the Chessboard,Maurice Ashley

The Indispensability of Risk, Memos from Howard Marks, Apr 17, 2024

Chess grandmaster Maurice Ashley on why mistakes are our greatest teachers, ReThinking with Adam Grant, Dec 19, 2023

Inside Story: An Interview with GM Maurice Ashley,Chess Life Magazine, Apr 25, 2024

法律声明

本资料不作为任何法律文件,不代表泉果基金的任何意见或建议,不构成泉果基金对未来的预测,所载信息仅供一般参考。前瞻性陈述具有不确定性风险,泉果基金不对任何依赖于本资料而采取的行为所导致的任何后果承担责任。

• END •