读书笔记之《暗知识》:人工智能将成为生产知识的主角

发布于: 雪球转发:0回复:0喜欢:4

《暗知识—机器认知如何颠覆商业和社会》的作者是王维嘉,2019年出版。

王维嘉,中国科技大学学士和硕士,美国斯坦福大学博士。曾在斯坦福大学师从人工智能鼻祖之一、美国国家工程院院士伯纳德·威德罗教授。在硅谷学习、工作、创业、投资超过30年,拥有十几项美国基础专利,开发了世界上第一台手持互联网终端,是全球移动互联网的布道者和践行者。目前在硅谷专注投资人工智能,每年调研全球上千家高科技创业公司,访问世界学和研究所。曾受邀在凤凰卫视、中国证监会、深圳市政府等就人工智能进行演讲,反响强烈 。他是硅谷风险投资公司 CEG Ventures 的创始合伙人,也是中国企业家论坛(亚布力)创始终身理事、中国企业研究所创始理事长、欧美同学会2005委员会共同创始人和第三届理事长、中国企业家环保协会(阿拉善)创始终身会员,以及数字中国共同创始人常务理事。

这本书深入探讨了人工智能(AI)如何通过发现和利用人类无法直接感知或表达的“暗知识”来颠覆传统认知,并对未来社会和商业产生深远影响。以下是对书中各章节内容的详细总结:

第一章:横空出世——暗知识的发现

- 骄傲的人类:回顾了人类如何通过语言和文字积累知识,以及科学革命如何确立了基于观察和逻辑推理的知识获取方式。

科学革命本质是采用了科学方法。比如开普勒三定律不仅完满解释了第谷的所有观测数据,并且能够解释任何新观测到的数据。这个发现过程有三个步骤:第一,积累足够的观测数据(第谷20年的观测数据);第二,提出一个先验的世界模型(哥白尼的"日心说");第三,调整模型的参数直至能够完美拟合已有的数据及新增数据(把圆周轨道调整为椭圆轨道,再调整椭圆轴距以拟合数据)。验证了这个模型有什么用?最大的用处就是可以解释新的数据或做出预测。在这里开普勒三定律就是新发现的知识。发现知识的可靠方法就是不断修改模型使模型与观测数据完全吻合。

上面这三个步骤奠定了现代科学的基本原则,正式吹响了科学革命的号角,直接导致了后来的牛顿万有引力的发现,

- 天才的哽咽:描述了AlphaGo战胜人类围棋冠军的事件,展示了机器如何通过自我学习掌握复杂的棋艺。

- 机器发现了人类无法理解的知识:讨论了AlphaGo Zero如何通过强化学习在没有人类指导的情况下掌握围棋,揭示了机器学习的能力。

- 理性主义和经验主义之争:探讨了人类对知识本质的哲学争论,理性主义强调逻辑推理,而经验主义强调感官经验。

- 知识的生物学基础——神经元连接:解释了神经元连接如何形成记忆和知识,以及赫布定律如何描述学习和记忆的神经机制。

赫布学习定律(Hebb's rule),又称为赫布猜想(Hebb's postulate),是加拿大心理学家唐纳德·赫布(Donald Hebb)在1949年提出的关于学习和记忆的神经科学理论。该理论的核心观点是,当两个神经元在时间上频繁地同时被激活时,它们之间的连接会增强;相反,如果两个神经元很少同时被激活,它们之间的连接会减弱。这种机制被称为“细胞间的联合”,是神经网络中学习和记忆形成的基础。

赫布学习定律可以用一个简单的数学表达式来描述:如果神经元A的轴突足够接近神经元B,并且A的激活导致了B的激活,那么A到B的突触连接(synaptic connection)的权重会增加。这个过程可以用以下公式表示:ΔW = f(A, B)

其中,ΔW 是突触权重的变化,A 和 B 分别是两个神经元的激活状态,f 是一个函数,描述了激活状态如何影响突触权重的变化。

赫布学习定律的提出对神经网络和人工智能领域产生了深远的影响,特别是在人工神经网络的设计和训练中,许多学习算法都是基于这一原理。例如,著名的Hebbian学习规则被用于调整神经网络中的权重,以模拟学习和记忆过程。

作者根据是否可表达、是否可感受,将知识分为明知识、默知识、暗知识这三类:

- 可表达的“明知识”:讨论了可以用语言和符号表达的知识,以及语言的局限性。

- 只可意会的“默知识”:描述了那些无法用语言完全表达的知识,如技能和直觉。

- 既不可感受也不能表达的“暗知识”:介绍了机器如何通过学习大量数据发现人类无法理解的相关性,即暗知识。人工智能可以发现暗知识,这是隐藏在海量数据中的相关性,不可感知也不可表达,这些暗知识以神经网络的参数集形式存在,对人类来说不可描述。

第二章:榨取数据——机器能学会的知识

- 机器学习明知识:介绍了机器如何通过符号学派、贝叶斯学派和类推学派学习明知识。

- 机器发现暗知识:探讨了机器如何通过神经网络和强化学习等方法发现暗知识。

- 联结学派和进化学派:分别介绍了模仿人脑神经元连接的联结学派和模仿自然演化的进化学派。

第三章:神经网络——萃取隐蔽相关性

- 从感知器到多层神经网络:回顾了神经网络的发展历程,从最初的感知器到多层神经网络。

- 神经网络模型:描述了神经网络的基本结构和工作原理。目前的神经网络只有相关性的学习能力,没有因果推断能力。

- AlphaGo的“上帝视角”:分析了AlphaGo如何通过神经网络实现对围棋的深刻理解。

- 深度学习:讨论了深度学习如何通过多层神经网络处理复杂数据。

- 循环神经网络:介绍了循环神经网络在处理序列信息方面的优势。卷积神经网络适合于处理空间信息,循环神经网络适合于处理时间信息。

第四章:逐鹿硅谷——AI产业争霸战

- 最新技术巨浪:分析了AI技术如何成为推动社会进步的新动力

AI和互联网的区别:AI一开始就颠覆传统行业,技术驱动而非商业模式驱动,不会出现平台级公司,属于to b性质的生意,无法垄断。

AI新创公司的优势在于:人才和激励机制,感冒风险尝试新东西,快速迭代,把握市场需求。

那么我们如何判断一家AI创业公司的价值呢?首先,应该看是否能够拿到别人拿不到的数据。做到这一点很难,你能拿到的数据别人通常也能拿到。如果不能独占数据,那就要看有多大先发优势。如果进入一个行业早,通过快速迭代,让自己的模型在这个行业中变得有用,就可以得到更多的数据和资源,后进者即使拿到同样的数据,模型质量差也打不进去。其次,要看该企业对所进入行业的独到理解和业务开发、落地能力。当然如果能够针对本行业在算法上有突破,就能够大大提高进入壁垒。

- AI突破三要素:探讨了计算能力、数据和算法在AI发展中的重要性。作者认为:人类劳动过程中的数据是未来最重要的数据,比如农业工业服务业的过程数据。另外,传感器 到的环境数据也很重要。数据交易平台很关键:提供数据可以赚钱,使用数据需要付费

- 金字塔形的产业结构:描述了AI产业的组织结构和各层级的角色。

- 技术制高点:芯片:讨论了芯片在AI计算中的核心地位。

- 生态大战——编程框架的使用和选择:分析了编程框架在AI生态系统中的作用。

第五章:飓风袭来——将被颠覆的行业

- 自动驾驶颠覆出行:探讨了自动驾驶技术如何改变交通和物流行业。

- 医疗与健康:介绍了AI在医疗影像、药物研发和健康管理中的应用。

- 智能金融:分析了AI如何影响银行、保险和证券行业

- 智能时代万物皆媒:讨论了AI在媒体、写作、新闻个性化等领域的应用。

- 智慧城市:描述了AI在城市管理、交通、安防等方面的应用。

- 重复体力劳动者将被机器人全面替代:探讨了机器人在制造业、批发零售业等领域的应用。

第六章:暗知识神迹——机器能否超越人类

- 基于深度学习的AI本质:讨论了AI如何通过深度学习发现数据间的相关性。

AI机器在未来将取代人类成为认知主体,知识的主要发现者

- 科研加速:介绍了AI如何加速科学研究的进程。

- 唐诗高手、真假凡·高、下一场空战:探讨了AI在艺术创作、军事等领域的应用。

- 群体学习和光速分享:分析了机器之间如何通过群体学习共享知识。协同互联的AI机器人,智力将得到超级增长。

第七章:“神人”与“闲人”——AI时代的社会与伦理

- 谁先失业:讨论了AI对就业市场的影响。

最容易被AI取代的是那些重复性高、可预测、可编程的工作。 AI将替代许多脑力劳动者。很多高技能高收入的职业也会受到冲击,比如x光读片医生。

很难标准化程序化的工作,需要理解人类情感,和人类沟通的工作,最难被AI取代:考古,心理咨询,医生等。

AI时代的学生应该学什么?数学、概率论、物理、化学等这些基础学科,语文非常关键,关乎人的表达能力、同理心、沟通等。

- AI时代的新工种:介绍了AI时代可能出现的新职业。

- 新分配制度:探讨了无条件收入和无条件培训等社会政策。

- 权力再分配:分析了AI如何改变权力结构。

科技使财富向科技创业成功者聚集。历史上每次技术革命都会改变权力的分配。AI的核心资源是芯片和数据,权力回集中在少数科技大公司(英伟达谷歌微软、OpenAI等)和政府中。

- 是否该信任机器的决定:讨论了在决策过程中对机器信任度的问题。

- 机器会产生自我意识吗:探讨了机器是否能够发展出自我意识。

人永远区别于、强于人工智能机器的地方:

语言能力,想象力,自我意识,情感和同理心。

展望未来,人性不变,最大风险依然来自人类本身。

整本书通过深入浅出的方式,不仅介绍了AI的技术和应用,还探讨了AI对社会、经济和伦理的深远影响,为读者提供了一个全面了解AI如何塑造未来世界的视角。作者对AI原理的解读非常通俗易懂,适合零基础的读者入门了解。