发布于: 雪球转发:0回复:11喜欢:2
回复@掌柜: 我这么理解:数据和知识存储在几千亿参数组成的数字神经网络中,就好像我们接受了十几年学校教育和数十年人生经验后,获得的知识经验都存储在一个离线的大脑神经元网络里。
其实你去读一读芯片存储的百科词条,看一下芯片存储的技术原理,其实也是利用一些与或非逻辑门组成的开关网络来存储0和1信息,也是将信息存储在一个网络中。AI大模型不过是将信息存储在了一个虚拟的神经网络中。
在过去,我们以为科学规律都可以总结成几个数学公式,但是在今天,我们应该改变这种观念了,这个世界上大部分规律不是几个公式足以概括的,比如中文与英文互译的规律,就不是几个公式可以总结的,而是需要一个几亿甚至几十亿参数的AI大模型才能概括两种语言互译的规律。
所以,AI大模型就是在今天人类对各个领域规律进行自动化总结的一种知识结晶……//@掌柜:回复@forcode:期望大神科普:为何大模型通过训练,获得参数后;每次问不同的问题,都可以通过相同的模型参数来进行相应的推理?
例如问“画一幅小猫开车”的图片,与讲一个“关羽上太空”的故事,如果用“函数”去理解,按道理两者的参数不一样,为什么大模型可以用统一的训练好的参数去推理这两个问题?
引用:
2024-05-23 09:54
80%利润率,卖一个最后不太产生收入的东西,很多时候还有安慰剂效果(没错我说的是sovereignty AI),一般咱们把这个叫保健品吧?不懂半导体

全部讨论

05-24 11:10

黄仁勋:“这次工业革命的核心在于我们首次大规模生产了一种全新的东西——Token。这些Token,即浮点数,具有巨大的价值,因为它们代表着智能,即人工智能。它们可以被重新组合,转化为语言、蛋白质、化学品、图形、图像、视频、机器人驱动等多种形式。我们正在以前所未有的规模生产Token,并通过人工智能发现了几乎任何类型Token的生产方式。因此,世界将生产大量的Token,这些Token将在新型的数据中心——我们称之为AI工厂中生产。”

05-24 08:03


之前我还是陷入了高中数学的“函数”和“参数”去理解,以为训练的成果就是得到若干条矩阵运算而成的“函数”,“参数”就是通过训练来获得的“矩阵”,忽略了训练也同时得到数据。
总体上,好像按照生物的神经网络去理解,“训练”得到的是知识点以及各个知识点直接的连接“路径”。“推理”是把知识点相关的若干条路径找出来,并比较概率大小,推荐最大概率的那条“路径”。“推理”不是一个调用函数的过程,不是建设虚拟网络的过程,是一个调用路径和比较的过程。

感觉大模型是“近似”,比分说出现123456等条件的时候结论大概率是A,那么下次遇到的时候就吐出结果A,特别是文生图片和视频,其实是没有理解世界是咋样的规律,就是模仿生成

05-24 11:07

离线百科全书加推理

越来越像人脑了

05-23 22:49

因为大模型也是用神经网络学习的,不是靠规则,跟人学东西一样,就像认识一只猫是看了无数猫之后总结出来什么是猫,而不是靠规则学会什么是猫的。