发布于: iPhone转发:0回复:0喜欢:0
正在使用GPT的你是否已经习惯了这种处理信息数据的工作学习方式?其实类GPT们大语言模型本质就是一直数据治理。而在应用中添加 ChatGPT 等生成式 AI 将成为行业发展的关键点。
在大数据时代,业务流程应用软件会随着市场的变化快速而不断动态迭代甚至消亡,而数据成为了物理世界映射到数字化世界的原子,数据思维成为战略核心之一。
目前看大数据可分三个阶段
06年到09年,1.0时代大数据是互联网企业圈养的“宠物”。
09年到15年,2.0时代的标志就是崛起一批商业化大数据公司。
15年到现在,3.0时代,数据量指数增长,这个时期需要超融合多模态的数据平台以及AI工具加持。
2017年,谷歌大脑团队推出了用于自然语言处理的Transformer模型,成为当时最先进的大型语言模型(Large Language Model)。而OpenAI公司就是专注于研究Transformer模型的众多团队之一。
2017年Facebook 开源了 AI 相似性搜索工具Faiss(Facebook AI Similarity Search)。
从2017年算起,向量数据库发展才刚刚5年。而这也只是发展中的某一个时间节点。如果继续顺着技术发展的时间线看,基于transformer架构的GPT和向量引擎、向量数据库的发展是非常同步的。
从当前两个需求看,向量数据库或者说多模态数据库以及相应的大数据管理软件平台终将随着时代发展,助力这次科技革命:
一、行业内数据要素资产化的需求,各级政府、企事业单位,数据资源丰富的公司都必然将自己的数据资产量化。在数据集成,储存,分析,可视化,交易等过程中,涉及大量结构化和非结构化的数据,这就需要大数据管理平台、向量数据库以及相关专业性的配套工具。
二、人工智能的需求,GPT的可用数据是经过向量化处理的。我们常说的算法,算力,数据。其中这个数据并不是直接拿来使用的。训练大模型如此,部署本地模型亦如此。而将GPT进一步转化为生产力工具,就涉及数据安全,这个时候不联网或私域管理可能是更好的选择(比如制造业、生产性企业)。在这个过程也涉及公有云 私有云 混合云等等,这就又涉及超融合平台的概念了。
常识性的判断,这些都指向新型数据库和配套软件服务工具。
整体性思考的话,大的时代背景是数据量暴增,如何简单高效的利用海量数据?如何进行数据治理?为什么国家这个时候把数据要素提到这个高度?而哪些公司可以在本轮实现高成长?
GPT是伟大的,他将深刻改变我们的工作学习生产的方式,而在大的背景下看,GPT也只是这个大数据时代数据治理方式的重要节点!
$星环科技-U(SH688031)$ 正在使用GPT的你是否已经习惯正在使用GPT的你是否已经习惯正在使用GPT的你是否已经习惯