胡鑫:大模型构筑不动产运营新质生产力 | 观点数字未来发展大会

发布于: 雪球转发:0回复:0喜欢:0

本文为胡鑫先生在2024观点数字未来发展大会发表的演讲

胡鑫(腾讯云副总裁、智慧建筑与不动产行业负责人):首先感谢各位,我是第二次参加观点举办的这个大会,所以我想花点时间介绍一下我们在这个行业里面,我们对大模型,包括新质生产力是怎么思考的。在座的有我们的客户,也有我们的合作伙伴,所以花点时间介绍一下,有些想法不太成熟,大家多指正。

现在整个大的科技趋势,我们都无法回避一个概念,就是大模型。我认为科技对于房地产、建筑、不动产一定是一个辅助的工具,可以让这个行业更有温度、效率更高,在这个新的环境下,得以稳步往前发展。

今天我们讲大模型的发展趋势,从1957年的技术发展到GPT4、AIGC,其实走了很多年,所以这不是一个新技术,它也是一步一步迭代出来的技术。其实人工智能的概念,包括最早提到的图神经网络,几年前提到的网格计算,包括英伟达的芯片技术在2002年的时候已经在一些场景上用得很丰富了。到今天突然爆发,其实它是一个积累迭代的过程,我们今天发现这个事情慢慢进入人的生活了,到了今天它迭代到一定程度,它可以做联邦学习,可以做大语言模型。

今天大模型新的特点,第一个就是泛化性,对新数据的适应能力,或者说模型在从未见过的数据上能够表现出来的良好性能大大提升。但这个不是一蹴而就的。第二是在通用性的场景下,或者说跟人们息息相关的生活中,它的通用性可以解决多任务的能力上有大大提升。第三是在实用性上,它有大规模的提升。跟人的生活相关,在应用的时间性和可用性效率上,包括快速处理事情的能力、快速决策上有大提升。

今天国内已经发布了110多个大模型,覆盖了工业、政务、交通、传媒和能源等等行业,但是面对的场景还是图片生成、聊天对话、文案创作、广告营销等等,大家可以看这些领域,其实还是有它的特点的,更多的是更加贴近消费者、贴近终端的应用。计算机、科技和数字化的应用,一定是从C端开始慢慢往上转的。这跟腾讯从消费互联网转到产业互联网,这个路径是相似的,AIGC的发展也是沿这个路径走的。

我们在大模型的策略上,包括在行业内做科技企业的大模型策略,其实都是往这两个方向走的,第一是在通用能力上会有大规模的升级,所以我们基于大模型的基础,我们有自研的混元,刚才很多嘉宾也谈到的底层的大模型基础,这个基础是要投入大量的资本、人力、物力研发的,所以今天才得以迭代。第二是它有丰富的模型能力,包括文案的营销能力和文生图能力之后,它会有一些场景。如果今天大模型在行业内,比如在地产、物业的服务场景里面,一定是依赖于具像能力和精调能力,所以在一些垂类领域,行业大模型的效果优于通用模型。行业模型更利于私有化部署,这也符合To B行业的特点,因为有些数据我们不方便放在公有云上,或者不方便放在外面,要放在私有云里面,数据不出本地,在私有化环境里面自用,这是一个趋势。

刚才几位嘉宾提到,今天模型的算法和架构已经相对比较成熟,但是现在无论是国内还是国外,数据的完整程度、数据的治理程度决定了你训练、精调、推理最后的结果和效率。我相信大家在实际运用中也会遇到,你的数据量虽然大,但是你的效果不一定好,所以这个事情我们不是孤立地看模型,今天我们通过科技去赋能实业的时候,不能孤立看一件事情。即使今天我们有模型,有AIGC能力,但是你没有数据,或者数据质量不好,最后的结果也不会很好。当然还有应用场景,这三位一体的东西会导致最后的实践效果比较差,最后我们还是要看业务场景的,我们最后还是要看房子卖多少套、物业服务效率要提高多少,是不是有温度。

我们通过行业大模型推出了一些所谓的效能革命,其实我觉得效能革命这个词说得不好,还是"有温度"比较好。今天我们所有提供的这些能力,可以提高效率、提高服务品质、提高温度、提高质量。所以这里面第一个是能力更强,它的专业能力和推理能力更强,释放人的额外重复劳动。第二是效率更高,助力生产、经营、管理模式重塑业务。第三是场景更广,第四是应用更深。还有一点,如果利用这个能力会使我们的业务数据更加能积累、更加标准化、更加能数据资产化。今天我们提到新质生产力,也提到数据要素交易,数据要素交易的前提一定是数据的资产化,资产化的前提一定是标准化,质量要好,所以大家是互相迭代的。

我负责建筑不动产行业领域,包括物业、地产、建筑,也给大家分享一下我们是怎么做这件事情的。我们有一些科技能力和技术能力产品提供。首先底层方面,腾讯有强大的算力基础,因为我们本身是一个云计算公司,而且这个模型能力是基于算力的,这一点勿庸置疑。第二是在底层我们会基于行业建一些行业模型的开发生态,我觉得让一些企业自己去建技术模型,或者自己建一些行业的初始模型,为便利行业客户快速迭代,我们提供大模型的技术底座。在此基础上,我们还给客户提供了基于数据标注平台、训练平台,以及基于第三方的学习框架,还有应用平台。包括精调、训练、媒体AI、图像制作、客服等能力。再往上,大家可以在上面搭建自己的应用场景,同时训练你的垂直行业模型,慢慢就形成一个比较完整的业务闭环,我们会在云上提供这些能力。

基于这些模型之后,可以加入海量的行业数据去训练,我们提供了预训练,专业的人员和AI技术的训练,这里面有微调、训练,包括一些基于本行业的空间,这里面就结合了BIM和GIS等工具,以及完整时序数据,以更好的支撑设计、评估和建造场景的模型训练。但这并不是我们一家能干掉的,必须和一些合作伙伴一起来干这些事,我们提供工具、平台、基础的组件。

我们做了预训练之后,还会做一些精调,因为精调才能反向给应用提供一些服务,这里面会做一些参数的微调,大模型上的参数精调是非常需要专业化能力的。最后就是通过企业的数据、第三方的数据、公开的数据对它做强化训练,训练之后再调优,最后就向上对业务应用提供一个类似于AIGC能力,可能是一个助手,也可能是一个小程序,也可能是一个应用,这里面面对的可能是物业的服务场景,可能是工单系统,可能是你的业务联动性的分析系统,在这上面提供一些能力,做一些标注,最后就形成了垂类的行业模型。

在建筑不动产行业里面做行业大模型,我们也支持多个联动的场景,比如说在设计环节行业设计主要做电子图纸、CAD图纸,而今天则出现了更多的技术工具和数据内容,比如说通过遥感、城市GIS来形成片区的设计方案、BIM和CAD的数据,,以此形成一个虚拟的城市数字孪生空间。今天深圳做得非常好,已经形成了一个数字孪生的世界,。通过数字孪生的方式和今天通过大模型AIGC的能力,其实是大大提高了速度。所以我们可以利用多元异构的数据,基于模型做处理,通过数字孪生的技术,叠加AIGC的能力,这样形成一个可量化、可计算,最后形成一个全真互联的场景出来。

在2023年的游戏开发者大会上,我们把游戏的渲染能力、孪生能力、全真互联能力拿过来,加上AIGC,在AI Lab上,我们提出了自研的3D虚拟场景的自动生成解决方案。我们自动会生成面积25万平方公里、道路总长130公里、4416栋建筑城市,布局生成时间40分钟,独栋外观生成时间大概是一栋楼17.5分钟,这就是使用了一系列的混合技术+AIGC大模型的能力,就完全可以把整个数字城市、城市孪生模型生成出来。其实在后期的城市规划以及地产、营销模式里面,这是很好的模式,我们其实现在已经做到了,只要你的数据量是够的,你的孪生能力是够的,渲染能力、大模型能力加进来,你是可以做到的,当然这个成本怎么样,我们后面再探讨,相信在后期利用云计算能力、多模联调能力,这个事是一定能做到的。

我们再看另外一个场景,在不动产领域里面,物业人工客服的痛点分析,它明显是一个大模型语言交互模型的典型场景,AI大模型的知识库相比人工知识库能力大大的提升,所以今天的智能客服场景已经得到了大大的改观,我们在这一块跟物业公司有一些合作,大家有兴趣也可以交流一下。通过它做一些AI辅助、智能客服、知识库的训练,这样可以提升物业服务的温度。比如说24小时值守,包括数据的搜集、分发、工单等等事情都可以做到。

我们通过物业大模型给客户有温度的服务,基于通用模型、基于行业语料、行业法规、客户语料、数据,最后训练之后形成懂行业的语言模型,再懂业务的客户大模型。但是大家一定不要对这事期望值太高,今天我们能提供的能力,为什么叫有温度?有温度的核心逻辑是,它是一个辅助,它让人感觉更加亲切,同时在过程中慢慢迭代这个事情,最后达到我们想要的东西。我们的问答会越来越精准,这依赖于企业自身数据完整性、数据数量以及质量,包括你的日常训练的节奏,这其实是一个长期的过程。

我们在价值兑现的时候,第一个是精准,它会越来越精准,这肯定是一个需求,如果不精准你就不会用了。第二是降本增效,效率提升,第三是化繁为简。我今天早晨跟一个国内著名的物业公司领导聊,他说他们内部原来的培训资料非常多,这么多资料大家也没有怎么看,但是有了AIGC的能力,大家去针对性的查资料是非常方便的。

我今天花这些时间给大家介绍这个内容,核心还是希望通过像腾讯这样的科技企业的能力,通过我们的C端触达能力、模型能力、云计算能力,还是为在座的各位、为行业提供有价值的服务。希望未来能和大家多多合作。