05-24 16:29
AI行情早就结束了!跟光伏一样反弹下跌!反弹下跌!
AI大模型合成数据的江湖有商汤一席之地!
摘抄:
【当我们缺算力时,对面已经缺数据了,当微软开始使用合成数据,中科曙光和浪潮信息的优势显著】
对于AI行业来说,算力固然重要,但是随着资本的入场,英伟达一家独大垄断算力的格局终会被改变,随着供应的增加,未来的算力不再是稀缺资源,而会像电力一样廉价易得。未来真正制约AI发展的,可能不是算力而是数据,因为数据体量决定了大模型的智能水平。
于是,继合成生物之后,合成数据来了。微软研究团队最新成果:他们已经开始使用合成数据来训练AI模型了。
微软使用大语言模型生成了近100种语言、数十万个文本嵌入任务的“模拟”文本数据,然后用这些数据来训练 AI 。
微软做了大量实验,结果表明,使用合成数据训练的大型语言模型在多语言、多任务场景中都能取得优异的性能,证明了合成数据方法的有效性和实用性。
合成数据的优点有:覆盖范围广,可以获取很多不存在的数据。减少偏见,减少了数据收集过程中的局限性。灵活性好,可支持扩展数据,根据需求定制数据。成本低,效率高,可快速迭代。
AI行情早就结束了!跟光伏一样反弹下跌!反弹下跌!