发布于: 雪球转发:2回复:6喜欢:3

【当我们缺算力时,对面已经缺数据了,当微软开始使用合成数据,中科曙光浪潮信息的优势显著】

对于AI行业来说,算力固然重要,但是随着资本的入场,英伟达一家独大垄断算力的格局终会被改变,随着供应的增加,未来的算力不再是稀缺资源,而会像电力一样廉价易得。未来真正制约AI发展的,可能不是算力而是数据,因为数据体量决定了大模型的智能水平。

于是,继合成生物之后,合成数据来了。微软研究团队最新成果:他们已经开始使用合成数据来训练AI模型了。

微软使用大语言模型生成了近100种语言、数十万个文本嵌入任务的“模拟”文本数据,然后用这些数据来训练 AI 。

微软做了大量实验,结果表明,使用合成数据训练的大型语言模型在多语言、多任务场景中都能取得优异的性能,证明了合成数据方法的有效性和实用性。

合成数据的优点有:覆盖范围广,可以获取很多不存在的数据。减少偏见,减少了数据收集过程中的局限性。灵活性好,可支持扩展数据,根据需求定制数据。成本低,效率高,可快速迭代。

对于中科曙光浪潮信息来说,不仅是国产算力龙头,也是大数据技术龙头。在未来的数据风口中,依然是C位。

值得注意的是,$中科曙光(SH603019)$$浪潮信息(SZ000977)$$信创ETF基金(SH562030)$ 跟踪的中证信创指数的第一、第二大重仓股,截至昨日(5月23日)权重占比分别为7.32%和6.91%。“信创蓝海,指选龙头!”,看好信创板块发展前景的投资者,建议特别关注信创ETF基金(562030)

(来源:东财,东方韩信)

全部讨论

05-24 18:20

还在这吹牛逼,国内的AI股技术含量几斤几两心里还没点数?

05-25 14:30

$商汤-W(00020)$ 商汤的合成数据能力在徐立、王晓刚的演讲及访谈中都说到了,
AI大模型合成数据的江湖有商汤一席之地!
摘抄:
【当我们缺算力时,对面已经缺数据了,当微软开始使用合成数据,中科曙光和浪潮信息的优势显著】
对于AI行业来说,算力固然重要,但是随着资本的入场,英伟达一家独大垄断算力的格局终会被改变,随着供应的增加,未来的算力不再是稀缺资源,而会像电力一样廉价易得。未来真正制约AI发展的,可能不是算力而是数据,因为数据体量决定了大模型的智能水平。
于是,继合成生物之后,合成数据来了。微软研究团队最新成果:他们已经开始使用合成数据来训练AI模型了。
微软使用大语言模型生成了近100种语言、数十万个文本嵌入任务的“模拟”文本数据,然后用这些数据来训练 AI 。
微软做了大量实验,结果表明,使用合成数据训练的大型语言模型在多语言、多任务场景中都能取得优异的性能,证明了合成数据方法的有效性和实用性。
合成数据的优点有:覆盖范围广,可以获取很多不存在的数据。减少偏见,减少了数据收集过程中的局限性。灵活性好,可支持扩展数据,根据需求定制数据。成本低,效率高,可快速迭代。

AI行情早就结束了!跟光伏一样反弹下跌!反弹下跌!

05-25 18:33