发布于: 修改于: Android转发:1回复:2喜欢:0
$岩山科技(SZ002195)$ 上海国内全新自研黑科技来啦!
上海+黑科技+低位低价+业绩预增
妥妥的国产自研黑科技---岩芯数智正式发布了国内首个非Attention机制的通用自然语言大模型——Yan模型,
1月24日,在上海岩芯数智人工智能科技有限公司“新架构,新模力”大模型发布会上,岩芯数智正式发布了国内首个非Attention机制的通用自然语言大模型——Yan模型
超大算力叠加FSD
作为行业内少有的非Transformer大模型,Yan模型用全新自研的“Yan架构”代替Transformer架构,用百亿级参数达成千亿参数大模型的性能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升
“在全球范围内,一直以来都有不少优秀的研究者试图从根本上解决对 Transformer架构的过度依赖,寻求更优的办法替代 Transformer。就连Transformer 的论文作者之一Llion Jones也在探索‘Transformer 之后的可能’,试图用一种基于进化原理的自然启发智能方法,从不同角度创造对AI框架的再定义。”
岩芯数智也不例外,他们在对Transformer模型不断的调研和改进过程中,意识到了重新设计大模型的必要性:一方面,在Attention机制下,现有架构的调整几乎已经达到瓶颈;另一方面,岩芯数智更期望降低企业对大模型的使用门槛,让大模型在更少的数据、更低的算力下具备更强的性能,以应用于更广泛的业务。因此,在历经近1000多个日夜,超过几百次的设计、修改、优化、对比、重来后,岩芯数智自主研发出了不再依赖Transformer的全新架构——“Yan架构”,同时,基于Yan架构的通用大模型应运而生。
$中国石油(SH601857)$ $深中华A(SZ000017)$<a href="http:/<a href="http:/

全部讨论

01-26 11:42

Yan模型在实际应用中的表现还需要经过市场的检验,正如岩芯数智董事长陈代千的总结陈词:“随着Yan模型的进一步落地和应用,期待以Yan架构为基础的通用大模型,为各种机器人、嵌入式设备、物联网设备提供所需的智能化能力,能为人工智能行业注入新的活力、新的思路,新的可能,为企业和用户创造更多的价值。也用我们的力量,参与推动人工智能领域新一轮的技术变革。”$深中华A(SZ000017)$ $长江投资(SH600119)$

要是真的就好了,不用依耐美国算力了