06-29 13:25
对啊。标准的起个大早赶个晚集。智谱去年也是,搞什么独树一帜GLM架构,1月份版本才改,现在好了,初创领先优势丢掉了。都是对最先进的技术跟踪不够,还有就是太自信。moe不会是终极架构,但当前是最优架构,跟得上最先进的模型才行。现在没moe架构,在国内都落后。
说说讯飞
讯飞星火不太行,就是拿LLaMa的代码改吧改吧训练的,长文本就是纯靠数据,没啥自己的杀手锏,大家可以体验一下,你传两个pdf上去,先问第一个相关的问题再问第二个,然后再回答第二个的时候还是绕着第一个回答,存在硬伤。
讯飞的语音还是可以的,但是...
对啊。标准的起个大早赶个晚集。智谱去年也是,搞什么独树一帜GLM架构,1月份版本才改,现在好了,初创领先优势丢掉了。都是对最先进的技术跟踪不够,还有就是太自信。moe不会是终极架构,但当前是最优架构,跟得上最先进的模型才行。现在没moe架构,在国内都落后。