熊熊打牛牛

熊熊打牛牛

他的全部讨论

讨论

回复@凌冽北风: 你gpu加卡也会带来额外的通信开销啊,事实就是无论怎么堆卡,gpu都达不到当前groq的吐字速度//@凌冽北风:回复@熊熊打牛牛:把数据处理和运算比喻成开车显然胡扯,GPU是并行计算,将各个计算任务同时分配到不同的处理单元中并行计算,以提高计算效率。跟开车怎么可以相比呢?因为开车...

讨论

$北京君正(SZ300223)$ groq成本问题众说纷纭,其实我这里举个简单例子大家就明白了,groq就好比是造了一个完整线路的高铁,建设成本高,但当客流量(tokens)大起来以后,成本就被摊下去了。gpu就好比是汽车拉人,虽然单台成本低,当如果拉同样足够多的人,一定是高铁成本更低。
groq ceo发推...

讨论

jyq的计算方式本来就有问题,忽略了batching。实际上测算出来的100t token成本groq是要更低的

讨论

回复@孙孙孙孙孙孙逊: 其实成本也不是问题,毕竟谷歌tpu也是类似技术//@孙孙孙孙孙孙逊:回复@黎明的曙光43:新产品诞生阶段过度关心成本没太大意义,grop让咱们看到了有捷径追赶的可能,单是这种可能性就值得一搏,也没必要去跟hbm踩一个吹一个的,多条腿走路肯定顺畅,何况现在都是低位。$北京君正...

讨论

回复@真相如此: 你千万别买sram 求你了//@真相如此:回复@熊熊打牛牛:你比jyq更内行?搞笑

讨论

回复@真相如此: 装啥呢你,一个外行人切莫知浅言深。jyq成本的计算方式本来就问题,groq ceo这条推给出的groq成本比jyq的laptop方案要低,并且吞吐更高//@真相如此:回复@熊熊打牛牛:你看懂了没?

讨论

回复@真相如此: ?//@真相如此:回复@熊熊打牛牛:你看懂了没?

讨论

$北京君正(SZ300223)$ 贾扬清被光速打脸,笑死

讨论

$海底捞(06862)$ 为啥这次赠股没除权

讨论

$融创服务(01516)$ $融创中国(01918)$ 中国建设银行对融创服务的持股比例昨天突然从0变成百分之二十,这是质押出去了?