Cache(CACH)

0.0000 0.0000 0.0%

今开:0.0昨收:1.0E-6
最高:0.0 最低:0.0
涨停价:0.0跌停价:0.0
总市值:31.0

Cache的热门讨论

不要低估这次的国产模型

信息平权05-09 18:00

(声明:本文不是幻方软文,纯个人感想)
除了DeepSeek那篇官号文章,几乎没太多声音,尤其我看几个专业的AI号甚至都没报道,这属于严重低估了...(或者人家故意不宣传)。总之一句话, DeepSeek v2非常值得重视....
为什么被Semianalysis大哥在最新文章中高亮点名,因为真的有点离谱了...查看全文

一文到底:Nvidia新芯片对光模块需求不降反升

闷得而蜜03-19 20:15

昨天Nvidia GTC发布会,老黄重磅推出GB200新产品,号称72个GPU直接通过铜缆互联,组成一个集群Giant GPU,提升了30倍的性能。A股早上开盘吓尿了,中际旭创、新易盛、天孚通信这三家直接低开。那么,GB200是否真的会降低光模块的需求吗?
AI算力集群
将大量GPU芯片联在一起,组成一张大规模...查看全文

打完怪兽好睡觉05-14 15:23

回复@仓又加错-刘成岗: 推理是需要多卡互联的,单卡现存当KV cache可能都不够,这样实现不了长文本窗口。
推理常见的几种并行加速方法,张量并行、数据并行、流水线并行等等,基本上都是把推理请求压成batch,分配到多张卡上,这样可以计算&存储资源利用最大化。否则存储资源远落后于计算...查看全文

深入浅出谈谈,AI集群、NVLink、光模块

闷得而蜜03-22 09:57

深入浅出谈AI光模块需求
性能提升的秘密武器:缓存
CPU访问一次DDR内存空间,需要几百个时钟周期,如果没有其他办法,将会导致99%的时间CPU时间在等待数据而空转。所以科学家就想出了一种办法: Cache。
计算机的程序和数据访问范围虽然很大,但是具有明显的局部性特征:在某一时刻,程...查看全文

幻方在大模型deepseek v2的底层创新可能颠覆了训练和推理成本

盘在树上睡觉的蛇05-09 13:59

自从GPT 3.5出来以后,大家都知道“Talk is cheap, Show me your AI”,所以deepseek v2是直接出了界面以及开放了api,而且上来就免费送5M token的方式,间接证明了他们论文中推理成本大降的事实。
去年一直关注开源大语言模型的人都知道,deepseek coder 34B有4~5个月是编码领域的SOTA模型,c...查看全文

桌子子05-10 07:56

回复@宽一投资: 你说的cache coherece问题arm那边已经有解决方案,你可以看看arm的axi ace和chi标准,以及cmn等一致性互联的ip//@宽一投资:回复@燕山野人:arm cpu如果是办公电脑上随便用用,弄个windows虚拟机也能勉强用用,但是用作服务器cpu却是性能极差,因为arm cpu从网口收发数据报文的速度只...查看全文

闷得而蜜03-20 11:53

昨天硅谷的算法专家特别提到了 NVLink集群规模对软件编译器的影响。 做算法的人都知道,要将巨大的矩阵运算进行拆解,放到不同的GPU并行计算。 因为NVLink 集群和 IB集群比,他直接在硬件层面访问内存,效率要高很多。但是呢,要发挥NVLink优势的前提是,必须把局部密集的运算,通过编译器自动发现...查看全文

知名服装品牌被申请破产审查!北京、上海只剩3家店,最多可打三折,消费者:价格实惠、质量不错

每日经济新闻04-23 18:20

拥有百年历史的荷兰快时尚品牌C&A,在中国的生意一直处于不温不火的状态。在出售其中国业务后,也未能迎来转机。
近日,C&A关联公司西雅衣家商贸集团有限公司新增一则破产审查信息,申请人为上海金衡法律咨询有限公司,经办法院为上海市第三中级人民法院。
西雅衣家商贸集团有限公司成立...查看全文

周小小kan03-26 09:43

啥年代了。,flash attention mem cache这些机制早就让复杂度不是n^2 了、 mamba 工业界就没太多人关注, 这里是生态的问题 除非他好的太多太多 不然大家不会打破原先已经有东西查看全文

闷得而蜜03-19 20:49

大集群套小集群的理解。如果学过计算机的人,可以把他理解成层次化的Memory,DRAM->L3 cache ->L2 cache -> L1 cache。搞这么多,是因为算法有局部性的特征,通过小集群,收获这部分增益。查看全文

1 2

Cache的最新讨论

打完怪兽好睡觉05-14 15:23

回复@仓又加错-刘成岗: 推理是需要多卡互联的,单卡现存当KV cache可能都不够,这样实现不了长文本窗口。
推理常见的几种并行加速方法,张量并行、数据并行、流水线并行等等,基本上都是把推理请求压成batch,分配到多张卡上,这样可以计算&存储资源利用最大化。否则存储资源远落后于计算...查看全文

桌子子05-10 07:56

回复@宽一投资: 你说的cache coherece问题arm那边已经有解决方案,你可以看看arm的axi ace和chi标准,以及cmn等一致性互联的ip//@宽一投资:回复@燕山野人:arm cpu如果是办公电脑上随便用用,弄个windows虚拟机也能勉强用用,但是用作服务器cpu却是性能极差,因为arm cpu从网口收发数据报文的速度只...查看全文

大大的快乐的炒股人05-10 00:50

在雪球居然能看到大模型推理的文章,还有batchsize,GQA,MLA这些kv cache优化策略。点个赞,我就正在找这个方面的工作。查看全文

不要低估这次的国产模型

信息平权05-09 18:00

(声明:本文不是幻方软文,纯个人感想)
除了DeepSeek那篇官号文章,几乎没太多声音,尤其我看几个专业的AI号甚至都没报道,这属于严重低估了...(或者人家故意不宣传)。总之一句话, DeepSeek v2非常值得重视....
为什么被Semianalysis大哥在最新文章中高亮点名,因为真的有点离谱了...查看全文

幻方在大模型deepseek v2的底层创新可能颠覆了训练和推理成本

盘在树上睡觉的蛇05-09 13:59

自从GPT 3.5出来以后,大家都知道“Talk is cheap, Show me your AI”,所以deepseek v2是直接出了界面以及开放了api,而且上来就免费送5M token的方式,间接证明了他们论文中推理成本大降的事实。
去年一直关注开源大语言模型的人都知道,deepseek coder 34B有4~5个月是编码领域的SOTA模型,c...查看全文

知名服装品牌被申请破产审查!北京、上海只剩3家店,最多可打三折,消费者:价格实惠、质量不错

每日经济新闻04-23 18:20

拥有百年历史的荷兰快时尚品牌C&A,在中国的生意一直处于不温不火的状态。在出售其中国业务后,也未能迎来转机。
近日,C&A关联公司西雅衣家商贸集团有限公司新增一则破产审查信息,申请人为上海金衡法律咨询有限公司,经办法院为上海市第三中级人民法院。
西雅衣家商贸集团有限公司成立...查看全文

【Compute Express Link (CXL) 技术及其在数据中心的应用】

芝能智芯04-07 18:14

CXL技术是一种高速互连技术,旨在解决数据中心内存和处理器之间的性能瓶颈,通过统一内存访问和资源共享优化计算架构。CXL允许不同设备间进行高速、低延迟数据交换,通过CXL.io、CXL.cache和CXL.memory三种协议实现内存共享和扩展,提升数据中心性能和效率。市场预测显示CXL市场将由2022年的1.7百...查看全文

纪要调研前哨04-06 10:06

#大模型Groq#
Q:Groq的LPU和传统的GPU有哪些关键差异?在推理芯片市场上,Groq的LPU性能提升和成本情况如何?
A:Groq的LPU实际上是一个针对AI算法设计的DSA(领域特定加速器),与典型的如谷歌TPU相似,其架构与英伟达的GPU有显著不同。它的设计并未脱离传统CMOS工艺,并采用了与传统内...查看全文

周小小kan03-26 09:43

啥年代了。,flash attention mem cache这些机制早就让复杂度不是n^2 了、 mamba 工业界就没太多人关注, 这里是生态的问题 除非他好的太多太多 不然大家不会打破原先已经有东西查看全文

深入浅出谈谈,AI集群、NVLink、光模块

闷得而蜜03-22 09:57

深入浅出谈AI光模块需求
性能提升的秘密武器:缓存
CPU访问一次DDR内存空间,需要几百个时钟周期,如果没有其他办法,将会导致99%的时间CPU时间在等待数据而空转。所以科学家就想出了一种办法: Cache。
计算机的程序和数据访问范围虽然很大,但是具有明显的局部性特征:在某一时刻,程...查看全文

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Cache的新闻

尚未发布的AMD Genoa-X处理器现身闲鱼 L3缓存超1GB

AMD尚未发布的EPYC Genoa-X处理器的顶级型号EPYC 9684X的工程样品已经现身闲鱼。 此前,AMD已经发布了新一代Genoa系列服务器处理器,单处理器最高96核192线程的庞大规模让其一举成为了当下最强悍的服务器处理器。而AM... 网页链接

AMD RX 7900显卡暗藏大招!3D堆叠缓存拼RTX 4090?

3D V-Cache堆叠缓存是AMD锐龙、霄龙处理器的一把利器,锐龙玩游戏、霄龙特定负载加速都有奇效,锐龙7 5800X3D也因此成了绝对的爆品。 现在看起来,AMD显卡也有望引入3D V-Cache缓存。 权威半导体工程师Tom Wassick通... 网页链接

Cache Cache关店 外资快时尚走麦城

转自:北京商报 法国女装品牌Cache Cache关店撤市,外资快时尚渐渐失色。12月29日,北京商报记者走访发现,北京多家Cache Cache清仓甩卖,准备关店撤市。销售人员透露理由为“品牌发展不佳,公司倒闭”。对于上述情况,官... 网页链接

AMD将在CES 2023上推出Zen 4锐龙7000系列3D V-Cache处理器

新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦! 本文来自cnBeta WCCFTech 援引内部路线图爆料称, AMD 已计划... 网页链接

AMD Ryzen 7 5800X3D可超频至5.5GHz

新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦! AMD 的首款 3D V-Cache CPU--Ryzen 7 5800X3D 已经上市一段时... 网页链接

AMD推出锐龙7 5800X3D处理器 首次采用AMD 3D V-Cache技术

【TechWeb】3月17日消息,AMD公布了锐龙7 5800X3D 处理器的定价和上市日期。处于创新和游戏性能的前沿,AMD锐龙7 5800X3D 处理器是第一款采用 AMD 3D V-Cache技术的锐龙处理器。凭借这项行业领先的技术,5800X3D 的游戏性能可提升15%,使... 网页链接

AMD:锐龙 7 5800X3D 不支持超频,但不代表后续 CPU 都不支持

品玩3月17日讯,在接受 HotHardware 的采访时,AMD 技术营销总监表示,AMD 第一款采用 3D V-Cache 的 Ryzen CPU 将不支持传统的超频技术。 AMD:锐龙 7 5800X3D 不支持超频,但不代表后续 CPU 都不支持 这意味着用户将无法调整 CPU 频率或电压,不过可以调整 I... 网页链接

1 2 3 4

Cache的公告

内部交易: $CACH(CACH)$ 2013-05-31,10% Owner,MFP PARTNERS LP ,买入,43800普通股, $5.19

内部交易: $CACH(CACH)$ 2013-05-27,10% Owner,MFP PARTNERS LP ,买入,10000普通股, $5.31

内部交易: $CACH(CACH)$ 2013-05-26,10% Owner,MFP PARTNERS LP ,买入,2000普通股, $5.35

内部交易: $CACH(CACH)$ 2013-05-25,10% Owner,MFP PARTNERS LP ,买入,100普通股, $5.35

内部交易: $CACH(CACH)$ 2013-05-24,10% Owner,MFP PARTNERS LP ,买入,45普通股, $5.30

内部交易: $CACH(CACH)$ 2013-04-15,10% Owner,MFP PARTNERS LP ,买入,16601普通股, $4.58

内部交易: $CACH(CACH)$ 2013-04-11,10% Owner,MFP PARTNERS LP ,买入,5000普通股, $4.38

内部交易: $CACH(CACH)$ 2013-04-08,10% Owner,MFP PARTNERS LP ,买入,200普通股, $4.40

内部交易: $CACH(CACH)$ 2013-04-06,10% Owner,MFP PARTNERS LP ,买入,18500普通股, $4.46

内部交易: $CACH(CACH)$ 2013-04-04,10% Owner,MFP PARTNERS LP ,买入,18000普通股, $4.43

1 2 3 4 5 6 7 8 9 10 11