除了DeepSeek那篇官号文章,几乎没太多声音,尤其我看几个专业的AI号甚至都没报道,这属于严重低估了...(或者人家故意不宣传)。总之一句话, DeepSeek v2非常值得重视....
为什么被Semianalysis大哥在最新文章中高亮点名,因为真的有点离谱了...查看全文
闷得而蜜03-19 20:15
昨天Nvidia GTC发布会,老黄重磅推出GB200新产品,号称72个GPU直接通过铜缆互联,组成一个集群Giant GPU,提升了30倍的性能。A股早上开盘吓尿了,中际旭创、新易盛、天孚通信这三家直接低开。那么,GB200是否真的会降低光模块的需求吗?
AI算力集群
将大量GPU芯片联在一起,组成一张大规模...查看全文
打完怪兽好睡觉05-14 15:23
回复@仓又加错-刘成岗: 推理是需要多卡互联的,单卡现存当KV cache可能都不够,这样实现不了长文本窗口。
推理常见的几种并行加速方法,张量并行、数据并行、流水线并行等等,基本上都是把推理请求压成batch,分配到多张卡上,这样可以计算&存储资源利用最大化。否则存储资源远落后于计算...查看全文
闷得而蜜03-22 09:57
深入浅出谈AI光模块需求
性能提升的秘密武器:缓存
CPU访问一次DDR内存空间,需要几百个时钟周期,如果没有其他办法,将会导致99%的时间CPU时间在等待数据而空转。所以科学家就想出了一种办法: Cache。
计算机的程序和数据访问范围虽然很大,但是具有明显的局部性特征:在某一时刻,程...查看全文
盘在树上睡觉的蛇05-09 13:59
自从GPT 3.5出来以后,大家都知道“Talk is cheap, Show me your AI”,所以deepseek v2是直接出了界面以及开放了api,而且上来就免费送5M token的方式,间接证明了他们论文中推理成本大降的事实。
去年一直关注开源大语言模型的人都知道,deepseek coder 34B有4~5个月是编码领域的SOTA模型,c...查看全文
GPLP犀牛05-16 16:12
历史上有很多黑马股,起初都是曝光度不高、媒体流量不大的股票,如果精挑细选,很可能会藏着很大的惊喜。
@百融云-W(6608.HK)就是一个比较低调的AI公司,不太搞宣传和流量,但有一个数据很容易勾起投资人的兴趣:主营业务MaaS 已经有99%的核心客户留存率,但是业绩却还在增长。这种业绩特征...查看全文
桌子子05-10 07:56
回复@宽一投资: 你说的cache coherece问题arm那边已经有解决方案,你可以看看arm的axi ace和chi标准,以及cmn等一致性互联的ip//@宽一投资:回复@燕山野人:arm cpu如果是办公电脑上随便用用,弄个windows虚拟机也能勉强用用,但是用作服务器cpu却是性能极差,因为arm cpu从网口收发数据报文的速度只...查看全文
闷得而蜜03-20 11:53
昨天硅谷的算法专家特别提到了 NVLink集群规模对软件编译器的影响。 做算法的人都知道,要将巨大的矩阵运算进行拆解,放到不同的GPU并行计算。 因为NVLink 集群和 IB集群比,他直接在硬件层面访问内存,效率要高很多。但是呢,要发挥NVLink优势的前提是,必须把局部密集的运算,通过编译器自动发现...查看全文
每日经济新闻04-23 18:20
拥有百年历史的荷兰快时尚品牌C&A,在中国的生意一直处于不温不火的状态。在出售其中国业务后,也未能迎来转机。
近日,C&A关联公司西雅衣家商贸集团有限公司新增一则破产审查信息,申请人为上海金衡法律咨询有限公司,经办法院为上海市第三中级人民法院。
西雅衣家商贸集团有限公司成立...查看全文
周小小kan03-26 09:43
啥年代了。,flash attention mem cache这些机制早就让复杂度不是n^2 了、 mamba 工业界就没太多人关注, 这里是生态的问题 除非他好的太多太多 不然大家不会打破原先已经有东西查看全文
GPLP犀牛05-16 16:12
历史上有很多黑马股,起初都是曝光度不高、媒体流量不大的股票,如果精挑细选,很可能会藏着很大的惊喜。
@百融云-W(6608.HK)就是一个比较低调的AI公司,不太搞宣传和流量,但有一个数据很容易勾起投资人的兴趣:主营业务MaaS 已经有99%的核心客户留存率,但是业绩却还在增长。这种业绩特征...查看全文
打完怪兽好睡觉05-14 15:23
回复@仓又加错-刘成岗: 推理是需要多卡互联的,单卡现存当KV cache可能都不够,这样实现不了长文本窗口。
推理常见的几种并行加速方法,张量并行、数据并行、流水线并行等等,基本上都是把推理请求压成batch,分配到多张卡上,这样可以计算&存储资源利用最大化。否则存储资源远落后于计算...查看全文
桌子子05-10 07:56
回复@宽一投资: 你说的cache coherece问题arm那边已经有解决方案,你可以看看arm的axi ace和chi标准,以及cmn等一致性互联的ip//@宽一投资:回复@燕山野人:arm cpu如果是办公电脑上随便用用,弄个windows虚拟机也能勉强用用,但是用作服务器cpu却是性能极差,因为arm cpu从网口收发数据报文的速度只...查看全文
信息平权05-09 18:00
(声明:本文不是幻方软文,纯个人感想)
除了DeepSeek那篇官号文章,几乎没太多声音,尤其我看几个专业的AI号甚至都没报道,这属于严重低估了...(或者人家故意不宣传)。总之一句话, DeepSeek v2非常值得重视....
为什么被Semianalysis大哥在最新文章中高亮点名,因为真的有点离谱了...查看全文
盘在树上睡觉的蛇05-09 13:59
自从GPT 3.5出来以后,大家都知道“Talk is cheap, Show me your AI”,所以deepseek v2是直接出了界面以及开放了api,而且上来就免费送5M token的方式,间接证明了他们论文中推理成本大降的事实。
去年一直关注开源大语言模型的人都知道,deepseek coder 34B有4~5个月是编码领域的SOTA模型,c...查看全文
每日经济新闻04-23 18:20
拥有百年历史的荷兰快时尚品牌C&A,在中国的生意一直处于不温不火的状态。在出售其中国业务后,也未能迎来转机。
近日,C&A关联公司西雅衣家商贸集团有限公司新增一则破产审查信息,申请人为上海金衡法律咨询有限公司,经办法院为上海市第三中级人民法院。
西雅衣家商贸集团有限公司成立...查看全文
芝能智芯04-07 18:14
CXL技术是一种高速互连技术,旨在解决数据中心内存和处理器之间的性能瓶颈,通过统一内存访问和资源共享优化计算架构。CXL允许不同设备间进行高速、低延迟数据交换,通过CXL.io、CXL.cache和CXL.memory三种协议实现内存共享和扩展,提升数据中心性能和效率。市场预测显示CXL市场将由2022年的1.7百...查看全文
纪要调研前哨04-06 10:06
#大模型Groq#
Q:Groq的LPU和传统的GPU有哪些关键差异?在推理芯片市场上,Groq的LPU性能提升和成本情况如何?
A:Groq的LPU实际上是一个针对AI算法设计的DSA(领域特定加速器),与典型的如谷歌TPU相似,其架构与英伟达的GPU有显著不同。它的设计并未脱离传统CMOS工艺,并采用了与传统内...查看全文
原标题:Google正在内部测试Chrome的"已关闭标签缓存"功能 来源:cnBeta.COM 在Google Chrome中快速恢复最近关闭的标签的工作早在一年前就开始了。期待已久的"已关闭标签缓存"功能现在可以在Chrome浏览器的Canary版本中进... 网页链接
原标题:AMD 3D V-Cache技术开发多年 在Ryzen 9 5950X样品中首次出现 来源:cnBeta.COM 几个月前,AMD发布了关于他们的Ryzen CPU新技术的信息。AMD的3D V-Cache技术带来多达64MB的额外L3缓存,并将其堆叠在Ryzen CPU的顶... 网页链接
原标题:研究人员详解AMD 3D V-Cache缓存设计 来源:cnBeta.COM 高级技术研究员 Yuzo Fukuzaki,刚刚为我们详细解释了 AMD 在台北电脑展(Computex 2021)主题演讲期间介绍的一项难以捉摸的新 CPU 技术。在该公司后续的讲... 网页链接
原标题:AMD RDNA 3 架构的架构图曝光, 包括 Navi 31、Navi 32 和 Navi33 三款 GPU 来源:Expreview超能网 近期有关 AMD 下一代 RDNA 3 架构以及 Navi 3x 核心的消息不少,此前消息指 Radeon RX 7900 XT 很可能会搭载 Na... 网页链接
7月30日上午消息,AMD正式发布Radeon RX 6600 XT显卡,主要面向高帧率、高保真度和高响应的1080P分辨率游戏体验。 基本参数方面,RDNA2架构Navi 23XT GPU打造(237mm2,110.6亿颗晶体管),内建32组CU(2048颗流处理器),... 网页链接
原标题:Zen 4霄龙Genoa或引入HBM缓存 以迎战Sapphire Rapids志强 来源:cnBeta.COM Inpact-Hardware 援引消息人士的话称,AMD 正计划为基于 Zen 4 核心架构的霄龙 Genoa 服务器处理器、引入具有高带宽缓存(HBM)的衍生... 网页链接
据国外媒体的消息,AMD正在开发下一代EPYC霄龙服务器处理器,代号Genoa,采用Zen 4架构。这款处理器将首次搭载HBM内存芯片,以便与英特尔的下一代Xeon Sapphire Rapids服务器CPU竞争。 虽然之前有过这款处理器的消息,但首次曝光其有望搭... 网页链接
台北电脑展上,AMD CEO苏姿丰博士拿出了一款特殊的锐龙处理器,通过3D垂直堆栈的方式,集成了大容量片外三级缓存,可以显著提升性能。 本次展示用的是一颗锐龙9 5900X 12核心处理器,原本内部集成两个CCD计算芯片、一个IO输入输出芯片。 ... 网页链接
原标题:GXG母公司抢了宝尊电商的生意 图片来源:GXG 据天眼查信息,近期GXG母公司慕尚集团旗下子公司莱柯(上海)电子商务有限公司与法国服饰品牌Cache Cache母公司博马努瓦(Beaumanoir)达成合作,成立了合资公司“宁波... 网页链接
GXG母公司慕尚集团如今已经正式入局“第二战场”——电商代运营。近日,慕尚集团旗下子公司莱柯(上海)电子商务有限公司与法国时尚品牌Cache Cache签约合作,共同出资建立一家电商公司——宁波市悦惜电子商务有限公司。 慕尚集团控股该合资公司,并... 网页链接
$CACH(CACH)$ SC 13G/A [Amend] - Statement of acquisition of beneficial ownership by individuals Filed: 2016-02-01 AccNo: 0001144204-16-078117 Size: 31 KB 网页链接
$CACH(CACH)$ SC 13G/A [Amend] - Statement of acquisition of beneficial ownership by individuals Filed: 2015-02-13 AccNo: 0001405086-15-000055 Size: 34 KB 网页链接
$CACH(CACH)$ SC 13G/A [Amend] - Statement of acquisition of beneficial ownership by individuals Filed: 2015-01-30 AccNo: 0001341004-15-000062 Size: 176 KB 网页链接
$CACH(CACH)$ SC 13G/A [Amend] - Statement of acquisition of beneficial ownership by individuals Filed: 2015-02-05 AccNo: 0001258897-15-000714 Size: 52 KB 网页链接
$CACH(CACH)$ SC 13G/A [Amend] - Statement of acquisition of beneficial ownership by individuals Filed: 2015-02-05 AccNo: 0001144204-15-006268 Size: 41 KB 网页链接
$CACH(CACH)$ SC 13G/A [Amend] - Statement of acquisition of beneficial ownership by individuals Filed: 2015-02-02 AccNo: 0000906304-15-000216 Size: 7 KB 网页链接
$CACH(CACH)$ SC 13G - Statement of acquisition of beneficial ownership by individuals Filed: 2015-02-17 AccNo: 0001144204-15-010214 Size: 38 KB 网页链接
$CACH(CACH)$ SC 13G - Statement of acquisition of beneficial ownership by individuals Filed: 2015-01-06 AccNo: 0000909012-15-000002 Size: 9 KB 网页链接
$CACH(CACH)$ 8-K - Current report Filed: 2015-01-29 AccNo: 0001104659-15-005424 Size: 18 KBItem 3.01: Notice of Delisting or Failure to Satisfy a Continued Listing Rule or Standard; Transfer of ListingItem 5.02: Departure of Directors or Certain Officers; Election of Director...
$CACH(CACH)$ 8-K - Current report Filed: 2015-01-08 AccNo: 0001104659-15-001244 Size: 16 KBItem 3.01: Notice of Delisting or Failure to Satisfy a Continued Listing Rule or Standard; Transfer of Listing 网页链接