AI创投周报|谷歌发布首款自研Arm CPU,边缘计算平台SiMa.ai获7000万美元融资

发布于: 雪球转发:0回复:0喜欢:0

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

本图由“千象”(网址:网页链接)生成

本周,我们观察到以下AI领域的新动向和新趋势:

1.Google发布首款自研Arm CPU,同场发布会上Gemini 1.5 Pro宣布公测,还官宣对标Sora的AI视频工具Imagen 2.0。

2.Cohere的开源模型Command R+在大模型竞技场首胜GPT-4,Command R+的主要特点包括对检索增强生成技术的深度优化,减少幻觉产生,以及适配企业级工作负载。

3.SiMa.ai获Maverick Capital领投的7000万美元C轮融资,SiMa.ai的主要产品是专为边缘机器学习(ML)应用设计的系统集成芯片,还有配套的软件系统。

如果您对人工智能的新浪潮有兴趣,有见解,有创业意愿,欢迎扫码添加“阿尔法小助理”,备注您的“姓名+职位”,与我们深度连接。

人工智能产品和技术的新突破

1.谷歌发布首款自研Arm CPU,Gemini 1.5 Pro公测,Imagen 2.0对垒Sora

Google Cloud Next 2024大会上,谷歌发布了一系列引人注目的产品和模型更新,重要亮点包括首款自研Arm架构的CPU处理器Axion,Axion处理器在性能和能效上都有显著提升。

谷歌开放了Gemini 1.5 Pro模型的公测,它为开发者提供前所未有的数据处理能力,特别是在音频处理和多模态文件分析方面。此外,谷歌升级了其AI视频工具Imagen 2.0,现在支持生成实时动态视频,以及强化了图像编辑功能。

谷歌的新代码模型CodeGemma也展示了在多种编程任务中的优秀性能,尤其是在代码补全和多种编程语言的代码生成能力方面。它的训练数据量高达5000亿个Token。

在硬件方面,谷歌宣布了TPU v5p的上线,这是一款专为AI模型训练设计的处理器,以及与英伟达的合作,推出基于英伟达H100芯片的新型虚拟机。这些升级提升了谷歌云平台在AI开发和训练领域的竞争力。

2.Meta推出全新训推一体加速器MTIA v2,性能提升3倍,完全集成PyTorch 2

Meta推出全新的训推一体加速器(MTIA v2),这是一个针对AI工作负载优化的芯片,与其前一版本相比,性能提高了三倍。它完全兼容PyTorch 2和其他前沿的机器学习库,这意在减少对外部供应商,尤其是英伟达的依赖。

MTIA v2主要用于提升Meta旗下产品的内容排名和推荐算法效率。据悉,MTIA v2已在Meta的16个数据中心投入使用,采用了台积电5nm制程工艺,具有更高的处理性能和能效比。这款芯片不仅支持现有的AI模型,Meta还计划将其应用于训练大型语言模型。

在技术细节上,MTIA v2的设计优化了计算效率和内存管理。它包括一个256MB的片上内存和1.3GHz的频率,相较于第一代的128MB和800GHz有明显提升。此外,MTIA v2的设计还包括8x8的处理单元阵列,这些处理单元能够提供更强的计算力和更佳的数据处理能力。

此外,Meta开发了一种新的机架式系统,可以容纳更多加速器,以支持更大规模的AI模型训练和推理任务。

3.英特尔发最新AI加速卡,训练比H100快70%

英特尔在Vision 2024大会上展示了其子公司Habana Labs的最新AI加速器—Gaudi 3,预计将于2024年第三季度推出。

Gaudi 3的亮点在于其1835 TFLOPS的FP8计算吞吐量,据英特尔内部基准测试显示,其性能部分超过了英伟达的H100,尤其在某些大型语言模型训练中,如GPT-3和Llama2,Gaudi 3的训练时间比H100快40%至70%,在推理方面也显示出竞争力。

Gaudi 3采用先进的5nm工艺并增加了计算硬件,它还采用了双芯配置,并通过高带宽链路连接,形成统一的内存地址空间,类似于英伟达最近发布的Blackwell。但不同的是,Gaudi 3选择了HBM2e内存控制器,提供了128GB的总内存和3.7TB/s的总内存带宽。

此外,Gaudi 3在I/O方面也进行了重大技术升级,将每块芯片的外部以太网I/O总带宽提升至8.4TB/s,并通过以太网进行节点间连接,以支持大规模AI模型的训练和推理。英特尔还开发了高达512个节点的网络拓扑,使用以太网连接多达32个集群,每个集群包含16个节点,旨在提升Gaudi 3的可扩展性。

在性能对比中,英特尔表示Gaudi 3在训练Llama2-13B时的性能比英伟达H100快70%,尽管在某些推理工作负载中Gaudi 3仍然可能输给H100,但在推理性能和功耗比方面,Gaudi 3显示出了显著的优势。

4.GPT-4 Turbo重磅升级,新增视觉功能,ChatGPT 40条消息限制或取消

OpenAI最近宣布了GPT-4 Turbo的一项重大升级,该版本新增了视觉功能,可以处理长达128k的上下文,新版GPT-4 Turbo能够通过API调用,并支持Vision请求的JSON模式和函数调用。这标志着GPT-4在理解和生成图像内容方面迈出了重要一步。此外,ChatGPT对于GPT-4的每3小时40条消息的限制似乎已经取消。

开发者现已开始利用这一新功能执行各种任务,包括使用GPT-4 Turbo with Vision来识别食物图片并提供营养信息,或者基于简单的手绘图形自动生成带有实际代码支持的网站。这些应用展示了新模型如何帮助简化和加速开发过程,创造出更高效的应用程序。

然而,一些研究指出,GPT-4 Turbo with Vision在代码生成方面的能力相对较弱,其代码编辑能力得分低于其他所有GPT-4模型,显示了一定程度的性能退步。尽管有批评指出新模型在编码任务中表现出的“懒惰”特征,也有开发者报告称新模型在输出代码量和推理能力上有所增强。

5.Mistral AI发布8x22B MoE开源模型,已在抱抱脸平台上线

Mistral AI发布了一条磁力链,里面包含了最新的8x22B MoE模型。这个模型具有56层、48个注意力头、8名专家和2名活跃专家,上下文长度可达65k。

去年12月,Mistral AI通过首个磁力链发布的8x7B MoE模型就已经获得了业界的广泛认可,该模型在基准测试中的性能超过了多达700亿参数的Llama 2,能够处理长达32k的上下文,支持多语言,并在代码生成方面展现出强大的性能。今年2月,Mistral Large模型发布,其性能与GPT-4相当,但未开源。Mistral Large显示了卓越的逻辑推理能力,在处理文本理解、转换以及复杂多语言任务的代码生成方面表现优异。

最新发布的8x22B MoE模型现已在抱抱脸平台上线,允许社区成员基于此模型构建各种应用。

6.苹果多模态大模型发布,在多个基本UI任务上超越GPT-4V

苹果近日推出名为Ferret-UI的多模态大语言模型,Ferret-UI专为理解和交互移动UI屏幕设计,能够在多个基本UI任务上超越GPT-4V的性能。这款模型不仅能够理解屏幕上的信息,还能执行引用、基础和推理任务,如小部件分类、图标识别和OCR等,显著增强了Siri等服务的功能性和智能性。

Ferret-UI的突出之处在于它对于任何分辨率(anyres)的支持,能够通过放大细节来提高对UI元素的识别精度。这使得Ferret-UI能够在移动用户界面上执行更精确的任务,例如查找小部件、图标和文本等。Ferret-UI采用了灵活的输入格式(点、框、涂鸦)和一系列基础任务来提供丰富的视觉和空间知识,使得模型能够区分不同的UI类型,如各种图标或文本元素,并在交互对话中提出目标导向的动作。

此外,Ferret-UI在构建过程中采用了Ferret的架构,并通过扩展获得了额外的细粒度图像功能,使得模型能够生成整个屏幕的图像特征和子图像的附加图像特征。通过编译用于高级任务的数据集,研究人员增强了模型的推理能力,使之能够执行更复杂的任务,如详细描述、感知/交互对话和功能推理。

7.Cohere旗下的开源模型Command R+在大模型竞技场首胜GPT-4

Cohere公司的开源模型Command R+在大模型竞技场排名第六,与OpenAI的GPT-4-0314打成平手,超过了GPT-4-0613,这标志着首次有开源模型在此榜单上战胜GPT-4。

Command R+由AI独角兽Cohere推出,该公司由Transformer模型的最年轻作者Aidan Gomez共同创立。Command R+的主要特点包括对检索增强生成技术的深度优化,减少幻觉产生,以及适配企业级工作负载。该模型覆盖超过10种语言,并能通过使用工具完成复杂业务流程的自动化。

测试结果显示,Command R+在多语种、RAG和工具使用这三个维度上均达到了GPT-4 turbo的水平,而其输入和输出成本均低于GPT-4 turbo。

这一成就吸引了大量关注,包括知名人工智能研究员Karpathy,他将大模型竞技场视为最为可信的测试基准之一。值得一提的是,Command R+的开源仅限于学术研究,并不能免费商用。

8.菲尔兹奖得主领衔:AI正在颠覆数学家的工作方式

《美国数学学会通报》的特刊深入探讨了AI对数学研究方式的深远影响,特刊汇集了包括菲尔兹奖得主Akshay Venkatesh、华裔数学家郑乐隽在内的多位顶尖学者的贡献,共同探讨了AI如何在各个层面上颠覆传统数学研究的方式和思维。

特刊中,学者们共识认为,AI在数学领域的应用不仅仅局限于提高计算效率,更重要的是其在推理、证明定理、以及探索新的数学领域方面展现出的巨大潜力。虽然神经网络和大型语言模型在数学证明方面尚有局限,但它们在搜索定理、猜测新定理和寻找反例方面已经显示出前所未有的能力。此外,自动定理证明系统(ATP)和交互式定理证明系统(ITP)在验证定理正确性、帮助修正错误方面的作用越发凸显。

特刊亦指出,虽然AI在数学领域的应用前景广阔,但也引发了对数学定义、证明和概念本质的深刻反思。纯粹的数学研究享有极大的自主性和智力自由,但机器的盲目使用可能对这一传统构成威胁。因此,学者们呼吁数学界对AI的应用进行深思熟虑,以确保技术的合理使用能够丰富而非削弱数学这一学科。

人工智能初创公司的新融资

1.边缘计算AI处理器提供商Hailo获Alfred Akirov, Automotive Equipment (AEV), 等联合投资的1.2亿美元C轮融资

官方网站:hailo.ai/

Hailo是高性能边缘计算AI 处理器制造商,近日它获得Alfred Akirov, Automotive Equipment (AEV), Comasco, DCLBA, Delek Motors, Gil Agmon, OurCrowd, Poalim Equity, Talcar Corp., Vasuki, Zohar Zisapel等机构联合投资的C轮融资1.2亿美元,累计融资3.43亿美元,投后估值达10亿美元。

Hailo旨在帮助客户在边缘端运行高级机器学习应用程序,Hailo的产品组合包括与边缘平台集成的AI加速器组合,可在边缘执行实时深度学习推理任务,以及一系列AI视觉处理器,这些处理器将 Hailo 领先的AI推理功能与先进的计算机视觉引擎相结合,为智能相机等终端提供先进AI功能。

此外,Hailo还开发了专门用于其研发芯片的软件Hailo AI Software Suite,旨在帮助客户开发针对不同场景的机器学习程序,目前已被数百个客户使用。

Hailo Technologies 的首席执行官Orr Danon获得希伯来大学和特拉维夫大学的物理学学士学位和EE硕士学位,他在以色列国防军服役了十年,期间担任过多个技术和领导职位。

Hailo Technologies 的首席技术官Avi Baum在Texas Instruments工作了将近13年,在此期间,他担任了无线连接部门的首席技术官,建立了面向物联网和工业4.0市场的连接型微控制器产品线。

2.边缘计算平台提供商SiMa.ai获Maverick Capital领投的7000万美元C轮融资

官方网站:sima.ai/

近日,AI边缘计算平台提供商SiMa.ai获Maverick Capital领投,Amplify Partners, Dell Technologies Capital, Fidelity, Jericho Capital, Lip-Bu Tan,Point72参投的7000万美元C轮融资,SiMa.ai从2020年起相继完成7轮融资,共计融资3.3亿美元。

SiMa.ai推出的核心产品叫做Machine Learning System-on-Chip(MLSoC),这是一个专为边缘机器学习(ML)应用设计的系统集成芯片。MLSoC 平台旨在简化将机器学习集成到产品中的过程,提供一键式性能,以便在嵌入式边缘设备上轻松部署和扩展机器学习。

SiMa.ai 还提供了名为Palette的软件编程环境,使开发者能够通过简单的一键式编译、构建和部署软件镜像,快速迭代和更新ML模型、管道和应用程序。

SiMa.ai的创始人兼首席执行官Krishna Rangasayee在密西西比州立大学取得了电子工程的硕士学位,并在斯坦福大学商学院完成了高级管理课程。Krishna曾在Xilinx (赛灵思)工作了超过18年,期间担任过多个高管职位,包括全球销售的执行副总裁、高级副总裁和总经理等。在离开 Xilinx 后,Krishna 加入了Groq,担任首席运营官。

Ashok Sudarsanam目前担任 SiMa.ai 的高级技术总监,负责机器学习应用(MLA Software)。他拥有卡耐基梅隆大学的学士学位和普林斯顿大学的博士学位。Ashok 曾在 Tintri (存储芯片公司)工作了超过9年,期间担任了多个高级职位,包括工程高级总监、工程总监和高级工程经理等。

3.人工智能视频监控方案提供商Lumana获Norwest Venture Partners等投资的2400万美元种子轮融资

官方网站:网页链接

人工智能视频监控方案提供商Lumana获Norwest Venture Partners, S Capital投资的2400万美元种子轮融资,Lumana通过其开放的混合云架构,为用户提供了易于设置、安全远程访问和最新的人工智能驱动的视频监控和安全技术。

Lumana的核心优势技术是其可以利用视觉AI主动分析周围环境,并为紧急事件提供实时警报。这有助于减少监控疲劳,并通过视觉AI检测威胁并立即响应。用户可以在几秒钟内找到相关画面,通过Smart Search功能,基于人物、车辆和物体参数搜索数百万小时的视频。

Lumana的首席执行官Sagi Ben Moshe在以色列理工学院的计算机科学硕士学位和学士学位,并在斯坦福大学商学院接受过研究生教育。在加入Lumana之前,Sagi在Intel担任多个重要职位,包括Intel的首席孵化官、企业副总裁以及新兴增长孵化部门的总经理。Sagi还在Mobileye担任高级副总裁,负责传感技术研发。

Lumana的首席技术官Ofir Mulla在Intel有着长达近15年的工作经验,包括平台架构师、RealSense团队的经理和首席架构师。在Intel,他负责定义3D成像设备的端到端架构解决方案,并在多个技术领域拥有丰富的经验。

4.由五位华人创立的类人语音AI Agent公司Retell AI获得由Y Combinator与Alt Capital等五位投资者投资的412.5万美元种子轮融资

官方网站:网页链接

类人语音AI Agent公司Retell AI获得412.5万美元的种子轮融资,本轮投资参与者包含Y Combinator,Alt Capital以及其他三位个人投资者。此前,Retell AI在去年11月曾获得过Y Combinator的12.5万美元投资。

语音人工智能此前的主要痛点是AI对话流程常常由不自然的停顿和中断,人类的请求经常被误解,生成的声音听起来机械化等。Retell AI生成的类人语音AI代理提供了更优质的体验。例如,其已经实现了平均800毫秒的响应时间,达到了人类交互的水平,并且模拟的声音也十分真实,对人类请求对理解迅速且准确。

Retell AI的目标人群是开发人员。通过相应的API,开发人员可以轻松地将语音Agent集成到他们的产品或服务中,集成步骤简单并且应用场景广泛,例如插入自定义语言模型、创建针对不同场景定制的语音代理以及使用 WebSocket通过网络或电话集成语音体验。

Retell AI由五位华人Todd Li、Evie Wang、Bing Wu、Weijia Yu和Zexia Zhang共同创立,团队目前位于美国旧金山。其中,Bing Wu担任CEO,Zexia Zhang担任CTO,Weijia Yu担任COO,Evie Wang担任CMO,团队成员有在MetaGoogle、Tiktok、字节跳动等知名企业工作的经历。

5.为基础设施工程提供AI现场工作执行平台的FYLD.ai获得Ontario Teachers' Pension Plan投资的1190万美元A轮融资

官方网站:网页链接

近日,为基础设施工程提供AI现场工作执行平台的FYLD.ai获得由Ontario Teachers' Pension Plan(安大略省教师退休金计划)投资的1190万美元A轮融资。

FYLD.ai专注于基础设施领域,尤其是公用事业和重土木工程领域,具体包括能源、高速公路、水利等基础设施建设和重土木工程项目。这些基础设施工作场景,工作的安全性和生产效率是决定工程能否成功的关键要素。FYLD.ai利用人工智能技术开发出一套现场工作执行平台,可以有效地改善安全和提升效率。

FYLD.ai的现场工作执行平台运用了包括自然语言处理、计算机视觉等在内的人工智能技术,开发出一套企业级平台,这套平台可以实时分析现场情况,操作指挥中心能够识别高风险地点,并在远程管理者与现场工人之间提供直接的沟通链接。

现场工人可以通过描述活动、危险和控制措施来积极评估和记录工作现场。FYLD.ai可以将捕获的视频和音频转换为视频风险评估(VRA),并通过人工智能技术分析记录,识别现场存在的危险和条件,可能还会标记工人可能遗漏的内容。VRA经工人审核后,可以与管理者共享,管理者可以在不亲临现场的情况下,通过添加进一步的危险和控制措施来干预工作。

平台现已在Android和iOS设备上提供,现场工人和管理者都可以在他们的包括手机和平板电脑上使用该平台。

FYLD.ai的联合创始人和CEO Shelley Copsey毕业于阿德莱德大学,曾在MIT和斯坦福大学进修过人工智能与企业管理,并在毕马威和普华永道任职多年,也曾在GeoSLAM、Coviu Global担任过创始高管。

FYLD.ai联合创始人和COO Anish Patel,曾在谷歌、Ticketmaster、Blinkbox Books等公司担任过高级产品经理。

本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。

更多精彩内容

关于阿尔法公社