AI创投周报｜AI药物开发平台Xaira获10亿美元首轮融资，微软端侧模型能力超过GPT-3.5 AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者（A...

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者（Alpha Founders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。

本图由“千象”（网址：网页链接）生成

本周，我们观察到以下AI领域的新动向和新趋势：

1.微软发布Phi-3系列开源AI模型，其部分测试性能超越GPT-3.5，能够在iPhone上运行。

2.AI药物发现平台Xaira获得10亿美元首轮融资，打造通用AI生物医药平台，缩短药物发现时间，提高药物开发成功率。

3.AI编程初创公司Augment获得2.52亿美元投资，大幅提升编程推理速度，AI应用自动开发质量升级。

如果您对人工智能的新浪潮有兴趣，有见解，有创业意愿，欢迎扫码添加“阿尔法小助理”，备注您的“姓名+职位”，与我们深度连接。

人工智能产品和技术的新突破

1.微软发布Phi-3系列开源模型，部分性能指标超越GPT-3.5，iPhone就能跑

微软近日发布了Phi-3系列AI开源模型，它的特点是尺寸小，性能强。参数仅3.8B的Phi-3-mini在多项性能测试中超过了Llama 3 8B，而且能直接在iPhone上运行，运行速度在iPhone上可达12token/秒。

除Phi-3-mini外，微软还发布了参数量更大的Phi-3-small和Phi-3-medium，参数分别为7B和14B。这些模型不仅在多项基准测试中表现优异，超越了GPT-3.5，而且还展示了优化数据训练方法带来的显著性能提升。微软团队特别强调了通过精心设计训练数据和优化模型训练策略，如使用高质量教科书级数据和去除不增强模型逻辑推理能力的数据，显著提高了模型的推理和对话能力。

2.苹果开源“OpenELM”系列端侧模型，还有可能与OpenAI等合作升级AI能力

苹果公司最近在Hugging Face平台发布了四款开源“小模型”，命名为OpenELM（Open-source Efficient Language Models）。这些模型的参数量分别为270M、450M、1.1B和3B，主要设计用于提高文本相关任务如电子邮件编写的执行效率。

OpenELM模型采用了按层分配参数的策略，显著提升了Transformer模型各层的配置效率，提高了模型的准确率。在大约十亿参数的预算下，OpenELM的准确率较其它模型提升了2.36%，且所需的Token数量减少了一半。尽管如此，OpenELM的性能在某些常见的测试集上并不高，与微软的Phi-3等主流SLM相比有明显差距。例如，在5-shot的MMLU上，Phi-3的得分约为70，而OpenELM只有不到30。

除了自研端侧模型外，苹果公司也正与OpenAI等领先的AI公司进行深入谈判，计划将生成式人工智能技术集成到即将发布的iPhone和其他Apple设备中。新的AI推出计划将在6月的苹果全球开发者大会（WWDC24）上公布。

3.全球最大开源模型，Snowflake发布4800亿参数MoE模型击败Llama 3

Snowflake推出的Arctic模型，采用了128位专家的MoE（Mixture of Experts）架构，总共具有4800亿参数，刷新了全球最大开源模型的记录。

Arctic模型基于全新的Dense-MoE架构设计，包括一个10B参数的稠密Transformer模型和多个3.66B参数的MoE MLP，共同在3.5万亿token上进行训练。

比起Llama 3 8B和Llama 2 70B，Arctic所用的训练计算资源不到它们的一半，评估指标却取得了相当的分数，尤其在执行复杂的企业任务时，如代码生成、SQL查询和逻辑推理，表现出色。此外，Arctic的高训练效率意味着较低的成本就能训练出高质量的定制模型，极大降低企业AI的建设成本。

Snowflake的Arctic不仅在技术上取得了突破，其开放性也是一大亮点。团队将训练数据的处理方法公开，真正做到了比“开源”更“开源”，允许广大研究者和开发者无限制地访问模型权重和代码。

4.科大讯飞发布支持长文本、长图文、长语音的大模型星火V3.5

科大讯飞发布星火V3.5大模型，这一全国产算力训练的模型专为处理长文本、长图文和长语音而设计，旨在提供更精确的行业应用回答和更专业的场景适应能力。该模型具备多种新功能，包括合同助手、智能评标助手，以及多情感超拟人合成和一句话声音复刻技术，使得人工智能体验更为生动和个性化。

星火V3.5的亮点在于其强大的文本处理能力，尤其在长文档的信息抽取、知识问答和文本生成方面，已达到或超越GPT-4 Turbo的水平。

科大讯飞重点推出了星火智能体平台，该平台能够为企业打造专属智能助理，极大地解放生产力和提高工作效率。

此外，科大讯飞还推出机器人超脑平台，该平台提供了从模型训练到资产生成、硬件接入的全栈工具链，大大降低了机器人开发的难度和成本。

此外，科大讯飞介绍了星火图文识别大模型，它能够快速准确地处理包括教育类书刊、学术论文、专利和报纸等多种复杂文档。

5.商汤科技推出日日新5.0大模型，全面挑战GPT-4 Turbo

商汤科技最近发布了日日新5.0大模型，性能直接对标GPT-4 Turbo，它在逻辑推理、自然语言处理和数学解题能力上表现出色。此外，商汤科技还推出了针对办公和编程场景的“小浣熊”系列模型。

在逻辑推理方面，日日新5.0通过其独特的处理机制，能够理解并正确回答复杂和幽默的问题，如百度贴吧上的非常规问题。数学能力测试中，日日新5.0同样表现出众。面对复杂的数学问题，它能够提供精确的解答，显示出其深度推理和问题解决能力，超出GPT-4的相关表现。

商汤科技还展示了日日新5.0在多模态应用中的能力，如图像生成和理解。该模型能够快速准确地处理和分析大量数据，提供详细的图像描述，甚至在复杂的图像中精确抓取和总结关键信息。

6.字节跳动推出视觉基础模型ViTamin，多项指标实现SOTA，入选CVPR2024

字节跳动发布名为ViTamin的新视觉基础模型，该模型在多个视觉任务上实现了SOTA，并成功入选了2024年计算机视觉顶级会议CVPR。ViTamin模型使用了独特的三阶段混合架构，包括轻量级MBConv Blocks和可扩展的Transformer Blocks，显著提升了处理视觉语言任务的能力。

在ImageNet零样本分类准确率上，ViTamin相较于传统的ViT模型提高了2.0%，达到了82.9%的准确率。这一表现超过了其他大型模型，如拥有4.4B参数的EVA-E模型。ViTamin的高性能部分归功于其对模型可扩展性和数据可扩展性的优化，以及对特征分辨率和混合架构的深入研究。

在实际应用中，ViTamin表现出强大的视觉编码能力，特别是在开放词汇检测和分割任务中，相较于ViT-L模型分别提高了3.1%和2.6%。

7.加州理工华人用AI颠覆数学证明，80%数学步骤全自动化

加州理工学院教授Anima Anandkumar带领包括华人研究员宋沛洋在内的研究团队成员优化了数学证明工具Lean Copilot，使其自动化程度达到了前所未有的80%，这一成就震惊了著名数学家陶哲轩。

Lean Copilot是一个形式化的数学工具，旨在自动化定理证明，减少数学家们在证明过程中的手动劳动。该工具能够提出证明策略，并允许人类研究者无缝地进行干预和修改，有效地支持了复杂数学证明的自动化。此次更新后的Lean Copilot在实验中显示，能够自动完成超过80%的数学证明步骤，效率是之前版本的2.3倍。

8.推理速度是同参数量级模型的3到4倍，基于Mamba的多模态大语言模型Cobra发布

首个基于Mamba的多模态大语言模型Cobra发布，已开源其模型权重和训练代码。Cobra模型在处理视觉和语言信息融合方面表现出显著的效率和效果，特别在提升计算效率上做出了突破，解决了传统基于Transformer网络的MLLM由于二次计算复杂度高而效率低下的问题。

Cobra采用了状态空间模型（SSM）作为核心架构，大幅降低了计算复杂度。此外，Cobra特别优化了模态融合策略，能够更有效地整合视觉与语言信息，从而生成更高质量的多模态表示。这种新的融合方法使得Cobra在视觉错觉和空间关系判断任务中，相比现有模型如LLaVA展现出更好的性能。

在实验中，Cobra模型展示了其高效的性能，即使在参数数量只有对比模型LLaVA 43%的情况下，也能在多个基准测试中达到匹配甚至更优的表现。此外，Cobra的推理速度是同参数量级的其他模型的3到4倍，显示了其在实际应用中的潜力。

9.成功改写人类DNA，全球AI首个基因编辑器开源

创业公司Profluent基于基因编辑技术CRISPR和生成式AI，开发出全球首个完全由AI设计的基因编辑器，并已将其开源。

Profluent利用LLM在基于CRISPR的基因编辑系统数据集上进行训练，产生的蛋白质种类是现有CRISPR-Cas家族的近5倍。这表明AI不仅能理解复杂的生物学数据，还能创造出人类科学家尚未发现的生物工具。

在实际应用方面，这款名为OpenCRISPR-1的基因编辑器在功能和特异性上均显示出优异的表现，甚至在一些情况下超越了现有的SpCas9编辑器。

AI驱动的基因编辑技术代表了科学技术的一大飞跃，预示着未来我们可能通过精确的基因操作来治疗遗传性疾病，甚至进行个性化的医疗干预。但它也带来了一系列伦理和安全的问题，我们也应对此保持谨慎的态度，以防止技术滥用或导致不可预见的后果。

10.Mentee Robotics推出先进双足机器人MenteeBot

创业公司Mentee Robotics推出其首款双足人形机器人MenteeBot。这款机器人身高1.7米，体重约70公斤，能够执行复杂任务，如前往厨房并将水果从一个地方移动到另一个指定位置。

MenteeBot整合了先进的技术，包括大语言模型、三维重建技术神经辐射场（NeRF），以及模拟器到现实（Sim2Real）的机器学习方法，使其能够在真实环境中高效地完成任务。除了家庭使用，MenteeBot也适用于工业场景，如物流仓库，最大负载能力达到约50斤，每次充电可连续运行长达5小时。

网页链接

Mentee Robotics的创始人Amnon Shashua是耶路撒冷希伯来大学的计算机科学教授，同时也是Mobileye的创始人。Shashua的研究背景包括生成式AI和计算机视觉，这些都在MenteeBot的开发中发挥了关键作用。例如，MenteeBot能够通过视觉摄像头感知环境，并利用大型语言模型理解并执行自然语言命令。

人工智能初创公司的新融资

1.人工智能企业财务管理平台Ramp获Founders Fund, Khosla Ventures领投的D2轮1.5亿美元融资，D轮融资合计达4.5亿美元

官方网站：ramp.com

人工智能企业财务管理平台Ramp获Founders Fund, Khosla Ventures领投，8VC, Contrary,D1 Capital Partners,Definition,General Catalyst, Greylock,ICONIQ Capital,Lux Capital,Sands Capital Ventures, Sequoia Capital,Thrive Capital参投的第二轮D轮融资1.5亿美元，D轮融资合计达4.5亿美元，投后估值达76.5亿美元。

Ramp总部位于美国纽约，专注于自动化企业财务运营，提供包括公司卡、费用管理软件、账单支付等产品。Ramp的解决方案通过结合公司卡和费用管理软件，帮助企业在金融运营中节省时间和金钱，同时在客户的财务生态中扮演更深入的角色。

其公司卡特色包括无限卡、智能支出政策和支出可视性，旨在帮助企业通过1.5%的无限现金返还和对特定供应商支出的控制来节省成本和提高利润。

Ramp的费用管理软件通过自动化收集收据和生成费用报告，进一步简化了企业的财务管理。该软件的设计目标是减少手动追踪费用的繁琐工作，提高效率。

通常，当费用管理软件与交易本身分离时，用户会发现自己每个月都有大量需要跟踪的收据。为了防止这种情况发生，Ramp专注于构建更强大的光学字符识别 (OCR)技术，以自动提取最难阅读的收据。它还旨在在事务发生后立即发送触发器，以确保更轻松、更及时的事务日志记录。

Ramp联合创始人Eric Glyman（CEO）拥有哈佛大学经济学和东亚研究学士学位，此前作为联合创始人共同创立了Paribus，这为消费者发现在线零售商的价格变动工具。联合创始人Karim Atiyeh（CTO）拥有巴黎圣母院学院数学学士学位，哈佛大学电气工程学士和计算机科学硕士学位，此前同样作为联合创始人共同创立了Paribus。

2.马斯克的xAI或将在两周内融资60亿美元，预计最新估值将达到180亿美元

根据外媒 Information消息，马斯克的 xAI 或将在两周内融资60亿美元，预计最新估值将达到180亿美元。这次融资由红杉资本等知名投资者参与，潜在投资者还包括Steve Jurvetson和风险投资公司Gigafund等。

xAI的这次融资规模是此前计划的两倍，据马斯克介绍，目前正在使用20000个Nvidia H100 GPU训练Grok的第二代版本。马斯克透露，他们计划未来需要使用10万个GPU来训练更先进的Grok 3.0。

著名的投资公司如Valor Equity Partners和Vy Capital也是支持马斯克历史上创业项目的重要力量，其中Valor是特斯拉和SpaceX的首批投资者之一，Vy Capital则投资了马斯克收购的Twitter；他们的参与，印证了资本市场对马斯克及其领导下公司的信任。显然，除了OpenAI和Anthropic等头部创业公司和MetaAI等科技巨头，目前AI模型的进步速度暂时不会减缓。

3.AI生物制药创业公司Xaira获得10亿美元首轮融资

AI驱动的新型biotech公司Xaira Therapeutics获得10亿美元首轮融资，由ARCH Venture Partners和Foresite Labs共同领投（公司也由它们孵化），参与投资的包括 F-Prime、NEA、美国红杉资本、Lux Capital、Lightspeed Venture Partners、Menlo Ventures、Two Sigma Ventures、癌症免疫治疗帕克研究所（PICI）、Byers Capital、Rsquared和SV Angel等。

药物研发历来是一个充满挑战的领域，常规数据显示只有约10%的药物能通过人体测试并最终获批。Xaira计划通过其创新的AI方法改变这一现状，人工智能技术将逐步改善药物发现的每一个步骤，预计将使研发速度和成功率提高两到三倍。

Xaira的技术基础主要来源于华盛顿大学的蛋白质设计研究所，该所由Xaira的联合创始人David Baker领导。它们搭建了一个由专有AI基础模型支持的蛋白质发现和药物开发平台，具有通用的生物医药研发能力。

Xaira由生物技术界重量级投资人Bob Nelsen和Vik Bajaj共同创立，公司联合创始人David Baker是华盛顿大学教授，主导着华盛顿大学的蛋白质设计研究所。

除了引人注目的执行团队外，Xaira的董事会也名人云集，其中包括前FDA 负责人Scott Gottlieb，诺贝尔奖得主Carolyn Bertozzi以及前强生CEO Alex Gorsky 等。

4.成为GitHub Copilot新竞争者，初创公司Augment获得2.52亿美元投资

官方网站：网页链接

人工智能编码助手初创公司Augment获得由Sutter Hill Ventures、Index Ventures、Innovation Endeavors、Lightspeed Venture Partners和Meritech Capital投资的2.27亿美元B轮融资,估值9.77亿美元。这使Augment的总融资额达到2.52亿美元。

AI辅助编程的趋势正在加速，Gartner预测，到2028年75%的开发者将使用编程助手。

Augment的AI编码工具旨在提供速度快三倍的编码推理能力，并生成高质量的可运行代码，减少编码过程中的错误。这款工具特别适用于处理大型代码库，支持多开发者协作和强大的知识产权保护功能。

公司创始人Igor Ostrovsky表示，AI的应用可以大幅提高软件质量和开发团队的生产力，使编程变得更加有趣。公司计划通过软件即服务的订阅模式进行盈利，预计年底前全球发布其产品。

该公司由前Pure Storage首席架构师和微软软件工程师Igor Ostrovsky以及来自谷歌的人工智能研究员Guy Gur-Ari创立。公司的CEO Scott Dietzen曾是Pure Storage的首席执行官，他带领的公司从零增长至超过10亿美元的年收入。Augment的工程团队汇集了人工智能和系统方面的深厚专业知识,团队成员来自谷歌、Meta、英伟达、微软、Databricks、Snowflake、VMware和Pure Storage。

5.企业定制级人工智能大模型厂商UpStage获7200万美元B2轮融资，B轮融资总计达9100万美元

官方网站：网页链接

总部位于韩国的企业定制级人工智能大模型厂商UpStage获Hana Ventures, Industrial Bank of Korea, Korea Development Bank, KT, Mirae Asset Venture Investment, Shinhan Venture Investment, SK Networks联合领投，Company K Partners, Premier Partners, Primer Sazze Partners参投的7200万美元B2轮融资，B轮融资总计达9100万美元。UpStage从2021年起相继完成4轮融资，总融资额1.259亿美元。

Upstage提供文档处理引擎和大语言模型Solar，可以根据企业客户在医疗保健、金融和法律行业的特定需求进行定制。这两种产品允许客户快速扫描物理和数字文档，然后使用自然对话语言提出有关它们的问题。

Solar基础模型能够适应多云基础设施可以根据企业的需求开发定制，目前它也在Amazon SageMaker平台进行API集成，为科技巨头开发的更大、资源密集型模型提供多功能且易于访问的替代方案。

UpStage还开发了一个面向企业的AI推理平台BentoCloud，它通过完全托管的基础设施提供超快的自动扩展和冷启动，以实现可靠性和可扩展性。BentoML 与各种 ML 框架无缝集成，具有广泛的兼容性，简化了跨各种内部 ML 平台配置环境的过程。

Upstage的联合创始人Sung Kim担任过香港科技大学的副教授，期间获得了4项SIGSOFT杰出论文奖和ICME十年最具影响力论文奖，还曾在NAVER 担任人工智能部门的负责人，负责为超过2000万活跃用户推出AI驱动的产品。

联合创始人兼首席科学官Lucy (Eunjeong) Park拥有首尔大学本硕博计算机相关专业学位，她此前是NAVER的技术Leader，在Upstage负责文本处理和OCR技术的核心开发。

6.利用生成式AI将文档数字化，Ripcord获Google Ventures, Kleiner Perkins等联合投资的3200万美元投资

官方网站：网页链接

近日，利用生成式AI将文档数字化的Ripcord获15th Rock, Google Ventures, Icon Ventures, Kleiner Perkins, Lux Capital, MUFG Innovation Partners联合投资的3200万美元投资，投后估值达2.25亿美元，目前它累计融资1.49亿美元。

Ripcord的技术起源于NASA，它的AI平台利用生成式 AI 打造专有机器人和云软件，将纸质和数字文档中的重要信息数字化并准确获取。

Ripcord专有的机器人技术可自动执行大部分数字化工作，包括劳动密集型任务，例如订书钉移除、展开、文件夹跟踪和数字孪生创建。

一旦数字化并用于数字原生文档，Ripcord的AI驱动平台使公司能够从其文档中提取关键信息，以自动化工作流程、生成见解并即时访问关键数据。

Ripcord的核心团队是担任首席执行官的Sam Fahmy和担任首席产品与技术官的Ahson Ahmad。Sam Fahmy曾在企业自动化领域的领导者 WorkFusion 工作，也曾创过业，对于企业的需求把握和问题解决有丰富经验。Ahson Ahmad 则是计算机专家，曾在OpenText负责过核心云微服务平台，也在Dell 和EMC创建了下一代云内容管理产品：LEAP。

本文由阿尔法公社综合自多个信息源，并在ChatGPT的辅助下写作，封面图片由Hidream.ai的Pixeling（千象）生成。

更多精彩内容

关于阿尔法公社

AI创投周报｜AI药物开发平台Xaira获10亿美元首轮融资，微软端侧模型能力超过GPT-3.5

作者：阿尔法公社